# model-hardening

1 artikelgetagd met “model-hardening”

Gids voor adversarial training voor robuustheid

Uitgebreide gids voor adversarial training-technieken die de robuustheid van modellen tegen aanvallen verbeteren, waaronder strategieën voor data-augmentatie, adversariële fine-tuning, op RLHF gebaseerde hardening, en het evalueren van de afwegingen tussen robuustheid en modelcapaciteit.

adversarial-trainingrobustnessfine-tuningrlhfmodel-hardening

Gevorderd