Forensisch onderzoek van fine-tuning-aanvallen
Forensische technieken voor het detecteren van ongeautoriseerde fine-tuning-wijzigingen aan taalmodellen, waaronder degradatie van safety alignment en capaciteitsinjectie.
ai-forensics-irfine-tuningmodel-tamperingalignment