# backdoors
4 artikelengetagd met “backdoors”
Vergiftiging van agentgeheugen
Technieken voor het vergiftigen van korte- en langetermijngeheugensystemen van AI-agents om persistente compromittering te bereiken, gedragsmatige backdoors te injecteren en conversatieresets te overleven.
Geheugenvergiftigingstechnieken
Geavanceerde technieken voor het injecteren van persistente instructies in de geheugensystemen van AI-agents, waaronder semantische trojans, zelfversterkende payloads, slapende backdoors en mechanismen voor persistentie over sessies heen.
Repository-Vergiftiging voor Codemodellen
Technieken voor het vergiftigen van code-repositories om codegeneratiemodellen te beïnvloeden, waaronder vergiftiging van trainingsdata via populaire repositories, injectie van backdoors in open-source dependencies, en supply chain-aanvallen gericht op trainingspijplijnen van codemodellen.
Manipulatie van trainingsdata
Aanvallen die het modelgedrag corrumperen door trainingsdata, fine-tuning-datasets of RLHF-voorkeursdata te vergiftigen, waaronder het installeren van backdoors en het verwijderen van safety alignment.