# backdoors

4 artikelengetagd met “backdoors”

Vergiftiging van agentgeheugen

Technieken voor het vergiftigen van korte- en langetermijngeheugensystemen van AI-agents om persistente compromittering te bereiken, gedragsmatige backdoors te injecteren en conversatieresets te overleven.

memory-poisoningagentspersistencebackdoorsvector-dblong-term-memory

Expert

Geheugenvergiftigingstechnieken

Geavanceerde technieken voor het injecteren van persistente instructies in de geheugensystemen van AI-agents, waaronder semantische trojans, zelfversterkende payloads, slapende backdoors en mechanismen voor persistentie over sessies heen.

memory-poisoningpersistencebackdoorssemantic-trojansvector-dblong-term-memory

Expert

Repository-Vergiftiging voor Codemodellen

Technieken voor het vergiftigen van code-repositories om codegeneratiemodellen te beïnvloeden, waaronder vergiftiging van trainingsdata via populaire repositories, injectie van backdoors in open-source dependencies, en supply chain-aanvallen gericht op trainingspijplijnen van codemodellen.

repository-poisoningcode-modelssupply-chaintraining-databackdoorsopen-source

Gevorderd

Manipulatie van trainingsdata

Aanvallen die het modelgedrag corrumperen door trainingsdata, fine-tuning-datasets of RLHF-voorkeursdata te vergiftigen, waaronder het installeren van backdoors en het verwijderen van safety alignment.

training-datadata-poisoningbackdoorsfine-tuningalignment

Gevorderd