# adaptive-attacks
3 artikelengetagd met “adaptive-attacks”
Het probleem dat de aanvaller als tweede zet
Waarom statische LLM-verdedigingen falen tegen adaptieve tegenstanders: analyse van 12 omzeilde verdedigingen en implicaties voor het ontwerp van verdedigingen.
defenseadaptive-attacksred-teamingresearchadversarial-robustness
Jailbreaks van reasoning-modellen
Hoe reasoning-capaciteiten nieuwe jailbreak-oppervlakken creëren: chain-of-thought-exploitatie, scratchpad-aanvallen, en waarom een hogere reasoning-inspanning het aanvalssucces vergroot.
reasoningjailbreakchain-of-thoughto1o3adaptive-attacksresearch
Adaptieve aanvallen tegen veiligheidstraining
Onderzoek naar aanvallen die zich aanpassen aan veiligheidstrainingsprocedures om persistente kwetsbaarheden te ontdekken.
frontier-researchadaptive-attackssafety-trainingresearch