# o3

1 artikelgetagd met “o3”

Jailbreaks van reasoning-modellen

Hoe reasoning-capaciteiten nieuwe jailbreak-oppervlakken creëren: chain-of-thought-exploitatie, scratchpad-aanvallen, en waarom een hogere reasoning-inspanning het aanvalssucces vergroot.

reasoningjailbreakchain-of-thoughto1o3adaptive-attacksresearch

Gevorderd