# persona
10 artikelengetagd met “persona”
Jailbreaken via Persona Engineering
Onderzoek naar het gebruik van geavanceerde persona engineering om veiligheidstraining in frontier-modellen te omzeilen.
Lab: contextmanipulatie
Manipulate the conversational context to change model behavior, using techniques like context flooding, false history injection, and persona shifting.
Lab: rollenspel-aanvallen
Use persona-based approaches to bypass AI safety measures by assigning alternate identities, characters, and scenarios that override the model's trained refusal behaviors.
Lab: rollenspel- en persona-aanvallen
Hands-on lab exploring role-play and persona-based jailbreak techniques, where you craft scenarios that trick LLMs into adopting alternative identities to bypass safety guardrails.
Mapping van chatbot-persona en -capaciteiten
Map the configured persona, capabilities, and restrictions of an LLM chatbot through systematic probing.
Persona-gebaseerde injectie-aanvallen
Geavanceerde persona- en rollenspel-gebaseerde aanvallen die het instructievolgende gedrag misbruiken.
Een persona vestigen
Het creëren van persistente alternatieve identiteiten die meerdere gespreksbeurten overleven, inclusief character locking, het verankeren van identiteiten en het stapsgewijs opbouwen van een persona.
Role-play-aanvallen
Het opzetten van alternatieve persona's of fictieve scenario's die modellen hun safety-training laten omzeilen, inclusief DAN-varianten, het kapen van personages en narratieve framing.
Walkthrough van multi-turn persona-escalatie
Gradually escalate through persona manipulation across multiple turns to achieve full safety bypass.
Het creëren van een virtuele persona
Creating persistent alternate personas within LLM conversations to bypass safety training, establishing character identities that override the model's default behavioral constraints.