# persona

10 artikelengetagd met “persona”

Jailbreaken via Persona Engineering

Onderzoek naar het gebruik van geavanceerde persona engineering om veiligheidstraining in frontier-modellen te omzeilen.

viajailbreakresearchpersonaengineeringfrontier

Gevorderd

Lab: contextmanipulatie

Manipulate the conversational context to change model behavior, using techniques like context flooding, false history injection, and persona shifting.

labcontext-manipulationprompt-injectionpersonabeginnerhands-on

Beginner

Lab: rollenspel-aanvallen

Use persona-based approaches to bypass AI safety measures by assigning alternate identities, characters, and scenarios that override the model's trained refusal behaviors.

labrole-playpersonajailbreakbeginnerhands-on

Beginner

Lab: rollenspel- en persona-aanvallen

Hands-on lab exploring role-play and persona-based jailbreak techniques, where you craft scenarios that trick LLMs into adopting alternative identities to bypass safety guardrails.

labrole-playpersona

Beginner

Mapping van chatbot-persona en -capaciteiten

Map the configured persona, capabilities, and restrictions of an LLM chatbot through systematic probing.

labspersonacapability-mappingbeginner

Beginner

Persona-gebaseerde injectie-aanvallen

Geavanceerde persona- en rollenspel-gebaseerde aanvallen die het instructievolgende gedrag misbruiken.

prompt-injectionpersonarole-playattacks

Gemiddeld

Een persona vestigen

Het creëren van persistente alternatieve identiteiten die meerdere gespreksbeurten overleven, inclusief character locking, het verankeren van identiteiten en het stapsgewijs opbouwen van een persona.

personapersistencecharacter-lockingidentityred-teaming

Gevorderd

Role-play-aanvallen

Het opzetten van alternatieve persona's of fictieve scenario's die modellen hun safety-training laten omzeilen, inclusief DAN-varianten, het kapen van personages en narratieve framing.

role-playpersonajailbreakDANred-teaming

Gemiddeld

Walkthrough van multi-turn persona-escalatie

Gradually escalate through persona manipulation across multiple turns to achieve full safety bypass.

walkthroughsmulti-turnpersonaescalation

Gemiddeld

Het creëren van een virtuele persona

Creating persistent alternate personas within LLM conversations to bypass safety training, establishing character identities that override the model's default behavioral constraints.

prompt-injectionpersonajailbreakDANcharacter-creationred-teamingintermediate

Gemiddeld