Wat is Target Profiling?

Technieken om het model, de provider, de versie, de veiligheidsconfiguratie en de capaciteiten van een AI-doelsysteem te identificeren via gedragsanalyse en fingerprinting.

Wat is System Prompt Extraction?

Technieken om verborgen systeemprompts uit AI-applicaties te extraheren, waarmee safety-regels, tooldefinities, gedragsbeperkingen en gevoelige configuratie worden blootgelegd.

Wat is Capability Mapping?

Systematische aanpakken om het volledige capaciteitenoppervlak van een AI-systeem te ontdekken en in kaart te brengen, inclusief tools, integraties, permissies en verborgen features.

Wat is Technieken voor modelidentificatie?

Modellen achter API's fingerprinten met gedragssignaturen, uitvoeranalyse en systematisch proben om de modelfamilie, -grootte en -versie te bepalen.

Wat is AI API-enumeratie?

AI API-endpoints, parameters, modelconfiguraties en ongedocumenteerde functies ontdekken via systematische enumeratietechnieken.

Wat is Social engineering voor AI-systemen?

Het manipuleren van menselijke operators en beheerders van AI-systemen om toegang te krijgen, informatie te onttrekken of beveiligingscontroles te omzeilen via social-engineeringtechnieken.

Wat is OSINT voor AI-redteaming?

Informatie verzamelen over AI-deployments uit publieke bronnen: documentatie, vacatures, onderzoekspapers, social media en technische artefacten.

Wat is Detectie van shadow AI?

Onbevoegde AI-deployments binnen organisaties opsporen: detectiemethoden, veelvoorkomende shadow-AI-patronen en de beoordeling van risico's van onbeheerde AI.

Wat is Mapping van het AI-aanvalsoppervlak?

Systematische methodologie om alle aanvalsvectoren in AI-systemen te identificeren: inputkanalen, datastromen, tool-integraties en trust boundaries.

Wat is Enumeratie van LLM-API's?

Geavanceerde technieken om de mogelijkheden, beperkingen, verborgen parameters en ongedocumenteerde features van LLM-API's te enumereren, zodat je een volledig beeld van het aanvalsoppervlak opbouwt.

AI-redteaming methodologie

Beginner5 min lezenBijgewerkt op 2026-03-12

Een gestructureerde methodologie voor AI-redteamingopdrachten, met verkenning, het profileren van het doelwit, aanvalsplanning en de tradecraft die professionele beoordelingen onderscheidt.

methodology recon tradecraft red-teaming assessment

Effectieve AI-redteaming volgt een gestructureerde methodologie, net als traditionele penetratietesten. Willekeurige prompt injection-pogingen zijn veel minder effectief dan een systematische aanpak die begint met grondige verkenning en geleidelijk toewerkt naar gerichte exploitatie.

De AI-redteaming-levenscyclus

1. Scope & Planning → 2. Reconnaissance → 3. Target Profiling →
4. Attack Planning → 5. Exploitation → 6. Post-Exploitation → 7. Reporting

Fase 1: Scope en planning

Bepaal wat binnen de scope valt, hoe succes eruitziet en welke rules of engagement gelden. AI-specifieke scoping-aandachtspunten zijn:

Welke modellen en applicaties vallen binnen de scope?
Is het testen van fine-tuning-/trainingsdata toegestaan?
Vallen supply chain-aanvallen (modelregistries, dependencies) binnen de scope?
Wat geldt als een "geslaagde" jailbreak of injectie?
Hoe worden stochastische resultaten geëvalueerd?

Fase 2: Verkenning

Verzamel informatie over het doelwit zonder rechtstreeks met het AI-systeem te interacteren. Zie Target Profiling.

Fase 3: Doelanalyse

Interacteer met het systeem om het gedrag ervan te begrijpen:

System Prompt Extraction — Ontdek de instructies en beperkingen van het systeem
Capability Mapping — Breng in kaart wat het systeem kan, inclusief tools en integraties

Fase 4-7: Aanvallen en rapporteren

Plan aanvallen op basis van de verkenning, voer ze uit, documenteer de resultaten en rapporteer de bevindingen. Zie de Capstone-sectie voor de volledige opdrachtmethodologie.

Belangrijke tradecraft-principes

Principe	Beschrijving
Profileer voordat je aanvalt	Investeer tijd in het begrijpen van het doelwit voordat je exploits probeert
Test systematisch	Varieer één parameter tegelijk om te begrijpen wat werkt en waarom
Documenteer alles	AI-gedrag is stochastisch — leg exacte prompts, responses en succespercentages vast
Gebruik open modellen als proxy	Test technieken op open-weight-modellen voordat je productiesystemen aanvalt
Respecteer rate limits	Agressief testen triggert rate limiting en kan verdedigers alarmeren

Diepte van de verkenning

De diepte van de verkenning bepaalt de kwaliteit van je aanvallen:

Diepte van verkenning	Wat je leert	Kwaliteit van de aanval
Geen	"Het is een chatbot"	Willekeurige injectiepogingen
Basis	Modelfamilie, zichtbare features	Generieke aanvallen voor dat modeltype
Gemiddeld	Systeemprompt, tools, veiligheidsregels	Gerichte aanvallen tegen specifieke verdedigingen
Diep	Architectuur, bronnen van trainingsdata, deploymentdetails	Maatwerk-exploits gericht op specifieke zwakheden

Begin met de pagina's in deze sectie om je verkenningsvaardigheden op te bouwen, en pas ze daarna toe in de context van een volledige opdracht met behulp van de Capstone-methodologie.

Gerelateerde onderwerpen

Advanced Recon Techniques -- diepere verkenning en methoden om de systeemprompt te extraheren
Capstone: Full Engagement -- verkenning toepassen in de context van een volledige professionele opdracht
Defense Evasion -- de verdedigingen omzeilen die tijdens de verkenning zijn geïdentificeerd
Agent Exploitation -- het in kaart brengen van mogelijkheden benutten om agent-tools te misbruiken
Target Profiling -- gedetailleerde technieken voor het fingerprinten en profileren van modellen

Referenties

Greshake et al., "Not What You've Signed Up For: Compromising Real-World LLM-Integrated Applications with Indirect Prompt Injection" (2023) -- indirecte injectie op basis van verkenning
Perez & Ribeiro, "Ignore This Title and HackAPrompt: Exposing Systemic Weaknesses of LLMs" (2023) -- systematische aanpak om zwakheden van LLM's te ontdekken
MITRE, "ATLAS: Adversarial Threat Landscape for AI Systems" (2023) -- gestructureerd verkenningsframework voor AI-systemen

Knowledge Check

Waarom is verkenning belangrijk voordat je prompt injection-aanvallen probeert?

AI-redteaming methodologie

Beginner5 min lezenBijgewerkt op 2026-03-12

Een gestructureerde methodologie voor AI-redteamingopdrachten, met verkenning, het profileren van het doelwit, aanvalsplanning en de tradecraft die professionele beoordelingen onderscheidt.

methodology recon tradecraft red-teaming assessment

De AI-redteaming-levenscyclus

1. Scope & Planning → 2. Reconnaissance → 3. Target Profiling →
4. Attack Planning → 5. Exploitation → 6. Post-Exploitation → 7. Reporting

Fase 1: Scope en planning

Bepaal wat binnen de scope valt, hoe succes eruitziet en welke rules of engagement gelden. AI-specifieke scoping-aandachtspunten zijn:

Welke modellen en applicaties vallen binnen de scope?
Is het testen van fine-tuning-/trainingsdata toegestaan?
Vallen supply chain-aanvallen (modelregistries, dependencies) binnen de scope?
Wat geldt als een "geslaagde" jailbreak of injectie?
Hoe worden stochastische resultaten geëvalueerd?

Fase 2: Verkenning

Verzamel informatie over het doelwit zonder rechtstreeks met het AI-systeem te interacteren. Zie Target Profiling.

Fase 3: Doelanalyse

Interacteer met het systeem om het gedrag ervan te begrijpen:

System Prompt Extraction — Ontdek de instructies en beperkingen van het systeem
Capability Mapping — Breng in kaart wat het systeem kan, inclusief tools en integraties

Fase 4-7: Aanvallen en rapporteren

Plan aanvallen op basis van de verkenning, voer ze uit, documenteer de resultaten en rapporteer de bevindingen. Zie de Capstone-sectie voor de volledige opdrachtmethodologie.

Belangrijke tradecraft-principes

Principe	Beschrijving
Profileer voordat je aanvalt	Investeer tijd in het begrijpen van het doelwit voordat je exploits probeert
Test systematisch	Varieer één parameter tegelijk om te begrijpen wat werkt en waarom
Documenteer alles	AI-gedrag is stochastisch — leg exacte prompts, responses en succespercentages vast
Gebruik open modellen als proxy	Test technieken op open-weight-modellen voordat je productiesystemen aanvalt
Respecteer rate limits	Agressief testen triggert rate limiting en kan verdedigers alarmeren

Diepte van de verkenning

De diepte van de verkenning bepaalt de kwaliteit van je aanvallen:

Diepte van verkenning	Wat je leert	Kwaliteit van de aanval
Geen	"Het is een chatbot"	Willekeurige injectiepogingen
Basis	Modelfamilie, zichtbare features	Generieke aanvallen voor dat modeltype
Gemiddeld	Systeemprompt, tools, veiligheidsregels	Gerichte aanvallen tegen specifieke verdedigingen
Diep	Architectuur, bronnen van trainingsdata, deploymentdetails	Maatwerk-exploits gericht op specifieke zwakheden

Begin met de pagina's in deze sectie om je verkenningsvaardigheden op te bouwen, en pas ze daarna toe in de context van een volledige opdracht met behulp van de Capstone-methodologie.

Gerelateerde onderwerpen

Advanced Recon Techniques -- diepere verkenning en methoden om de systeemprompt te extraheren
Capstone: Full Engagement -- verkenning toepassen in de context van een volledige professionele opdracht
Defense Evasion -- de verdedigingen omzeilen die tijdens de verkenning zijn geïdentificeerd
Agent Exploitation -- het in kaart brengen van mogelijkheden benutten om agent-tools te misbruiken
Target Profiling -- gedetailleerde technieken voor het fingerprinten en profileren van modellen

Referenties

Greshake et al., "Not What You've Signed Up For: Compromising Real-World LLM-Integrated Applications with Indirect Prompt Injection" (2023) -- indirecte injectie op basis van verkenning
Perez & Ribeiro, "Ignore This Title and HackAPrompt: Exposing Systemic Weaknesses of LLMs" (2023) -- systematische aanpak om zwakheden van LLM's te ontdekken
MITRE, "ATLAS: Adversarial Threat Landscape for AI Systems" (2023) -- gestructureerd verkenningsframework voor AI-systemen

Knowledge Check

Waarom is verkenning belangrijk voordat je prompt injection-aanvallen probeert?

AI-redteaming methodologie

De AI-redteaming-levenscyclus

Fase 1: Scope en planning

Fase 2: Verkenning

Fase 3: Doelanalyse

Fase 4-7: Aanvallen en rapporteren

Belangrijke tradecraft-principes

Diepte van de verkenning

Gerelateerde onderwerpen

Referenties

Leerpad

AI-redteaming methodologie

De AI-redteaming-levenscyclus

Fase 1: Scope en planning

Fase 2: Verkenning

Fase 3: Doelanalyse

Fase 4-7: Aanvallen en rapporteren

Belangrijke tradecraft-principes

Diepte van de verkenning

Gerelateerde onderwerpen

Referenties

Leerpad

AI-redteaming methodologie

Leerpad

Gerelateerde artikelen

AI-redteaming methodologie

Leerpad

Gerelateerde artikelen