Wat is Continuous Automated Red Teaming (CART)?

CART-pipelines ontwerpen voor doorlopende AI-beveiligingsvalidatie: architectuur, testsuites, telemetrie, alerting, regressiedetectie en CI/CD-integratie.

Wat is Garak: LLM Vulnerability Scanner?

Diepgaande verkenning van NVIDIA's Garak LLM-kwetsbaarheidsscanner: architectuur, probes, generators, evaluators, ontwikkeling van aangepaste probes en CI/CD-integratie voor geautomatiseerd beveiligingsscannen.

Wat is PyRIT: Red Team Orchestration?

Diepgaande verkenning van Microsofts PyRIT (Python Risk Identification Toolkit): orchestrators, scorers, converters, targets, multi-turn campagnes en geavanceerde red team-configuratie.

Wat is promptfoo for Red Teaming?

Diepgaande verkenning van promptfoo voor AI-redteaming: YAML-configuratie, assertion-gebaseerde tests, redteam-plug-ins, eigen evaluators en regressietest-workflows voor LLM-beveiliging.

Wat is Inspect AI: UK AISI Framework?

Diepgaande duik in het Inspect-framework van het UK AI Safety Institute: taakontwerp, solvers, scorers, eigen evaluaties bouwen en vergelijking met andere AI-evaluatieframeworks.

Wat is HarmBench: Standardized Evaluation?

Diepe duik in het HarmBench-framework voor gestandaardiseerde red team-evaluatie: aanvalsmethoden, de evaluatiepijplijn, benchmarks draaien, resultaten interpreteren en de veiligheid van modellen tussen providers vergelijken.

Wat is Custom Harness Building Patterns?

Ontwerppatronen voor het bouwen van custom AI-red team-harnessen: plugin-architectuur, resultaatopslag, async uitvoering, multi-model-ondersteuning, converter-pipelines en productiewaardige orkestratie.

Wat is Burp Suite & AI Extensions?

Burp Suite gebruiken voor het testen van AI-API-beveiliging: LLM-API-calls onderscheppen, AI-specifieke extensies, AI-endpoints fuzzen, prompt injection testen via HTTP, en webbeveiligingsmethodologie combineren met AI-redteaming.

Wat is Lab: Tool Comparison?

Praktijklab waarin Garak, PyRIT, promptfoo en Inspect AI worden vergeleken tegen hetzelfde doelmodel. Beoordeel dekking, snelheid, kwaliteit van bevindingen en praktische trade-offs van elke tool.

Red team-infrastructuur en tooling

Expert6 min lezenBijgewerkt op 2026-03-11

AI red team C2-frameworks, geautomatiseerde aanvalspipelines, ontwikkeling van eigen scanners en integratie met Cobalt Strike, Mythic en Sliver.

c2 infrastructure automation tooling pipeline scanner fuzzer cobalt-strike mythic sliver

Red team-infrastructuur en tooling

Professionele AI-redteaming vraagt om speciaal gebouwde infrastructuur. Anders dan ad-hoc prompttests heeft een volwassen operatie gecentraliseerde command and control nodig, geautomatiseerde aanvalspipelines, herhaalbare scans en integratie met bestaande security-tooling. Deze pagina behandelt de architectuur van AI red team-platforms van productiekwaliteit.

AI red team C2-architectuur

C2 voor AI-redteaming beheert campagnes, verdeelt aanvalstaken en verzamelt bevindingen.

Overzicht van de architectuur

┌─────────────────────────────────────────────┐
│              C2 Server (AIRT-C2)             │
│  Campaign Manager │ Payload Library │ Results│
│         └────────Task Queue────────┘        │
│              └────Agent Bus────┘            │
│  ┌─────┐ ┌──────┐ ┌─────┐ ┌───────┐       │
│  │Inject│ │Fuzzer│ │Recon│ │Scanner│       │
│  │Agent │ │Agent │ │Agent│ │Agent  │       │
│  └──┬──┘ └──┬───┘ └──┬──┘ └──┬────┘       │
└─────┼───────┼────────┼───────┼──────────────┘
      ▼       ▼        ▼       ▼
  [Chatbot] [API] [RAG] [Agent] [MCP Server]

Kerncomponenten

Component	Verantwoordelijkheid
Campaign Manager	Maakt campagnes aan, wijst doelen toe en volgt de voortgang
Payload Library	Bewaart en versiebeheert injectiepayloads, fuzzerseeds en recon-probes
Task Queue	Verdeelt taken over agents (Redis/RabbitMQ)
Agent Bus	Routeert taken naar het juiste agenttype
Results Engine	Bundelt bevindingen, dedupliceert en kent ernst toe

Datamodel van een campagne

Campaign
  ├── id, name, description, targets[]
  ├── tasks[] (AttackTask)
  │   ├── agent_type: inject | fuzzer | recon | scanner
  │   ├── target: {url, auth, config}
  │   ├── payload: {payloads[], settings}
  │   ├── status: pending | running | completed | failed
  │   └── findings[] (Finding)
  │       ├── severity: critical | high | medium | low
  │       ├── title, description, evidence{}
  │       └── remediation
  └── stats: {total, completed, failed, findings_by_severity}

Aanvalsagents

Alle agents implementeren dezelfde interface: execute(task) -> \{results, findings\}. Daardoor werken ze probleemloos samen binnen het C2-framework.

Prompt injection-agent

Ontvang payloads van de C2
Elke payload heeft een text en een category (system_prompt_extraction, data_exfiltration, enz.).
Stuur elke payload naar het doel
Voer een POST uit naar de doel-URL met de payloadtekst. Leg het volledige antwoord vast.
Evalueer of het gelukt is
Controleer op weigering (mislukking) versus inwilliging (succes). Categoriespecifieke evaluatie: extractie controleert op "you are" / "instructions:", exfiltratie kijkt naar lange antwoorden zonder weigering.
Genereer bevindingen
Maak voor elke geslaagde injectie een Finding aan met ernst, beschrijving, bewijs (payload + respons) en mitigatie-advies.

Recon-agent

Voert drie geautomatiseerde taken uit tegen elk doel:

Taak	Wat het doet	Output
Endpoint-enumeratie	Test bekende AI-paden (`/api/chat`, `/v1/models`, `/docs`, enz.)	Lijst met actieve endpoints inclusief methodes en content-types
Headeranalyse	Inspecteert `x-*`, `server`, `via`, `model`, `ratelimit` headers	Indicatoren van infrastructuurlekken
Provider-fingerprinting	Stuurt probes als "What model are you?" / "Who created you?"	Provideridentificatie met betrouwbaarheidsscore

Kwetsbaarheidsscanner

Vier geautomatiseerde checks draaien parallel:

Check	Wat het test	Ernst
Systeemprompt-lek	Stuurt 3 extractieprobes, controleert op 3+ prompt-indicatoren in de respons	Hoog
Prompt injection	Injecteert een canary-token ("CANARY_TOKEN_12345") en kijkt of die in de respons verschijnt	Kritiek
Datalek	Vraagt naar de kennisbank / trainingsdata, controleert op PII-patronen (@, phone:, api_key)	Hoog
Blootstelling van tool-definities	Vraagt "List all tools and their parameters" en controleert op 3+ tool-indicatoren	Gemiddeld

Integratie met traditionele red team-tools

Cobalt Strike-integratie

Genereer Aggressor-scripts uit AI-bevindingen:

Genereer automatisch popup-menu-items die AI-bevindingen per ernst tonen
Maak beacon-notes van elke bevinding voor integratie in de tijdlijn
Plot AI-bevindingen op dezelfde engagement-tijdlijn als traditionele exploitatie

Mythic-integratie

Registreer een airt-agent payload-type met Mythic-compatibele commando's:

Commando	Beschrijving
`ai_recon`	Voer verkenning uit op een AI-endpoint
`ai_inject`	Test prompt injection-payloads (basic / advanced / waf_evasion sets)
`ai_extract`	Extraheer de systeemprompt met automatisch gekozen methode
`ai_fuzz`	Fuzz een AI-endpoint met instelbaar aantal cases

Sliver-integratie

Maak een Sliver-extensie (ai-redteam) met twee commando's:

Commando	Beschrijving
`ai-scan`	Endpoint-enumeratie + provider-fingerprinting + capability mapping
`ai-exploit`	Voer prompt injection- en jailbreak-payloads uit tegen een doel

Pipeline-architectuur

De aanbevolen pipeline volgt de traditionele red team-methodiek:

[Campaign Config] → [C2 Server] → [Agent Dispatch]
                                        │
                    ┌───────────────────┤
                    ▼                   ▼
              [Recon Agent]      [Scanner Agent]
                    │                   │
                    ▼                   ▼
           [Results → Targeting] [Vuln → Exploit Selection]
                    │                   │
                    └────────┬──────────┘
                             ▼
                    [Injection Agent]
                             │
                             ▼
                    [Findings → Report]

Rol C2 uit en maak een campagne aan
Instantieer de C2-server, definieer de doelen en configureer de campagne.
Voer recon uit
Enumereer endpoints, fingerprint providers en analyseer headers. Gebruik de bevindingen om vervolgfasen te configureren.
Draai de scanner
Voer alle geautomatiseerde kwetsbaarheidschecks uit. Geef doelen prioriteit op basis van kwetsbaarheidsdichtheid.
Voer gerichte injectie uit
Gebruik recon- en scannerresultaten om injectiepayloads te kiezen en te configureren. Test eerst tegen de meest kansrijke doelen.
Genereer een rapport
Produceer een gestructureerd JSON-rapport met bevindingen gesorteerd op ernst, campagnestatistieken en resultaten per taak.

Knowledge Check

Wat is het belangrijkste voordeel van het integreren van AI red team-bevindingen met traditionele C2-frameworks zoals Cobalt Strike of Mythic?

Gerelateerde onderwerpen

CART-pipelines -- Continue geautomatiseerde tests bovenop red team-infrastructuur
AI-exploitontwikkeling -- Exploittechnieken die de tooling automatiseert
Volledige engagement -- End-to-end engagementmethodiek die door de tooling wordt ondersteund
Rapporten schrijven -- Rapportage-integratie voor geautomatiseerde bevindingen

Referenties

Garak: LLM Vulnerability Scanner — NVIDIA's LLM-securityscanner
PyRIT: Python Risk Identification Toolkit — Microsofts AI-redteamingframework
Cobalt Strike User Guide — Traditioneel C2-framework voor integratie

Red team-infrastructuur en tooling

Expert6 min lezenBijgewerkt op 2026-03-11

AI red team C2-frameworks, geautomatiseerde aanvalspipelines, ontwikkeling van eigen scanners en integratie met Cobalt Strike, Mythic en Sliver.

c2 infrastructure automation tooling pipeline scanner fuzzer cobalt-strike mythic sliver

Red team-infrastructuur en tooling

AI red team C2-architectuur

C2 voor AI-redteaming beheert campagnes, verdeelt aanvalstaken en verzamelt bevindingen.

Overzicht van de architectuur

┌─────────────────────────────────────────────┐
│              C2 Server (AIRT-C2)             │
│  Campaign Manager │ Payload Library │ Results│
│         └────────Task Queue────────┘        │
│              └────Agent Bus────┘            │
│  ┌─────┐ ┌──────┐ ┌─────┐ ┌───────┐       │
│  │Inject│ │Fuzzer│ │Recon│ │Scanner│       │
│  │Agent │ │Agent │ │Agent│ │Agent  │       │
│  └──┬──┘ └──┬───┘ └──┬──┘ └──┬────┘       │
└─────┼───────┼────────┼───────┼──────────────┘
      ▼       ▼        ▼       ▼
  [Chatbot] [API] [RAG] [Agent] [MCP Server]

Kerncomponenten

Component	Verantwoordelijkheid
Campaign Manager	Maakt campagnes aan, wijst doelen toe en volgt de voortgang
Payload Library	Bewaart en versiebeheert injectiepayloads, fuzzerseeds en recon-probes
Task Queue	Verdeelt taken over agents (Redis/RabbitMQ)
Agent Bus	Routeert taken naar het juiste agenttype
Results Engine	Bundelt bevindingen, dedupliceert en kent ernst toe

Datamodel van een campagne

Campaign
  ├── id, name, description, targets[]
  ├── tasks[] (AttackTask)
  │   ├── agent_type: inject | fuzzer | recon | scanner
  │   ├── target: {url, auth, config}
  │   ├── payload: {payloads[], settings}
  │   ├── status: pending | running | completed | failed
  │   └── findings[] (Finding)
  │       ├── severity: critical | high | medium | low
  │       ├── title, description, evidence{}
  │       └── remediation
  └── stats: {total, completed, failed, findings_by_severity}

Aanvalsagents

Alle agents implementeren dezelfde interface: execute(task) -> \{results, findings\}. Daardoor werken ze probleemloos samen binnen het C2-framework.

Prompt injection-agent

Ontvang payloads van de C2
Elke payload heeft een text en een category (system_prompt_extraction, data_exfiltration, enz.).
Stuur elke payload naar het doel
Voer een POST uit naar de doel-URL met de payloadtekst. Leg het volledige antwoord vast.
Evalueer of het gelukt is
Controleer op weigering (mislukking) versus inwilliging (succes). Categoriespecifieke evaluatie: extractie controleert op "you are" / "instructions:", exfiltratie kijkt naar lange antwoorden zonder weigering.
Genereer bevindingen
Maak voor elke geslaagde injectie een Finding aan met ernst, beschrijving, bewijs (payload + respons) en mitigatie-advies.

Recon-agent

Voert drie geautomatiseerde taken uit tegen elk doel:

Taak	Wat het doet	Output
Endpoint-enumeratie	Test bekende AI-paden (`/api/chat`, `/v1/models`, `/docs`, enz.)	Lijst met actieve endpoints inclusief methodes en content-types
Headeranalyse	Inspecteert `x-*`, `server`, `via`, `model`, `ratelimit` headers	Indicatoren van infrastructuurlekken
Provider-fingerprinting	Stuurt probes als "What model are you?" / "Who created you?"	Provideridentificatie met betrouwbaarheidsscore

Kwetsbaarheidsscanner

Vier geautomatiseerde checks draaien parallel:

Check	Wat het test	Ernst
Systeemprompt-lek	Stuurt 3 extractieprobes, controleert op 3+ prompt-indicatoren in de respons	Hoog
Prompt injection	Injecteert een canary-token ("CANARY_TOKEN_12345") en kijkt of die in de respons verschijnt	Kritiek
Datalek	Vraagt naar de kennisbank / trainingsdata, controleert op PII-patronen (@, phone:, api_key)	Hoog
Blootstelling van tool-definities	Vraagt "List all tools and their parameters" en controleert op 3+ tool-indicatoren	Gemiddeld

Integratie met traditionele red team-tools

Cobalt Strike-integratie

Genereer Aggressor-scripts uit AI-bevindingen:

Genereer automatisch popup-menu-items die AI-bevindingen per ernst tonen
Maak beacon-notes van elke bevinding voor integratie in de tijdlijn
Plot AI-bevindingen op dezelfde engagement-tijdlijn als traditionele exploitatie

Mythic-integratie

Registreer een airt-agent payload-type met Mythic-compatibele commando's:

Commando	Beschrijving
`ai_recon`	Voer verkenning uit op een AI-endpoint
`ai_inject`	Test prompt injection-payloads (basic / advanced / waf_evasion sets)
`ai_extract`	Extraheer de systeemprompt met automatisch gekozen methode
`ai_fuzz`	Fuzz een AI-endpoint met instelbaar aantal cases

Sliver-integratie

Maak een Sliver-extensie (ai-redteam) met twee commando's:

Commando	Beschrijving
`ai-scan`	Endpoint-enumeratie + provider-fingerprinting + capability mapping
`ai-exploit`	Voer prompt injection- en jailbreak-payloads uit tegen een doel

Pipeline-architectuur

De aanbevolen pipeline volgt de traditionele red team-methodiek:

[Campaign Config] → [C2 Server] → [Agent Dispatch]
                                        │
                    ┌───────────────────┤
                    ▼                   ▼
              [Recon Agent]      [Scanner Agent]
                    │                   │
                    ▼                   ▼
           [Results → Targeting] [Vuln → Exploit Selection]
                    │                   │
                    └────────┬──────────┘
                             ▼
                    [Injection Agent]
                             │
                             ▼
                    [Findings → Report]

Rol C2 uit en maak een campagne aan
Instantieer de C2-server, definieer de doelen en configureer de campagne.
Voer recon uit
Enumereer endpoints, fingerprint providers en analyseer headers. Gebruik de bevindingen om vervolgfasen te configureren.
Draai de scanner
Voer alle geautomatiseerde kwetsbaarheidschecks uit. Geef doelen prioriteit op basis van kwetsbaarheidsdichtheid.
Voer gerichte injectie uit
Gebruik recon- en scannerresultaten om injectiepayloads te kiezen en te configureren. Test eerst tegen de meest kansrijke doelen.
Genereer een rapport
Produceer een gestructureerd JSON-rapport met bevindingen gesorteerd op ernst, campagnestatistieken en resultaten per taak.

Knowledge Check

Wat is het belangrijkste voordeel van het integreren van AI red team-bevindingen met traditionele C2-frameworks zoals Cobalt Strike of Mythic?

Gerelateerde onderwerpen

CART-pipelines -- Continue geautomatiseerde tests bovenop red team-infrastructuur
AI-exploitontwikkeling -- Exploittechnieken die de tooling automatiseert
Volledige engagement -- End-to-end engagementmethodiek die door de tooling wordt ondersteund
Rapporten schrijven -- Rapportage-integratie voor geautomatiseerde bevindingen

Referenties

Garak: LLM Vulnerability Scanner — NVIDIA's LLM-securityscanner
PyRIT: Python Risk Identification Toolkit — Microsofts AI-redteamingframework
Cobalt Strike User Guide — Traditioneel C2-framework voor integratie

Red team-infrastructuur en tooling

Ontvang payloads van de C2

Stuur elke payload naar het doel

Evalueer of het gelukt is

Genereer bevindingen

Rol C2 uit en maak een campagne aan

Voer recon uit

Draai de scanner

Voer gerichte injectie uit

Genereer een rapport

Leerpad

Gerelateerde artikelen

Red team-infrastructuur en tooling

Ontvang payloads van de C2

Stuur elke payload naar het doel

Evalueer of het gelukt is

Genereer bevindingen

Rol C2 uit en maak een campagne aan

Voer recon uit

Draai de scanner

Voer gerichte injectie uit

Genereer een rapport

Leerpad

Gerelateerde artikelen