AI-redteaming Intelligence Wiki
De toonaangevende kennisbank voor adversarial machine learning, onderzoek naar prompt injection en het stresstesten van neurale modellen.
Trending onderzoek
Alles bekijkenAanvallen op agentdelegatie
Misbruik maken van delegatiepatronen tussen meerdere agents om laterale verplaatsing, privilege-escalatie en command-and-control te bereiken via impersonatie en onveilige communicatie tussen agents.
Incidentrespons bij AI-toeleveringsketens
Defensiegerichte gids voor het reageren op compromittering van AI-toeleveringsketens, met incidentrespons-playbooks, detectie van modelmanipulatie, rollbackprocedures, communicatiesjablonen en geautomatiseerde integriteitsmonitoring.
Onderwerpen verkennen
36 delen · 1295 secties · 3000+ diepgaande handleidingen.
LLM-interne werking en exploitprimitieven
Transformer-architectuur, misbruik van tokenizers, omzeilen van alignment, embeddingaanvallen.
Prompt injection en jailbreaks
Geavanceerde injectietechnieken, geautomatiseerd jailbreakonderzoek, multimodale aanvalsvectoren.
Agents en agentic misbruik
Aanvallen op AI-agents, misbruik van multi-agent/A2A-protocollen, aanvallen op het MCP-tooloppervlak.
RAG-, data- en trainingsaanvallen
RAG-pipeline poisoning, aanvallen op trainingsdata, modelextractie en diefstal van intellectueel eigendom.
Infrastructuur en supply chain
RCE via modelserialisatie, misbruik van AI-infrastructuur, patronen voor applicatiebeveiliging.
Verkenning en tradecraft
LLM-fingerprinting, extractie van systeemprompts, AI-specifieke dreigingsmodellering.
Exploitontwikkeling en tooling
Aangepaste adversarial tools, red team C2-frameworks, continue geautomatiseerde redteaming.
Capstone: volledige engagement
End-to-end methodologie voor red team-engagements, rapportage en remediatie.
Recent bijgewerkt
OnderzoeksfeedAanvallen op agentdelegatie
GevorderdMisbruik maken van delegatiepatronen tussen meerdere agents om laterale verplaatsing, privilege-escalatie en command-and-control te bereiken via impersonatie en onveilige communicatie tussen agents.
Bijgewerkt op 2026-03-24
Incidentrespons bij AI-toeleveringsketens
GevorderdDefensiegerichte gids voor het reageren op compromittering van AI-toeleveringsketens, met incidentrespons-playbooks, detectie van modelmanipulatie, rollbackprocedures, communicatiesjablonen en geautomatiseerde integriteitsmonitoring.
Bijgewerkt op 2026-03-24
Bewijsverzameling voor AI Red Teams
GemiddeldSystematische methodologieën voor bewijsverzameling bij AI red team-engagements, waaronder artefactbehoud, documentatie van bevindingen en chain-of-custody-procedures.
Bijgewerkt op 2026-03-21
Capstone: Ontwerp en implementeer een AI-safety-benchmarksuite
ExpertBouw een uitgebreide, reproduceerbare benchmarksuite voor het evalueren van LLM-safety over meerdere risicodimensies, waaronder toxiciteit, bias, hallucinatie en adversarial robuustheid.
Bijgewerkt op 2026-03-21
Casestudy: beveiligingskwetsbaarheden in ChatGPT-plug-ins
GevorderdAnalysis of security vulnerabilities discovered in the ChatGPT plugin ecosystem, including OAuth hijacking, cross-plugin data exfiltration, and prompt injection through plugin responses.
Bijgewerkt op 2026-03-21
Woordenlijst
60+ termen uitgelegd
Bladeren op tag
Filter op onderwerp
Blog
Nieuwste onderzoek
RSS-feed
Abonneer je in je reader
Blijf op de hoogte
Ontvang het nieuwste AI-redteaming-onderzoek, technieken en toolreleases rechtstreeks in je inbox.