# exploitation
94 artikelengetagd met “exploitation”
Misbruik van tool-gebruik door agents
Hoe je AI-agents manipuleert om tools aan te roepen met parameters die de aanvaller bepaalt, en zo toolcapabilities misbruikt voor data-exfiltratie, privilege escalation en ongeautoriseerde acties.
Misbruik van toolgebruik
Uitgebreide technieken om misbruik te maken van de manier waarop AI-agents externe tools en API's aanroepen, waaronder het vergiftigen van toolbeschrijvingen, misbruik van te ruime toegang en het manipuleren van tooloutput.
Exploitatie van AI-agents
Methodologie voor het exploiteren van AI-agentarchitecturen via confused-deputy-aanvallen, doelkaping, privilege-escalatie en sandbox-ontsnapping.
CrewAI multi-agent-exploitatie
Exploiteren van CrewAI's multi-agent-orkestratie voor taakinjectie en cross-agent-aanvallen.
Haystack-pipeline-exploitatie
Het exploiteren van Haystacks pipeline-architectuur voor componentinjectie en manipulatie van de datastroom.
Phidata Agent Attacks
Beveiligingsanalyse van het Phidata agent-framework, inclusief vergiftiging van kennisbanken en toolmisbruik.
Semantic Kernel Plugin Exploitation
Het exploiteren van de plugins en planners van Microsofts Semantic Kernel voor ongeautoriseerde code-uitvoering.
Browser Agent Framework Exploitation
Het exploiteren van browser-use- en web-agentframeworks via DOM-injectie en navigatiemanipulatie.
Aanvallen op het contextvenster
Technieken voor het exploiteren van de limieten van het LLM-contextvenster, inclusief strategische contextoverflow om systeeminstructies eruit te duwen, attention-manipulatie en aanvallen die het contextbudget uitputten.
Vector-gebaseerde geheugenvergiftiging
Het vergiftigen van vector-gebaseerde geheugenopslagplaatsen in agent-systemen om valse context in het ophalen te injecteren.
Geheugenuitzetting-exploitatie
Exploiteer geheugenuitzettingsbeleid in agents met contextlimieten om selectief veiligheidsrelevante context te verwijderen.
Foutexploitatie bij functieaanroepen
Het benutten van foutafhandelingspaden in implementaties van functieaanroepen om informatie te lekken of controles te omzeilen.
Function-type-confusion-aanvallen
Het misbruiken van zwakheden in het typesysteem van function-calling-interfaces om onverwacht gedrag te veroorzaken via type confusion.
Function-Calling-exploitatie
Overzicht van hoe function/tool calling van LLM's werkt, het aanvalsoppervlak dat het creëert, en systematische benaderingen voor het misbruiken van function-calling-interfaces in AI-systemen.
Parallelle-Function-Call-exploitatie
Het misbruiken van parallelle function calling om race conditions te creëren en sequentiële validatie te omzeilen.
Parametermanipulatie
Technieken voor het opstellen van kwaadaardige parameterwaarden in LLM-function-calls, waaronder type confusion, grensoverschrijdingen, injectie via parameters en het uitbuiten van zwakke validatie.
Function-resultaatvergiftiging (Agentic Exploitation)
Technieken voor het manipuleren van functie-retourwaarden om LLM-gedrag te beïnvloeden, instructies te injecteren via tool-resultaten en vergiftigde resultaten te ketenen tot meerstaps-exploitatie.
JSON-Schema-injectie
Technieken voor het manipuleren van functiedefinities en JSON-schema's om LLM-gedrag te wijzigen, aanvullende parameters te injecteren en lacunes in schemavalidatie in tool-calling-systemen uit te buiten.
Structured-Output-Tool-injectie
Het misbruiken van de structured-output-modus om tool-call-directieven in modelreacties te injecteren.
Tool-disambiguatie-aanvallen
Het misbruiken van ambiguïteit in toolselectie om functieaanroepen om te leiden naar onbedoelde tools.
Exploitatie van functiehallucinatie
Buit de neiging van het model uit om function-calls naar niet-bestaande API's te hallucineren voor informatieonthulling.
MCP-configuratie-injectie
Het injecteren van kwaadaardige configuratie in de initialisatie van MCP-servers voor persistente compromittering.
Aanvallen op dynamische toolregistratie in MCP
Het aanvallen van dynamische toolregistratie in MCP om kwaadaardige tools tijdens runtime te injecteren.
MCP root-listing-exploitatie
MCP root-listing-mogelijkheden exploiteren om gevoelige bestandssysteemresources te ontdekken en te benaderen.
Exploitatie van de MCP sampling-API
De MCP sampling-API exploiteren om te manipuleren hoe servers LLM-completions aanvragen.
Beveiligingsanalyse van MCP SSE-transport
Beveiligingsanalyse van Server-Sent Events-transport in MCP, inclusief herverbindingsaanvallen en event-injectie.
MCP stdio-transport-exploitatie
Het exploiteren van het stdio-transportmechanisme in MCP voor aanvallen op interprocescommunicatie en het onderscheppen van data.
MCP-batch-tool-aanroep-exploitatie
Exploiteer batch-tool-aanroepen in MCP om race conditions te creëren en validatie per aanroep te omzeilen.
A2A-artefactmanipulatie
Artefacten die tussen agents worden uitgewisseld in het A2A-protocol manipuleren voor datavergiftiging en injectie.
A2A-exploitatie van agentontdekking
Het A2A-agentontdekkingsmechanisme misbruiken om kwaadaardige agents te registreren of vertrouwde agents na te bootsen.
A2A Push Notification-misbruik
Het misbruiken van A2A-pushnotificatiemechanismen voor out-of-band data-exfiltratie en command injection.
A2A Task State-manipulatie
Het manipuleren van taakstatussen in A2A om validatie over te slaan, goedkeuring te omzeilen of taakvoltooiing om te leiden.
Exploitatie van reflectieloops
Het exploiteren van zelfreflectie- en zelfcorrectieloops in agentworkflows.
Supervisor Agent Override
Technieken om supervisor-agents te overschrijven in hiërarchische multi-agent-architecturen.
Tool Chain Amplification Attacks
Aanvalsimpact versterken door tool-aanroepen aan elkaar te ketenen in agent-workflows voor cascaderende exploitatie.
Fallback Handler Exploitation
Buit fallback- en error-handlers in agent-workflows uit die zwakkere beveiligingscontroles hebben dan de primaire paden.
Retry Loop Exploitation
Buit retry- en error-handling-loops in agent-workflows uit om aanvalspayloads te versterken en resources uit te putten.
Workflow Checkpoint Manipulation
Workflow-checkpoints en savepoints manipuleren voor state-rollback-aanvallen.
Assessment van agentic misbruik
Assessment covering MCP exploitation, function calling abuse, agent memory attacks, and A2A injection.
Vaardigheidsverificatie: misbruik van MCP
Hands-on skill verification for MCP transport attacks, tool description injection, and server impersonation.
Casestudy: misbruik van bias in een AI-wervingssysteem
Analysis of adversarial attacks on AI hiring systems and resume screening exploitation.
Technieken voor misbruik van codeerassistenten
Techniques for exploiting AI code assistants to generate insecure code or leak repository information.
Misbruik van testgeneratie
Manipulating AI test generation to produce tests that pass but miss critical vulnerabilities.
Maart 2026: uitdaging voor misbruik van agents
Compromise a multi-tool agent system through prompt injection and tool abuse, completing multiple objectives with escalating difficulty and point values.
Misbruik van memorisatie van trainingsdata
Techniques for exploiting model memorization to extract verbatim training examples.
Misbruik van hybride zoekopdrachten
Hybride dense-sparse zoeksystemen misbruiken via gecoördineerde embeddingmanipulatie.
Technieken voor misbruik van rerankers
Aanvallen op cross-encoder rerankers die in retrieval-pipelines met meerdere fasen worden gebruikt om adversariële documenten voorbij de initiële retrieval-filtering te promoten.
Misbruik van de fine-tuning-API
Exploiting commercial fine-tuning APIs (OpenAI, Anthropic) for safety bypass and model manipulation.
Exploitatie van Copilot/Cursor IDE
Het uitbuiten van IDE-geïntegreerde AI-codeassistenten: vergiftiging van repository-context, kwaadaardige comments die suggesties sturen, data-exfiltratie via code-completions, en prompt-injectie via bestandsinhoud.
Model collapse bij recursieve training
Beveiligingsimplicaties van model collapse wanneer modellen worden getraind op door AI gegenereerde data van eerdere generaties.
Chain-of-Thought-exploitatie
Technieken voor het manipuleren van reasoning chains in CoT-geschikte modellen: injectie van valse premissen, logic bombs, reasoning hijacking en chain-corruptieaanvallen.
Exploitatie van reasoning-modellen
Het uitbuiten van extended thinking en chain-of-thought-redeneren in o1-, Claude- en DeepSeek-R1-modellen.
Onderzoek naar het misbruiken van sycophantie
Onderzoek naar het misbruiken van sycophantische neigingen in met RLHF getrainde modellen voor het omzeilen van veiligheid en voor manipulatie.
Exploitatie van wereldmodellen in AI-agents
Het exploiteren van geleerde wereldmodellen in AI-agents om onveilig gedrag te veroorzaken via manipulatie van de omgeving.
Interne werking van het context window
Hoe attention decay, de grenzen van positional encoding en geheugenbeheer in transformer-context-windows uitbuitbare patronen creëren voor red team-operaties.
Misbruik van de toolchain van agents
Chain multiple tool calls in an agent system to achieve multi-step exploitation.
Cross-plug-in exploitatieketen
Chain exploits across multiple LLM plugins to achieve capabilities not available through any single plugin.
Lab: volledig misbruik van MCP
Hands-on lab for conducting a complete Model Context Protocol server compromise including tool enumeration, permission escalation, cross-tool attacks, and data exfiltration through MCP channels.
Misbruik van uitvoerbeperkingen
Exploit structured output requirements to force models into revealing restricted information.
Lab: misbruik van RLHF-training
Exploit reward model weaknesses to craft inputs that score highly on safety metrics while achieving adversarial objectives.
Lab: misbruik van sparse attention
Exploit sparse attention patterns in long-context models to hide injection payloads in low-attention regions.
Lab: misbruik van LangChain-CVE's
Reproduce and analyze LangChain CVEs including CVE-2023-29374 and CVE-2023-36258 in a safe lab environment.
Misbruik van reasoning traces in CoT-modellen
Exploit visible chain-of-thought reasoning traces in models like o1 and DeepSeek-R1 to manipulate outputs.
Grondbeginselen van het misbruiken van JSON-uitvoer
Exploit LLM JSON mode to bypass content filters and extract information through structured output channels.
Lab: misbruik van het uitvoerformaat
Manipulate output formats like JSON, CSV, code blocks, and structured data to extract information that models would normally refuse to provide in natural language.
Misbruik van foutmeldingen
Trigger and analyze error messages from LLM applications to reveal architecture and configuration details.
Misbruik van emergent gedrag
Identify and exploit emergent behaviors in frontier models that arise from scale and are not present in smaller models.
Lab: misbruik van MoE-routing
Exploit Mixture-of-Experts routing mechanisms to selectively activate or suppress expert modules in MoE models.
Misbruik van kwetsbaarheden door kwantisatie
Exploit behavioral differences between full-precision and quantized models.
Misbruik van MoE-routing
Exploit Mixture-of-Experts routing mechanisms to activate specific expert networks for adversarial purposes.
Lab: AI-agents misbruiken
Hands-on lab for exploiting AI agents with tool access through indirect prompt injection, tool-call chaining, and privilege escalation techniques.
Lab: misbruik van chain-of-thought
Exploit chain-of-thought reasoning to leak internal model reasoning, bypass safety filters, and manipulate decision processes.
Lab: LLM-hallucinaties misbruiken
Exploit hallucination tendencies to trigger fabricated tool calls, invented API endpoints, and false fact injection.
Lab: misbruik van MCP-servers
Hands-on lab for attacking a vulnerable MCP server, demonstrating tool shadowing, consent phishing, and server impersonation techniques.
Lab: misbruik van het uitvoerschema
Exploit structured output schemas to force models into revealing information through required field population.
Lab: misbruik van de rolhiërarchie
Exploit multi-role LLM architectures by manipulating the instruction hierarchy between system, user, and assistant roles.
Lab voor misbruik van sessiestatus
Exploit session management vulnerabilities in LLM applications to access other users data or escalate privileges.
Misbruik van gestructureerde uitvoer
Exploit JSON mode and structured output constraints to bypass safety filters.
Geavanceerd misbruik van A/B-testen
Manipulating A/B testing frameworks to bias model selection toward less secure variants or introduce adversarial model candidates.
Misbruik van MoE-routing (model deep dives)
Detailed analysis of how Mixture-of-Experts routing can be manipulated to bypass safety-critical expert paths and trigger unsafe generation.
Exploitatie van documentparsing
Het uitbuiten van PDF-, DOCX- en andere documentparsers in multimodale AI-systemen voor injectie en data-extractie.
Exploitatie van video-begripmodellen
Aanvallen op modellen voor video-captioning, video-Q&A en actieherkenning met adversariële video's die misclassificatie of instructie-injectie veroorzaken.
Misbruik van de instructiehiërarchie
Het misbruiken van ambiguïteiten in instructieprioriteitshiërarchieën bij verschillende modelaanbieders.
Exploitatie van Curriculum Learning (Training Pipeline)
Curriculum learning en datavolgorde exploiteren om het effect van vergiftigde trainingsvoorbeelden te versterken.
Uitbuiting van de RLHF-pipeline
Het uitbuiten van de training van reward-modellen, het verzamelen van voorkeursdata en de optimalisatielussen van RLHF.
Walkthrough: misbruik van API-chaining
Walkthrough of chaining multiple API calls in agent systems to achieve multi-step unauthorized actions.
Gids voor misbruik van function calling
Complete walkthrough of exploiting function calling in OpenAI, Anthropic, and Google AI APIs.
Misbruik van inference-endpoints
Exploiting inference API endpoints for unauthorized access, data exfiltration, and service abuse through authentication flaws, input validation gaps, and misconfigured permissions.
Walkthrough: misbruik van logit bias
Exploit logit bias API parameters to force models toward specific token sequences and bypass safety filters.
Walkthrough van misbruik van redeneermodellen
Exploit extended thinking in reasoning models to inject false premises and manipulate conclusion generation.
Walkthrough van misbruik van rolverwarring
Exploit role boundaries in chat APIs by injecting assistant-role messages and system-level instructions.
Walkthrough: misbruik van API-parameters
Walkthrough of exploiting undocumented and misconfigured API parameters in LLM service endpoints.
Walkthrough: misbruik van de Batch API
Walkthrough of exploiting batch processing APIs for large-scale prompt injection and output analysis.
Walkthrough: misbruik van de instructiehiërarchie
Walkthrough of exploiting how models prioritize system, user, and tool instructions to override safety directives.