# multimodal

practice-examadvancedmultimodaltraining-pipelinecloud-aiforensicsgovernance

Oefenexamen 2: geavanceerde AI-beveiliging

25-question advanced practice exam covering multimodal attacks, training pipeline security, cloud AI security, forensics, and governance.

practice-exammultimodalvlm

Oefenexamen multimodale beveiliging

Oefenexamen over beeldinjectie, audio-aanvallen, cross-modale transfer en exploitatie van documentparsing.

assessmentmultimodalcross-modal

Geavanceerd multimodaal assessment

In-depth assessment of cross-modal attack vectors including image injection, audio manipulation, and steganographic techniques.

assessmentsmultimodalattacksexam

Beoordeling van multimodale aanvallen

Assessment on image injection, audio attacks, cross-modal exploitation, and multimodal defense bypass.

assessmentssectiondefensemultimodalassessment

Beoordeling van multimodale verdediging

Assessment covering defenses against visual injection, audio attacks, and cross-modal exploitation.

assessmentmultimodalvisionaudiocross-modal-attacks

Beoordeling van multimodale aanvallen

Test your understanding of attacks against multimodal AI systems, including image-based injection, audio adversarial examples, and cross-modal manipulation with 10 intermediate-level questions.

assessmentsmultimodaladvancedexam

Assessment van geavanceerde multimodale aanvallen

Advanced assessment covering cross-modal attacks, steganographic injection, and multimodal defense bypass.

skill-verificationmultimodalcross-modal

Vaardigheidsverificatie: uitvoeren van multimodale aanvallen

Hands-on verification of image injection, audio manipulation, and cross-modal transfer attacks.

assessmentsdefensemultimodalverifyskill

Vaardigheidsverificatie: multimodale verdediging

Practical verification of ability to defend multimodal AI systems against cross-modal attacks.

assessmentsskill-verificationmultimodalpractical

Vaardigheidsverificatie: multimodale aanvallen

Hands-on verification of multimodal attack capabilities across image, audio, and document modalities.

assessmentssecurityguidestudymultimodal

Studiegids multimodale beveiliging

Study guide for multimodal attack and defense topics covering image, audio, and document modalities.

assessmentsstudy-guidemultimodalprep

Studiegids multimodale beveiliging (beoordeling)

Study guide for multimodal security assessments covering image, audio, document, and cross-modal attacks.

capstonemultimodalattackvisionadversarial

Capstone: bouw een testsuite voor multimodale aanvallen

Design and implement a comprehensive testing suite for attacking multimodal AI systems across text, image, audio, and document modalities.

capstonemultimodalassessmentfull

Capstone: assessment van een multimodaal systeem

Capstone exercise: red team assessment of a multimodal AI system processing images, documents, and text.

case-studiesgpt-4vmultimodalvisionjailbreakadversarial-images

Casestudy: jailbreak-aanvallen op GPT-4 Vision

Analysis of visual jailbreak techniques targeting GPT-4V's multimodal capabilities, including typography attacks, adversarial images, and cross-modal prompt injection.

case-studiesmultimodaljailbreakscampaigns

Casestudy: multimodale jailbreak-campagnes

Analysis of multimodal jailbreak campaigns targeting GPT-4V and Gemini vision capabilities.

case-studiesgooglebardgeminiprompt-injectionmultimodal

Casestudy: prompt injection-aanvallen op Google Bard/Gemini

Analysis of prompt injection vulnerabilities discovered in Google Bard (later Gemini), including indirect injection through Google Workspace integration and the unique attack surface created by multimodal capabilities.

multimodalclipcross-modalimage-embeddingsadversarial-attacks

Aanvallen op multimodale embeddings

Het misbruiken van cross-modale embeddingmodellen zoals CLIP — manipulatie van de adversarial uitlijning tussen beeld en tekst, cross-modale injectie en aanvallen op multimodale retrievalsystemen.

embeddingmultimodalattacksclip

Aanvallen op multimodale embeddings (beveiliging van embeddingvectoren)

Aanvallen op multimodale embeddingruimtes zoals CLIP voor cross-modale manipulatie.

model-typesattack-surfacemultimodalcode-generationbeginner

Modeltypes en hun aanvalsoppervlakken

Hoe tekst-, vision-, multimodale, embedding- en codegeneratiemodellen elk unieke kwetsbaarheden en aanvalsoppervlakken voor redteamers met zich meebrengen.

frontier-researchmultimodalreasoningattacks

Multi-modal reasoning-aanvallen

Het aanvallen van redeneerprocessen die meerdere modaliteiten omvatten in vision-language- en audio-language-modellen.

frontiermultimodalreasoning

Beveiliging van multimodaal redeneren

Beveiligingsuitdagingen die specifiek zijn voor modellen die tegelijkertijd redeneren over tekst-, beeld-, audio- en videomodaliteiten.

injectionprompt-injectionjailbreaksmultimodalresearchautomation

Injection-onderzoek

Geavanceerd onderzoek naar prompt injection, jailbreak-automatisering en multimodale aanvalsvectoren, met state-of-the-art technieken die verder gaan dan de standaard injectiebenaderingen.

adversarial-perturbationsvision-encoderFGSMPGDtransferabilityVLMmultimodal

Adversarial perturbatie-aanvallen

Gradient-gebaseerde aanvallen op pixelniveau tegen vision encoders, met FGSM, PGD, C&W, transferability, fysieke adversarial voorbeelden en beperkingen op het perturbatiebudget.

audio-adversarialultrasonicASRvoice-cloninghidden-commandsspeech-to-textmultimodal

Adversarial aanvallen op audio en spraak

Adversarial aanvallen op spraakgestuurde AI-systemen, met aandacht voor ultrasone injection, adversarial ruis op ASR, verborgen voice commands, voice cloning voor authenticatie-omzeiling en real-time audiomanipulatie.

multimodalVLMtypographic-attacksaudio-injectiondocument-attacksvision

Multimodale aanvalsvectoren

Misbruik van vision-language modellen, typografische aanvallen, audio injection, document-gebaseerde aanvallen en cross-modal adversariale technieken.

CLIPmultimodalcross-modalvision-languageadversarial-images

Cross-modale embedding-aanvallen

Misbruik van gedeelde embeddingruimtes over modaliteiten heen: adversarial CLIP-afbeeldingen, typografische aanvallen, VLM-injectie en dimensionaliteitsreductie-aanvallen.

labaudioadversarialmultimodaladvancedhands-on

Lab: adversarial voorbeelden in audio

Hands-on lab for crafting adversarial audio perturbations that cause speech-to-text models and voice assistants to misinterpret spoken commands, demonstrating attacks on audio AI systems.

chainadvancedlabmultimodalattacklabs

Lab voor multimodale aanvalsketens

Chain attacks across text, image, and structured data modalities to exploit multimodal system vulnerabilities.

labmultimodalpipelinevision

Lab: multimodale aanvalspijplijn

Build an automated multimodal attack pipeline that generates adversarial images, combines them with text prompts, and tests against vision-language models (VLMs).

labsmultimodalimageinjection

Multimodale image-injectie

Embed adversarial text in images that triggers prompt injection in vision-language models.

labsmultimodalchain-attackorchestrationadvanced

Orkestratie van multimodale aanvalsketens

Orchestrate attacks across text, image, and document modalities to bypass per-modality safety filters.

labsmultimodalbasicsbeginner

Lab: grondbeginselen van het testen van multimodale invoer

Introduction to testing multimodal LLMs with image and text inputs to understand cross-modal behavior.

CTF: Multimodal Maze

Navigate a multimodal challenge using image, text, and audio injection vectors. Each modality unlocks the next stage of the maze, requiring cross-modal attack chaining.

ctfmultimodalmazevision

Multimodale cipher: cross-modale ontsleuteling

Decode a flag split across text, image, and audio inputs processed by a multimodal AI system.

labsctfmultimodalcipher

labmultimodalvisionimage-injectionintermediate

Lab: multimodale injection

Hands-on lab for embedding text instructions in images to exploit vision-enabled LLMs. Learn to craft visual prompt injections, test OCR-based attacks, and evaluate multimodal safety boundaries.

labmultimodalimage-injectionvisionintermediatehands-on

Lab: multimodale injection (lab voor gevorderden)

Embed prompt injection instructions in images for vision-enabled models, testing how visual content can carry adversarial payloads.

labsmultimodalintermediate-testingintermediate

Lab: multimodaal beveiligingstesten voor gevorderden

Test multimodal LLMs with crafted images containing embedded text, adversarial perturbations, and visual injection payloads.

simulationmultimodalvisionimage-injection

Simulatie: beoordeling van een multimodale applicatie

Red team simulation targeting an application that processes both images and text, testing visual injection, cross-modal attacks, and multimodal jailbreaks.

geminigooglemultimodallong-contextarchitecturered-teaming

Overzicht van Gemini (Google)

Architecture overview of Google's Gemini model family, including natively multimodal design, long context capabilities, Google ecosystem integration, and security-relevant features for red teaming.

geminivulnerabilitiesbiassystem-prompt-leaksafety-filtersmultimodal

Bekende kwetsbaarheden van Gemini

Documented Gemini vulnerabilities including image generation bias incidents, system prompt extraction, safety filter inconsistencies, multimodal injection exploits, and grounding abuse.

modelsmultimodalvisioncomparison

Beveiligingsvergelijking van multimodale modellen

Comparing security properties across multimodal models (GPT-4V, Claude, Gemini) with focus on cross-modal injection and vision-language attacks.

multimodal3dadversarialspatial

Adversariële aanvallen op 3D-modellen

Adversariële aanvallen op AI-systemen die 3D-modellen, point clouds en ruimtelijke data verwerken.

multimodaladversarialimageperturbation

Adversariële beeldverstoring voor VLM's

Het genereren van adversariële verstoringen die ervoor zorgen dat vision-language-modellen verkeerd interpreteren of geïnjecteerde instructies opvolgen.

multimodaladversarial-patchphysical

Adversariële patch-aanvallen op VLM's

Het vervaardigen van fysieke adversariële patches die specifiek gedrag in vision-language-modellen activeren wanneer ze door camera's worden vastgelegd.

attackstypographyadversarialmultimodal

Adversariële typografie-aanvallen

Vervaardig adversariële tekst die als afbeelding wordt weergegeven om OCR en tekstherkenning van vision-modellen te exploiteren.

audioadversarialmultimodalvoiceprompt-injectionspeech-llmresearch

Aanvallen via de audiomodaliteit

Uitgebreide aanvalstaxonomie voor audio-capabele LLM's: het genereren van adversariële audio, op spraak gebaseerde prompt-injectie, cross-modale split-aanvallen en ultrasone verstoringen.

audiospeechmultimodalattack-surface

Aanvalsoppervlak van audiomodellen

Overzicht van de beveiliging van audiomodellen, waaronder aanvallen op Whisper, speech-to-text-systemen, voice assistants en de audioverwerkingspijplijn.

multimodalaudioadversarialspeechasr

Adversariële aanvallen op audio- en spraakmodellen

Technieken voor het vervaardigen van adversariële audio die spraakherkenning, voice assistants en audio-taalmodellen exploiteert, waaronder verborgen commando's en psychoakoestische maskering.

Injectie in het audiofrequentiedomein

Het verbergen van adversariële instructies in audiofrequentiebanden die door speech-to-text-modellen worden verwerkt maar onhoorbaar zijn voor mensen.

multimodalaudiofrequency

commandsmultimodalaudiohidden

Verborgen audiocommando's voor voice-AI

Verberg verborgen commando's in audio die onhoorbaar zijn voor mensen maar wel worden herkend door spraakverwerkende AI.

multimodalaudioinjectionattacks

Op audio gebaseerde injectie-aanvallen

Het aanvallen van speech-to-text- en audio-taalmodellen door het vervaardigen van adversariële audio.

multimodalchartsvisualization

Injectieaanvallen via grafieken en diagrammen

Het inbedden van vijandige instructies in grafieken, diagrammen en datavisualisaties die door VLM's verwerkt worden.

cross-modalmultimodalstrategy

Cross-Modal-aanvalsstrategieën

Overzicht van aanvalsstrategieën die de grenzen tussen inputmodaliteiten in multimodale AI-systemen uitbuiten, waaronder vision-language-, audio-text- en documentverwerkingspijplijnen.

labmultimodalattack-chain

Lab: Multimodale aanvalsketen

Praktisch lab voor het bouwen en uitvoeren van een aanvalsketen met meerdere stappen die afbeeldingsinjectie, documentexploitatie en tekstgebaseerde technieken combineert tegen een multimodaal AI-systeem.

defensemultimodalcross-modalperceptual-hashingnsfwsafety

Multimodale verdedigingsstrategieën

Uitgebreide verdedigingsbenaderingen voor multimodale AI-systemen: cross-modal-verificatie, perceptual hashing, NSFW-detectie, inputsanitatie en defense-in-depth-architecturen.

Multimodale jailbreaking-technieken

Gecombineerde multimodale benaderingen om veiligheids-alignment te omzeilen, waaronder afbeelding-tekst-combinatieaanvallen, typografische jailbreaks, manipulatie van visuele chain-of-thought en multimodale crescendo-technieken.

jailbreakmultimodal

multimodalcross-modaltransferattack-chainmodality

Aanvallen overdragen tussen modaliteiten

Technieken voor het vervaardigen van vijandige inputs die overdraagbaar zijn tussen modaliteiten, waarbij één inputkanaal gebruikt wordt om de verwerking in een ander kanaal aan te vallen, waaronder image-to-text-, audio-to-action- en document-to-tool-aanvalsketens.

multimodalcross-modaltransferattacks

Cross-Modal Transfer-aanvallen

Aanvallen die overdraagbaar zijn tussen modaliteiten — waarbij één inputmodaliteit gebruikt wordt om de verwerking in een andere aan te vallen.

Vijandige aanvallen op depth maps

Vijandige manipulatie van diepte-informatie in 3D-begripstaken die door multimodale modellen verwerkt worden.

multimodaldepth-map3d

multimodaldocumentocrpdflayout

Aanvallen op documentverwerkende AI

Technieken voor het aanvallen van documentbegripsystemen waaronder OCR-pijplijnen, PDF-verwerkers en document-taalmodellen via lay-outmanipulatie, verborgen tekst en metadata-injectie.

injectionmetadatadocumentmultimodal

Documentmetadata-injectie

Injecteer vijandige content via documentmetadatavelden die door multimodale AI-systemen verwerkt worden.

multimodaldocumentparsingexploitation

Exploitatie van documentparsing

Het uitbuiten van PDF-, DOCX- en andere documentparsers in multimodale AI-systemen voor injectie en data-extractie.

multimodalimageinjectiontechniques

Op afbeeldingen gebaseerde prompt-injectietechnieken

Technieken voor het inbedden van vijandige prompts in afbeeldingen die door vision-language-modellen worden verwerkt.

Injectieaanvallen via afbeeldingsmetadata

Het misbruiken van EXIF-metadata, IPTC-data en andere metadatavelden van afbeeldingen voor prompt-injectie in VLM-pipelines.

multimodalmetadataexif

multimodalsteganographyimagescovertinjection

Beeldsteganografie voor AI-aanvallen

Het gebruik van steganografische technieken om vijandige payloads in afbeeldingen in te bedden die menselijke inspectie en geautomatiseerde detectie ontwijken terwijl ze het gedrag van AI-modellen beïnvloeden.

imageinjectionsteganographymultimodal

Beeldsteganografie voor LLM-injectie

Gebruik beeldsteganografie om prompt-injectie-payloads in te bedden die onzichtbaar zijn voor menselijke kijkers.

multimodalvisionaudiovideocross-modalvlmadversarial

Multimodale beveiliging

Beveiligingsbeoordeling van multimodale AI-systemen die afbeeldingen, audio, video en cross-modale invoer verwerken, met vision-language-modellen, spraaksystemen, video-analyse en cross-modale aanvalstechnieken.

multimodalmedical-imagingadversarial

Vijandige aanvallen op medische beeldvorming

Vijandige aanvallen op AI voor medische beeldvorming, waaronder classificatiesystemen voor radiologie, pathologie en dermatologie.

multimodalalignmentsafetytrainingcross-modal

Alignment-uitdagingen in multimodale modellen

Analyse van alignment-uitdagingen die specifiek zijn voor multimodale AI-systemen, waaronder cross-modale veiligheidshiaten, representatieconflicten en de moeilijkheid om op tekst gebaseerde veiligheidstraining uit te breiden naar visuele, audio- en video-invoer.

attacksconsistencymultimodal

Multimodale consistentieaanvallen

Misbruik inconsistenties tussen hoe verschillende modaliteiten dezelfde informatie verwerken.

multimodaldefense-bypasstechniquesevasion

Technieken voor het omzeilen van multimodale verdediging

Technieken voor het omzeilen van veiligheidsfilters die alleen individuele modaliteiten analyseren.

multimodaldefensesafetymonitoringsanitization

Multimodale AI-systemen verdedigen

Uitgebreide verdedigingsstrategieën voor multimodale AI-systemen, waaronder invoersanering, cross-modale veiligheidsclassifiers, instructiehiërarchie en monitoring op vijandige multimodale invoer.

multimodalfusionarchitecture

Aanvallen op de multimodale fusielaag

Aanvallen op de fusiemechanismen die informatie uit meerdere modaliteiten combineren in multimodale modellen.

multimodalmodel-extractionintellectual-propertyside-channelquery

Modelextractie uit multimodale systemen

Technieken voor het extraheren van modelcapaciteiten, -gewichten en architectuurdetails uit multimodale AI-systemen via visuele, audio- en cross-modale querystrategieën.

multimodalprompt-injectionimagestypographicvisual

Op afbeeldingen gebaseerde prompt-injectieaanvallen

Uitgebreide technieken voor het injecteren van vijandige prompts via afbeeldingen, met typografische injectie, steganografische inbedding en visuele payload-aflevering tegen multimodale AI-systemen.

multimodalsurveycomprehensive

Overzicht van multimodale prompt-injectie

Uitgebreid overzicht van prompt-injectievectoren over alle modaliteiten heen, waaronder tekst, afbeelding, audio, video en code.

multimodalragpoisoningmultimodal-retrieval

Multimodale RAG-vergiftiging

Het vergiftigen van multimodale RAG-systemen via adversariële documenten met ingebedde visuele en tekstuele payloads.

multimodalred-teamingmethodologyassessmentframework

Methodologie voor het red teamen van multimodale systemen

Gestructureerde methodologie voor het uitvoeren van beveiligingsassessments van multimodale AI-systemen, met scoping, enumeratie van het aanvalsoppervlak, testuitvoering en rapportage met MITRE ATLAS-mappings.

multimodalbenchmarkingsafetyevaluationvlm

Benchmarking van multimodale modelveiligheid

Het ontwerpen en implementeren van safety-benchmarks voor multimodale AI-modellen die afbeeldingen, audio en video naast tekst verwerken, met evaluatie van cross-modale aanvallen, consistentietests en aggregatie van veiligheidsscores.

multimodalwatermarkevasion

Multimodale watermerkontwijking

Technieken voor het ontwijken en verwijderen van watermerken die worden toegepast op door AI gegenereerde afbeeldingen, audio en video-inhoud.

multimodalocradversarialtext-recognition

Adversariële OCR-aanvallen

Het maken van afbeeldingen die OCR-systemen ertoe brengen adversariële tekst te extraheren voor downstream-injectie.

PDF-documentinjectietechnieken

Het exploiteren van PDF-parsing in multimodale modellen om instructies te injecteren via verborgen tekstlagen en ingebedde objecten.

multimodalpdfdocument

QR-code- en barcode-injectieaanvallen

Het gebruik van QR-codes en barcodes als vectoren voor prompt-injectie in vision-language-modelapplicaties.

multimodalqr-codebarcode

multimodalsatellitegeospatial

Adversariële aanvallen op satellietbeelden

Adversariële manipulatie van AI voor analyse van satellietbeelden voor geospatiale inlichtingen en aardobservatie.

multimodalscreen-capturecomputer-useagentui

Aanvallen via Screen Capture en Computer-Use AI

Technieken voor het aanvallen van AI-systemen die schermopnames verwerken, waaronder computer-use-agents, schermlees-assistenten en geautomatiseerde UI-testsystemen.

multimodalscreenshotuiinjection

Screenshot- en UI-injectieaanvallen

Prompts injecteren via screenshots en UI-elementen die worden verwerkt door computer-use-AI-agents.

multimodalsign-languagegesture

Injectie van gebarentaal en gebaren

Het exploiteren van herkenningsmodellen voor gebarentaal en gebaren via adversariële fysieke gebaren en gemodificeerde inputs.

multimodalsteganographyinjectionhidden

Steganografische prompt-injectie

Het verbergen van prompt-injectie-payloads met behulp van steganografische technieken in afbeeldingen en audio.

multimodaltext-to-imageadversarialdiffusionstable-diffusion

Adversariële aanvallen op tekst-naar-afbeelding-modellen

Het begrijpen en evalueren van adversariële aanvallen op tekst-naar-afbeelding-generatiemodellen, waaronder promptmanipulatie voor het omzeilen van veiligheid, concept-erasure-aanvallen, adversariële verstoring van guidance en membership inference op trainingsdata.

multimodaltypographyinjection

Typografie-gebaseerde prompt-injectie

Het uitbuiten van tekstweergave in afbeeldingen om prompt-injectie-payloads af te leveren via typografieherkenning in VLM's.

videomultimodaltemporalattack-surface

Video Model Attacks

Beveiliging van modellen voor videobegrip, frame-level versus temporele aanvallen, hoe videomodellen sequenties verwerken, en het volledige overzicht van het aanvalsoppervlak.

video-understandingexploitationmultimodal

Exploitatie van video-begripmodellen

Aanvallen op modellen voor video-captioning, video-Q&A en actieherkenning met adversariële video's die misclassificatie of instructie-injectie veroorzaken.

multimodalvideoframeinjection

Video Frame Injection

Het injecteren van adversariële content in videoframes die worden verwerkt door AI-modellen voor videobegrip.

Video Temporal Frame Injection

Het injecteren van adversariële frames op specifieke temporele posities in videostreams die worden verwerkt door modellen voor videobegrip.

multimodalvideotemporal

multimodalvideotemporaladversarialframe-injection

Aanvallen op modellen voor videobegrip

Technieken om AI-systemen voor videobegrip aan te vallen via frame injection, temporele manipulatie en adversariële videogeneratie gericht op modellen zoals Gemini 2.5 Pro.

multimodalvlmadversarialvisionjailbreak

Aanvallen op vision-language-modellen

Uitgebreide technieken voor het aanvallen van vision-language-modellen waaronder GPT-4V, Claude vision en Gemini, met adversariële afbeeldingen, typografische exploits en multimodale jailbreaks.

vlmarchitecturevision-encodermultimodal

VLM-architectuur & vision-language-alignment

Diepgaande verkenning van VLM-architecturen waaronder CLIP, SigLIP en vision-transformers. Hoe afbeeldingspatches tokens worden, alignment-training en waar misalignment uitbuitbare gaten creëert.

image-injectionprompt-injectionmultimodalvlm

Op afbeeldingen gebaseerde prompt-injectie

Technieken om tekstinstructies in afbeeldingen in te bedden om VLM's te manipuleren, waaronder steganografische injectie, zichtbare-tekstaanvallen en QR-code-exploitatie.

multimodalvlmvisionimage-attacks

Aanvallen op vision-language-modellen

Uitgebreid overzicht van het VLM-aanvalsoppervlak, hoe vision-encoders verbinding maken met taalmodellen, en waarom multimodale systemen nieuwe injectievectoren creëren.

jailbreakvlmmultimodalsafety-bypass

VLM-specifiek jailbreaken

Jailbreak-technieken die de vision-modaliteit uitbuiten, waaronder afbeelding-tekst-inconsistentie-aanvallen, visuele veiligheidsbypass en cross-modale jailbreak-strategieën.

prompt-injectionmultimodaltextcross-modal

Multimodale tekst-injectievectoren

Adversariële tekstinstructies injecteren via niet-tekstuele modaliteiten, waaronder afbeeldingen met ingebedde tekst, audiotranscriptie en documentparsing.

multimodalaudioprompt-injectionspeechred-teaming

Audio prompt injection

Injecting adversarial instructions through audio inputs to speech-to-text and multimodal models, exploiting the audio channel as an alternative injection vector.

multimodalcross-modalprompt-injectionfusionred-teaming

Cross-modale confusie

Confusing multimodal AI models by sending conflicting or complementary signals across different input modalities to bypass safety mechanisms and exploit fusion weaknesses.

multimodalprompt-injectionvisionimagesred-teaming

Op afbeeldingen gebaseerde prompt injection (aanval-walkthrough)

Embedding text instructions in images that vision models read, enabling prompt injection through the visual modality to bypass text-only input filters and safety mechanisms.

multimodalchainingprompt-injectionimagesmulti-turn

Multi-image chaining

Chaining prompt injection payloads across multiple images in a conversation to deliver complex attacks that evade per-image content filters and build injection context progressively.

walkthroughsmultimodaldocumentcombined-attack

Walkthrough van multimodale documentaanvallen

Combine visual and textual injection in documents processed by multimodal LLM applications.

walkthroughsmultimodalimageinjection

Walkthrough van multimodale image-injectie

Step-by-step walkthrough of embedding adversarial prompts in images for vision model exploitation.

multimodalocrprompt-injectiontext-extractionred-teaming

OCR-gebaseerde aanvallen

Exploiting Optical Character Recognition processing pipelines to inject adversarial text into AI systems, targeting the gap between what OCR extracts and what humans see.

multimodalpdfprompt-injectiondocumentsred-teaming

PDF-documentinjectie

Injecting adversarial prompts through PDF documents processed by AI systems, exploiting document parsing pipelines to deliver payloads through text layers, metadata, and embedded objects.

multimodalqr-codeprompt-injectionvisionencoding

QR-code-injectie

QR-codes gebruiken als prompt-injectievectoren tegen vision-language-modellen, waarbij adversarial instructies worden gecodeerd in machinaal leesbare formaten die modellen decoderen en volgen.

multimodalsteganographyprompt-injectionimagescovert

Aflevering van steganografische payloads

Hiding prompt injection payloads in images using steganographic techniques, delivering adversarial instructions through pixel-level modifications invisible to human observers.

multimodaltypographyprompt-injectionvisionevasion

Typografie-injectie in afbeeldingen

Using rendered text with specific fonts, styles, and typographic techniques in images to inject prompts into vision-language models while evading detection.

multimodalvideoprompt-injectionframesred-teaming

Injectie via videoframes (aanval-walkthrough)

Embedding prompt injection payloads in specific video frames to attack multimodal models that process video content, exploiting temporal and visual channels simultaneously.

walkthroughsvision-modelattacksmultimodal

Walkthrough van een aanval op een vision-model

Attack vision-language models through adversarial images with embedded text, perturbations, and visual trojans.

walkthroughssteganographyimage-injectionmultimodal

Walkthrough: injection via afbeeldingssteganografie

Walkthrough of hiding prompt injection payloads in images using steganographic techniques for vision model attacks.