# multimodal
117 artikelengetagd met “multimodal”
Geavanceerd oefenexamen
25-question practice exam covering advanced AI red team techniques: multimodal attacks, training pipeline exploitation, agentic system attacks, embedding manipulation, and fine-tuning security.
Oefenexamen 2: geavanceerde AI-beveiliging
25-question advanced practice exam covering multimodal attacks, training pipeline security, cloud AI security, forensics, and governance.
Oefenexamen multimodale beveiliging
Oefenexamen over beeldinjectie, audio-aanvallen, cross-modale transfer en exploitatie van documentparsing.
Geavanceerd multimodaal assessment
In-depth assessment of cross-modal attack vectors including image injection, audio manipulation, and steganographic techniques.
Beoordeling van multimodale aanvallen
Assessment on image injection, audio attacks, cross-modal exploitation, and multimodal defense bypass.
Beoordeling van multimodale verdediging
Assessment covering defenses against visual injection, audio attacks, and cross-modal exploitation.
Beoordeling van multimodale aanvallen
Test your understanding of attacks against multimodal AI systems, including image-based injection, audio adversarial examples, and cross-modal manipulation with 10 intermediate-level questions.
Assessment van geavanceerde multimodale aanvallen
Advanced assessment covering cross-modal attacks, steganographic injection, and multimodal defense bypass.
Vaardigheidsverificatie: uitvoeren van multimodale aanvallen
Hands-on verification of image injection, audio manipulation, and cross-modal transfer attacks.
Vaardigheidsverificatie: multimodale verdediging
Practical verification of ability to defend multimodal AI systems against cross-modal attacks.
Vaardigheidsverificatie: multimodale aanvallen
Hands-on verification of multimodal attack capabilities across image, audio, and document modalities.
Studiegids multimodale beveiliging
Study guide for multimodal attack and defense topics covering image, audio, and document modalities.
Studiegids multimodale beveiliging (beoordeling)
Study guide for multimodal security assessments covering image, audio, document, and cross-modal attacks.
Capstone: bouw een testsuite voor multimodale aanvallen
Design and implement a comprehensive testing suite for attacking multimodal AI systems across text, image, audio, and document modalities.
Capstone: assessment van een multimodaal systeem
Capstone exercise: red team assessment of a multimodal AI system processing images, documents, and text.
Casestudy: jailbreak-aanvallen op GPT-4 Vision
Analysis of visual jailbreak techniques targeting GPT-4V's multimodal capabilities, including typography attacks, adversarial images, and cross-modal prompt injection.
Casestudy: multimodale jailbreak-campagnes
Analysis of multimodal jailbreak campaigns targeting GPT-4V and Gemini vision capabilities.
Casestudy: prompt injection-aanvallen op Google Bard/Gemini
Analysis of prompt injection vulnerabilities discovered in Google Bard (later Gemini), including indirect injection through Google Workspace integration and the unique attack surface created by multimodal capabilities.
Aanvallen op multimodale embeddings
Het misbruiken van cross-modale embeddingmodellen zoals CLIP — manipulatie van de adversarial uitlijning tussen beeld en tekst, cross-modale injectie en aanvallen op multimodale retrievalsystemen.
Aanvallen op multimodale embeddings (beveiliging van embeddingvectoren)
Aanvallen op multimodale embeddingruimtes zoals CLIP voor cross-modale manipulatie.
Modeltypes en hun aanvalsoppervlakken
Hoe tekst-, vision-, multimodale, embedding- en codegeneratiemodellen elk unieke kwetsbaarheden en aanvalsoppervlakken voor redteamers met zich meebrengen.
Multi-modal reasoning-aanvallen
Het aanvallen van redeneerprocessen die meerdere modaliteiten omvatten in vision-language- en audio-language-modellen.
Beveiliging van multimodaal redeneren
Beveiligingsuitdagingen die specifiek zijn voor modellen die tegelijkertijd redeneren over tekst-, beeld-, audio- en videomodaliteiten.
Injection-onderzoek
Geavanceerd onderzoek naar prompt injection, jailbreak-automatisering en multimodale aanvalsvectoren, met state-of-the-art technieken die verder gaan dan de standaard injectiebenaderingen.
Adversarial perturbatie-aanvallen
Gradient-gebaseerde aanvallen op pixelniveau tegen vision encoders, met FGSM, PGD, C&W, transferability, fysieke adversarial voorbeelden en beperkingen op het perturbatiebudget.
Adversarial aanvallen op audio en spraak
Adversarial aanvallen op spraakgestuurde AI-systemen, met aandacht voor ultrasone injection, adversarial ruis op ASR, verborgen voice commands, voice cloning voor authenticatie-omzeiling en real-time audiomanipulatie.
Multimodale aanvalsvectoren
Misbruik van vision-language modellen, typografische aanvallen, audio injection, document-gebaseerde aanvallen en cross-modal adversariale technieken.
Cross-modale embedding-aanvallen
Misbruik van gedeelde embeddingruimtes over modaliteiten heen: adversarial CLIP-afbeeldingen, typografische aanvallen, VLM-injectie en dimensionaliteitsreductie-aanvallen.
Lab: adversarial voorbeelden in audio
Hands-on lab for crafting adversarial audio perturbations that cause speech-to-text models and voice assistants to misinterpret spoken commands, demonstrating attacks on audio AI systems.
Lab voor multimodale aanvalsketens
Chain attacks across text, image, and structured data modalities to exploit multimodal system vulnerabilities.
Lab: multimodale aanvalspijplijn
Build an automated multimodal attack pipeline that generates adversarial images, combines them with text prompts, and tests against vision-language models (VLMs).
Multimodale image-injectie
Embed adversarial text in images that triggers prompt injection in vision-language models.
Orkestratie van multimodale aanvalsketens
Orchestrate attacks across text, image, and document modalities to bypass per-modality safety filters.
Lab: grondbeginselen van het testen van multimodale invoer
Introduction to testing multimodal LLMs with image and text inputs to understand cross-modal behavior.
CTF: Multimodal Maze
Navigate a multimodal challenge using image, text, and audio injection vectors. Each modality unlocks the next stage of the maze, requiring cross-modal attack chaining.
Multimodale cipher: cross-modale ontsleuteling
Decode a flag split across text, image, and audio inputs processed by a multimodal AI system.
Lab: multimodale injection
Hands-on lab for embedding text instructions in images to exploit vision-enabled LLMs. Learn to craft visual prompt injections, test OCR-based attacks, and evaluate multimodal safety boundaries.
Lab: multimodale injection (lab voor gevorderden)
Embed prompt injection instructions in images for vision-enabled models, testing how visual content can carry adversarial payloads.
Lab: multimodaal beveiligingstesten voor gevorderden
Test multimodal LLMs with crafted images containing embedded text, adversarial perturbations, and visual injection payloads.
Simulatie: beoordeling van een multimodale applicatie
Red team simulation targeting an application that processes both images and text, testing visual injection, cross-modal attacks, and multimodal jailbreaks.
Overzicht van Gemini (Google)
Architecture overview of Google's Gemini model family, including natively multimodal design, long context capabilities, Google ecosystem integration, and security-relevant features for red teaming.
Bekende kwetsbaarheden van Gemini
Documented Gemini vulnerabilities including image generation bias incidents, system prompt extraction, safety filter inconsistencies, multimodal injection exploits, and grounding abuse.
Beveiligingsvergelijking van multimodale modellen
Comparing security properties across multimodal models (GPT-4V, Claude, Gemini) with focus on cross-modal injection and vision-language attacks.
Adversariële aanvallen op 3D-modellen
Adversariële aanvallen op AI-systemen die 3D-modellen, point clouds en ruimtelijke data verwerken.
Adversariële beeldverstoring voor VLM's
Het genereren van adversariële verstoringen die ervoor zorgen dat vision-language-modellen verkeerd interpreteren of geïnjecteerde instructies opvolgen.
Adversariële patch-aanvallen op VLM's
Het vervaardigen van fysieke adversariële patches die specifiek gedrag in vision-language-modellen activeren wanneer ze door camera's worden vastgelegd.
Adversariële typografie-aanvallen
Vervaardig adversariële tekst die als afbeelding wordt weergegeven om OCR en tekstherkenning van vision-modellen te exploiteren.
Aanvallen via de audiomodaliteit
Uitgebreide aanvalstaxonomie voor audio-capabele LLM's: het genereren van adversariële audio, op spraak gebaseerde prompt-injectie, cross-modale split-aanvallen en ultrasone verstoringen.
Aanvalsoppervlak van audiomodellen
Overzicht van de beveiliging van audiomodellen, waaronder aanvallen op Whisper, speech-to-text-systemen, voice assistants en de audioverwerkingspijplijn.
Adversariële aanvallen op audio- en spraakmodellen
Technieken voor het vervaardigen van adversariële audio die spraakherkenning, voice assistants en audio-taalmodellen exploiteert, waaronder verborgen commando's en psychoakoestische maskering.
Injectie in het audiofrequentiedomein
Het verbergen van adversariële instructies in audiofrequentiebanden die door speech-to-text-modellen worden verwerkt maar onhoorbaar zijn voor mensen.
Verborgen audiocommando's voor voice-AI
Verberg verborgen commando's in audio die onhoorbaar zijn voor mensen maar wel worden herkend door spraakverwerkende AI.
Op audio gebaseerde injectie-aanvallen
Het aanvallen van speech-to-text- en audio-taalmodellen door het vervaardigen van adversariële audio.
Injectieaanvallen via grafieken en diagrammen
Het inbedden van vijandige instructies in grafieken, diagrammen en datavisualisaties die door VLM's verwerkt worden.
Cross-Modal-aanvalsstrategieën
Overzicht van aanvalsstrategieën die de grenzen tussen inputmodaliteiten in multimodale AI-systemen uitbuiten, waaronder vision-language-, audio-text- en documentverwerkingspijplijnen.
Lab: Multimodale aanvalsketen
Praktisch lab voor het bouwen en uitvoeren van een aanvalsketen met meerdere stappen die afbeeldingsinjectie, documentexploitatie en tekstgebaseerde technieken combineert tegen een multimodaal AI-systeem.
Multimodale verdedigingsstrategieën
Uitgebreide verdedigingsbenaderingen voor multimodale AI-systemen: cross-modal-verificatie, perceptual hashing, NSFW-detectie, inputsanitatie en defense-in-depth-architecturen.
Multimodale jailbreaking-technieken
Gecombineerde multimodale benaderingen om veiligheids-alignment te omzeilen, waaronder afbeelding-tekst-combinatieaanvallen, typografische jailbreaks, manipulatie van visuele chain-of-thought en multimodale crescendo-technieken.
Aanvallen overdragen tussen modaliteiten
Technieken voor het vervaardigen van vijandige inputs die overdraagbaar zijn tussen modaliteiten, waarbij één inputkanaal gebruikt wordt om de verwerking in een ander kanaal aan te vallen, waaronder image-to-text-, audio-to-action- en document-to-tool-aanvalsketens.
Cross-Modal Transfer-aanvallen
Aanvallen die overdraagbaar zijn tussen modaliteiten — waarbij één inputmodaliteit gebruikt wordt om de verwerking in een andere aan te vallen.
Vijandige aanvallen op depth maps
Vijandige manipulatie van diepte-informatie in 3D-begripstaken die door multimodale modellen verwerkt worden.
Aanvallen op documentverwerkende AI
Technieken voor het aanvallen van documentbegripsystemen waaronder OCR-pijplijnen, PDF-verwerkers en document-taalmodellen via lay-outmanipulatie, verborgen tekst en metadata-injectie.
Documentmetadata-injectie
Injecteer vijandige content via documentmetadatavelden die door multimodale AI-systemen verwerkt worden.
Exploitatie van documentparsing
Het uitbuiten van PDF-, DOCX- en andere documentparsers in multimodale AI-systemen voor injectie en data-extractie.
Op afbeeldingen gebaseerde prompt-injectietechnieken
Technieken voor het inbedden van vijandige prompts in afbeeldingen die door vision-language-modellen worden verwerkt.
Injectieaanvallen via afbeeldingsmetadata
Het misbruiken van EXIF-metadata, IPTC-data en andere metadatavelden van afbeeldingen voor prompt-injectie in VLM-pipelines.
Beeldsteganografie voor AI-aanvallen
Het gebruik van steganografische technieken om vijandige payloads in afbeeldingen in te bedden die menselijke inspectie en geautomatiseerde detectie ontwijken terwijl ze het gedrag van AI-modellen beïnvloeden.
Beeldsteganografie voor LLM-injectie
Gebruik beeldsteganografie om prompt-injectie-payloads in te bedden die onzichtbaar zijn voor menselijke kijkers.
Multimodale beveiliging
Beveiligingsbeoordeling van multimodale AI-systemen die afbeeldingen, audio, video en cross-modale invoer verwerken, met vision-language-modellen, spraaksystemen, video-analyse en cross-modale aanvalstechnieken.
Vijandige aanvallen op medische beeldvorming
Vijandige aanvallen op AI voor medische beeldvorming, waaronder classificatiesystemen voor radiologie, pathologie en dermatologie.
Alignment-uitdagingen in multimodale modellen
Analyse van alignment-uitdagingen die specifiek zijn voor multimodale AI-systemen, waaronder cross-modale veiligheidshiaten, representatieconflicten en de moeilijkheid om op tekst gebaseerde veiligheidstraining uit te breiden naar visuele, audio- en video-invoer.
Multimodale consistentieaanvallen
Misbruik inconsistenties tussen hoe verschillende modaliteiten dezelfde informatie verwerken.
Technieken voor het omzeilen van multimodale verdediging
Technieken voor het omzeilen van veiligheidsfilters die alleen individuele modaliteiten analyseren.
Multimodale AI-systemen verdedigen
Uitgebreide verdedigingsstrategieën voor multimodale AI-systemen, waaronder invoersanering, cross-modale veiligheidsclassifiers, instructiehiërarchie en monitoring op vijandige multimodale invoer.
Aanvallen op de multimodale fusielaag
Aanvallen op de fusiemechanismen die informatie uit meerdere modaliteiten combineren in multimodale modellen.
Modelextractie uit multimodale systemen
Technieken voor het extraheren van modelcapaciteiten, -gewichten en architectuurdetails uit multimodale AI-systemen via visuele, audio- en cross-modale querystrategieën.
Op afbeeldingen gebaseerde prompt-injectieaanvallen
Uitgebreide technieken voor het injecteren van vijandige prompts via afbeeldingen, met typografische injectie, steganografische inbedding en visuele payload-aflevering tegen multimodale AI-systemen.
Overzicht van multimodale prompt-injectie
Uitgebreid overzicht van prompt-injectievectoren over alle modaliteiten heen, waaronder tekst, afbeelding, audio, video en code.
Multimodale RAG-vergiftiging
Het vergiftigen van multimodale RAG-systemen via adversariële documenten met ingebedde visuele en tekstuele payloads.
Methodologie voor het red teamen van multimodale systemen
Gestructureerde methodologie voor het uitvoeren van beveiligingsassessments van multimodale AI-systemen, met scoping, enumeratie van het aanvalsoppervlak, testuitvoering en rapportage met MITRE ATLAS-mappings.
Benchmarking van multimodale modelveiligheid
Het ontwerpen en implementeren van safety-benchmarks voor multimodale AI-modellen die afbeeldingen, audio en video naast tekst verwerken, met evaluatie van cross-modale aanvallen, consistentietests en aggregatie van veiligheidsscores.
Multimodale watermerkontwijking
Technieken voor het ontwijken en verwijderen van watermerken die worden toegepast op door AI gegenereerde afbeeldingen, audio en video-inhoud.
Adversariële OCR-aanvallen
Het maken van afbeeldingen die OCR-systemen ertoe brengen adversariële tekst te extraheren voor downstream-injectie.
PDF-documentinjectietechnieken
Het exploiteren van PDF-parsing in multimodale modellen om instructies te injecteren via verborgen tekstlagen en ingebedde objecten.
QR-code- en barcode-injectieaanvallen
Het gebruik van QR-codes en barcodes als vectoren voor prompt-injectie in vision-language-modelapplicaties.
Adversariële aanvallen op satellietbeelden
Adversariële manipulatie van AI voor analyse van satellietbeelden voor geospatiale inlichtingen en aardobservatie.
Aanvallen via Screen Capture en Computer-Use AI
Technieken voor het aanvallen van AI-systemen die schermopnames verwerken, waaronder computer-use-agents, schermlees-assistenten en geautomatiseerde UI-testsystemen.
Screenshot- en UI-injectieaanvallen
Prompts injecteren via screenshots en UI-elementen die worden verwerkt door computer-use-AI-agents.
Injectie van gebarentaal en gebaren
Het exploiteren van herkenningsmodellen voor gebarentaal en gebaren via adversariële fysieke gebaren en gemodificeerde inputs.
Steganografische prompt-injectie
Het verbergen van prompt-injectie-payloads met behulp van steganografische technieken in afbeeldingen en audio.
Adversariële aanvallen op tekst-naar-afbeelding-modellen
Het begrijpen en evalueren van adversariële aanvallen op tekst-naar-afbeelding-generatiemodellen, waaronder promptmanipulatie voor het omzeilen van veiligheid, concept-erasure-aanvallen, adversariële verstoring van guidance en membership inference op trainingsdata.
Typografie-gebaseerde prompt-injectie
Het uitbuiten van tekstweergave in afbeeldingen om prompt-injectie-payloads af te leveren via typografieherkenning in VLM's.
Video Model Attacks
Beveiliging van modellen voor videobegrip, frame-level versus temporele aanvallen, hoe videomodellen sequenties verwerken, en het volledige overzicht van het aanvalsoppervlak.
Exploitatie van video-begripmodellen
Aanvallen op modellen voor video-captioning, video-Q&A en actieherkenning met adversariële video's die misclassificatie of instructie-injectie veroorzaken.
Video Frame Injection
Het injecteren van adversariële content in videoframes die worden verwerkt door AI-modellen voor videobegrip.
Video Temporal Frame Injection
Het injecteren van adversariële frames op specifieke temporele posities in videostreams die worden verwerkt door modellen voor videobegrip.
Aanvallen op modellen voor videobegrip
Technieken om AI-systemen voor videobegrip aan te vallen via frame injection, temporele manipulatie en adversariële videogeneratie gericht op modellen zoals Gemini 2.5 Pro.
Aanvallen op vision-language-modellen
Uitgebreide technieken voor het aanvallen van vision-language-modellen waaronder GPT-4V, Claude vision en Gemini, met adversariële afbeeldingen, typografische exploits en multimodale jailbreaks.
VLM-architectuur & vision-language-alignment
Diepgaande verkenning van VLM-architecturen waaronder CLIP, SigLIP en vision-transformers. Hoe afbeeldingspatches tokens worden, alignment-training en waar misalignment uitbuitbare gaten creëert.
Op afbeeldingen gebaseerde prompt-injectie
Technieken om tekstinstructies in afbeeldingen in te bedden om VLM's te manipuleren, waaronder steganografische injectie, zichtbare-tekstaanvallen en QR-code-exploitatie.
Aanvallen op vision-language-modellen
Uitgebreid overzicht van het VLM-aanvalsoppervlak, hoe vision-encoders verbinding maken met taalmodellen, en waarom multimodale systemen nieuwe injectievectoren creëren.
VLM-specifiek jailbreaken
Jailbreak-technieken die de vision-modaliteit uitbuiten, waaronder afbeelding-tekst-inconsistentie-aanvallen, visuele veiligheidsbypass en cross-modale jailbreak-strategieën.
Multimodale tekst-injectievectoren
Adversariële tekstinstructies injecteren via niet-tekstuele modaliteiten, waaronder afbeeldingen met ingebedde tekst, audiotranscriptie en documentparsing.
Audio prompt injection
Injecting adversarial instructions through audio inputs to speech-to-text and multimodal models, exploiting the audio channel as an alternative injection vector.
Cross-modale confusie
Confusing multimodal AI models by sending conflicting or complementary signals across different input modalities to bypass safety mechanisms and exploit fusion weaknesses.
Op afbeeldingen gebaseerde prompt injection (aanval-walkthrough)
Embedding text instructions in images that vision models read, enabling prompt injection through the visual modality to bypass text-only input filters and safety mechanisms.
Multi-image chaining
Chaining prompt injection payloads across multiple images in a conversation to deliver complex attacks that evade per-image content filters and build injection context progressively.
Walkthrough van multimodale documentaanvallen
Combine visual and textual injection in documents processed by multimodal LLM applications.
Walkthrough van multimodale image-injectie
Step-by-step walkthrough of embedding adversarial prompts in images for vision model exploitation.
OCR-gebaseerde aanvallen
Exploiting Optical Character Recognition processing pipelines to inject adversarial text into AI systems, targeting the gap between what OCR extracts and what humans see.
PDF-documentinjectie
Injecting adversarial prompts through PDF documents processed by AI systems, exploiting document parsing pipelines to deliver payloads through text layers, metadata, and embedded objects.
QR-code-injectie
QR-codes gebruiken als prompt-injectievectoren tegen vision-language-modellen, waarbij adversarial instructies worden gecodeerd in machinaal leesbare formaten die modellen decoderen en volgen.
Aflevering van steganografische payloads
Hiding prompt injection payloads in images using steganographic techniques, delivering adversarial instructions through pixel-level modifications invisible to human observers.
Typografie-injectie in afbeeldingen
Using rendered text with specific fonts, styles, and typographic techniques in images to inject prompts into vision-language models while evading detection.
Injectie via videoframes (aanval-walkthrough)
Embedding prompt injection payloads in specific video frames to attack multimodal models that process video content, exploiting temporal and visual channels simultaneously.
Walkthrough van een aanval op een vision-model
Attack vision-language models through adversarial images with embedded text, perturbations, and visual trojans.
Walkthrough: injection via afbeeldingssteganografie
Walkthrough of hiding prompt injection payloads in images using steganographic techniques for vision model attacks.