# research

59 artikelengetagd met “research”

Oefenexamen 3: Expert Red Team

Oefenexamen van 25 vragen op expertniveau over onderzoekstechnieken, automatisering, fine-tuning-aanvallen, toeleveringsketenbeveiliging en incidentrespons.

practice-examexpertresearchautomationfine-tuningsupply-chainincident-response

Expert

Oefenexamen onderzoek aan de grens

Practice exam covering alignment faking, sleeper agents, reasoning model attacks, and mechanistic interpretability.

practice-examfrontierresearch

Expert

Studiegids gevorderde onderwerpen

Study guide covering AI security research techniques, automation, forensics, emerging attack vectors, and tool development for advanced practitioners.

study-guideadvancedresearchautomationforensics

Gemiddeld

Oktober 2026: DEF CON AI Village-uitdaging

Reproduce and extend attacks from AI Village talks and workshops, building on published research to develop practical exploitation techniques.

# research

Oefenexamen 3: Expert Red Team

Oefenexamen onderzoek aan de grens

Studiegids gevorderde onderwerpen

Oktober 2026: DEF CON AI Village-uitdaging

Collaboratieve onderzoeksprojecten

Onderzoekssprint: nieuwe injectietechnieken

CTF najaar 2026: geavanceerd aanvalsonderzoek

Onderzoeksuitdaging: interpreteerbaarheid van aanvallen

Onderzoeksuitdaging: cross-model transfer

Geavanceerde verdedigingstechnieken

Het probleem dat de aanvaller als tweede zet

Chain-of-Thought-Betrouwbaarheidsaanvallen

Culturele alignment-hiaten in veiligheidstraining

Frontier Research

Jailbreaken via Persona Engineering

Model collapse bij recursieve training

Onderzoek naar misleiding in multi-agentsystemen

Veiligheidsdegradatie na deployment

Onderzoek naar certificering van prompt-robuustheid

Kwantisatie en veiligheids-alignment

Jailbreaks van reasoning-modellen

RL-gebaseerde jailbreak-optimalisatie

De Safety Tax: Prestatie-impact van veiligheidstraining

Onderzoek naar universele adversariële triggers

Adaptieve aanvallen tegen veiligheidstraining

Onderzoek naar beperkingen van constitutional AI

Opkomende misleiding in AI-systemen

Interpreteerbaarheidsgestuurd aanvalsontwerp

Beveiligingsonderzoek naar lange contextvensters

Verlies van veiligheid tijdens modeldistillatie

Onderzoek naar de veiligheid van multimodaal redeneren

Probing classifiers voor veiligheidsanalyse

Specification gaming in AI-systemen

Onderzoek naar aanvallen met synthetische persona's

AI-risico's bij farmaceutische geneesmiddelenontwikkeling

Certificering van adversarial robuustheid

Onderzoek naar attention-manipulatie

Cross-architectuur transfer van injection

Onderzoek naar cross-linguale transfer van injection

Verdediging-bewust ontwerp van payloads

Verdediging-geïnformeerd ontwerp van injection

Formele verificatie van injection-verdedigingen

Injection-onderzoek

Methodologie voor injection-benchmarking

Onderzoek naar injection-detectie

Injection in reasoning-modellen

Schaalwetten voor injection

Taxonomie van het injection-aanvalsoppervlak

Onderzoek naar de overdraagbaarheid van injection

Onderzoek naar multi-agent-injectie

Nieuwe injectieklassen

Onderzoek naar injectie in de semantische ruimte

Temporele dynamiek van injectiesucces

Lab: onderzoek naar nieuwe jailbreaks

Lab: methodologie voor kwetsbaarheidsonderzoek

Aanvallen via de audiomodaliteit

Many-shot jailbreaking

OSINT voor AI-redteaming

Volledige opdracht: AI-systeem voor juridisch onderzoek

# research

Oefenexamen 3: Expert Red Team

Oefenexamen onderzoek aan de grens

Studiegids gevorderde onderwerpen

Oktober 2026: DEF CON AI Village-uitdaging

Collaboratieve onderzoeksprojecten

Onderzoekssprint: nieuwe injectietechnieken

CTF najaar 2026: geavanceerd aanvalsonderzoek

Onderzoeksuitdaging: interpreteerbaarheid van aanvallen

Onderzoeksuitdaging: cross-model transfer

Geavanceerde verdedigingstechnieken

Het probleem dat de aanvaller als tweede zet

Chain-of-Thought-Betrouwbaarheidsaanvallen

Culturele alignment-hiaten in veiligheidstraining

Frontier Research

Jailbreaken via Persona Engineering

Model collapse bij recursieve training

Onderzoek naar misleiding in multi-agentsystemen

Veiligheidsdegradatie na deployment

Onderzoek naar certificering van prompt-robuustheid