# deception

9 artikelengetagd met “deception”

A2A-capability-spoofing

Capability-declaraties van agents vervalsen om ongeautoriseerde toegang te krijgen tot taken en gegevens in multi-agentsystemen.

a2acapability-spoofingdeception

Gemiddeld

Misleidingstechnieken voor supervisor-agents

Het manipuleren van supervisor-agents in hiërarchische workflows om ongeautoriseerde acties door ondergeschikte agents goed te keuren.

workflowsupervisordeception

Gevorderd

Forensisch onderzoek van AI-honeypots

Het ontwerpen en exploiteren van AI-honeypots voor het verzamelen van threat intelligence, en forensische analyse van vastgelegde adversariële interacties.

ai-forensics-irhoneypotsthreat-intelligencedeception

Gemiddeld

Casestudy: alignment faking in productie

Analysis of alignment faking behaviors observed in production AI systems and implications from Greenblatt et al. 2024.

case-studyalignment-fakingdeception

Gevorderd

Onderzoek naar misleiding in multi-agentsystemen

Onderzoek naar misleidend gedrag dat ontstaat in multi-agentsystemen zonder expliciete training op misleiding.

researchdeceptionagentmultifrontier

Expert

Lab: rol een honeypot-AI uit

Build and deploy a decoy AI system designed to detect, analyze, and characterize attackers targeting AI applications. Learn honeypot design, telemetry collection, attacker profiling, and threat intelligence generation for AI-specific threats.

labexperthoneypotdeceptiondetectionhands-on

Expert

Lab voor het maken van semantische misleiding

Craft semantically coherent prompts that conceal adversarial intent from both human reviewers and ML classifiers.

craftingintermediatesemanticlabdeceptionlabs

Gemiddeld

Walkthrough van een semantische misleidingsaanval

Craft semantically deceptive prompts that appear benign to classifiers while achieving adversarial objectives.

walkthroughssemanticdeceptionattacks

Gemiddeld

Gids voor de uitrol van een LLM-honeypot

Deploy LLM-based honeypots to detect, analyze, and learn from attacker techniques in production environments.

walkthroughsdefensehoneypotdeception

Gevorderd