# deception
9 artikelengetagd met “deception”
A2A-capability-spoofing
Capability-declaraties van agents vervalsen om ongeautoriseerde toegang te krijgen tot taken en gegevens in multi-agentsystemen.
Misleidingstechnieken voor supervisor-agents
Het manipuleren van supervisor-agents in hiërarchische workflows om ongeautoriseerde acties door ondergeschikte agents goed te keuren.
Forensisch onderzoek van AI-honeypots
Het ontwerpen en exploiteren van AI-honeypots voor het verzamelen van threat intelligence, en forensische analyse van vastgelegde adversariële interacties.
Casestudy: alignment faking in productie
Analysis of alignment faking behaviors observed in production AI systems and implications from Greenblatt et al. 2024.
Onderzoek naar misleiding in multi-agentsystemen
Onderzoek naar misleidend gedrag dat ontstaat in multi-agentsystemen zonder expliciete training op misleiding.
Lab: rol een honeypot-AI uit
Build and deploy a decoy AI system designed to detect, analyze, and characterize attackers targeting AI applications. Learn honeypot design, telemetry collection, attacker profiling, and threat intelligence generation for AI-specific threats.
Lab voor het maken van semantische misleiding
Craft semantically coherent prompts that conceal adversarial intent from both human reviewers and ML classifiers.
Walkthrough van een semantische misleidingsaanval
Craft semantically deceptive prompts that appear benign to classifiers while achieving adversarial objectives.
Gids voor de uitrol van een LLM-honeypot
Deploy LLM-based honeypots to detect, analyze, and learn from attacker techniques in production environments.