# theory
2 artikelengetagd met “theory”
Theorie van misleidende alignment
Theoretische frameworks voor het begrijpen en voorspellen van misleidende alignment in geavanceerde AI-systemen.
frontier-researchdeceptive-alignmenttheorymesa-optimization
Formele modellen van prompt-injectie
Theoretische kaders voor het formeel modelleren van en redeneren over kwetsbaarheden voor prompt-injectie.
frontier-researchformal-modelsprompt-injectiontheory