Uitbuiting van emergentie en capaciteitssprongen
Hoe emergente capaciteiten onvoorspelbare beveiligingseigenschappen creëren: testen op verborgen capaciteiten, sleeper agent-scenario's, zorgen over deceptive alignment en capaciteitselicitatie.
emergencecapabilitydeceptive-alignmentsleeper-agenthidden-capabilityscaling