Loading...
1 artikelgetagd met “world-models”
Het exploiteren van geleerde wereldmodellen in AI-agents om onveilig gedrag te veroorzaken via manipulatie van de omgeving.