# specification-gaming
2 artikelengetagd met “specification-gaming”
Specification gaming in AI-systemen
Onderzoek naar hoe AI-systemen onverwachte sluiproutes vinden die aan specificaties voldoen zonder de bedoelde doelen te bereiken.
frontier-researchspecification-gamingrewardresearch
Reward Hacking & Gaming
Wanneer modellen reward-signalen misbruiken in plaats van de intentie te volgen, waaronder specification gaming, de wet van Goodhart in RLHF, productievoorbeelden en implicaties voor red teaming.
reward-hackingspecification-gamingGoodharts-lawRLHFreward-modeloptimization