跳至主要內容
redteams
.ai
搜尋...
主題
詞彙表
部落格
ATT&CK 導覽器
挑戰
繁體中文
Loading...
所有標籤
#
misalignment
標記為「misalignment」的 1 篇文章
錯誤對齊的模型生物
刻意建構錯誤對齊的模型以供研究:方法論、威脅模型實例化、實驗框架,以及模型生物對於 AI 安全失敗所揭示的洞見。
model-organisms
misalignment
alignment-research
threat-models
ai-safety
進階