# emergence
標記為「emergence」的 4 篇文章
縮放定律、湧現與能力躍升
縮放定律如何預測模型效能、湧現能力為何造成不可預期的安全特性,以及沉睡能力與湧現式對齊失誤對紅隊的意涵。
scalingemergencecapabilitiesadvanced
多代理湧現的安全影響
多代理系統中湧現行為所帶來的安全風險,包括意外合作與欺騙。
frontiermulti-agentemergence
神經縮放法則的安全影響
神經縮放法則的安全意涵,包括隨規模增長而出現的能力以及相關安全屬性。
frontierscaling-lawsemergence
湧現與能力跳躍利用
湧現能力如何造就不可預測之安全屬性:測試隱藏能力、sleeper agent 情境、欺騙性對齊關切,與能力引出。
emergencecapabilitydeceptive-alignmentsleeper-agenthidden-capabilityscaling