# moe
標記為「moe」的 8 篇文章
專家混合 (MoE) 利用
針對專家混合架構的攻擊,包括專家路由操弄與負載不平衡利用。
frontiermoerouting
MoE Routing 利用 實驗室
利用 Mixture-of-Experts routing mechanisms to selectively activate or suppress expert modules in MoE models.
routingmoeexploitationlabexpertlabs
MoE Routing 利用
利用 Mixture-of-Experts routing mechanisms to activate specific expert networks for adversarial purposes.
labsmoeroutingexploitationexpert
GPT-4 / GPT-4o 概觀
OpenAI GPT-4 與 GPT-4o 模型的架構概觀,涵蓋傳聞中的 Mixture of Experts 設計、能力、API 介面,以及對紅隊具意義的安全相關特性。
gpt-4openaiarchitecturemoered-teaming
Mixtral MoE 的利用
Mixtral 與其他專家混合 (MoE) 模型特有的攻擊面與安全考量。
model-deep-divesmixtralmoerouting
Mistral 與 Mixtral
Mistral 與 Mixtral 模型之安全分析,包括 Mixture of Experts 攻擊、稀疏啟動攻擊、最小化安全對齊之意涵,以及開源權重部署風險。
mistralmixtralmoesparse-activationopen-weightred-teaming
架構層級攻擊
鎖定模型架構最佳化的攻擊——涵蓋量化利用、蒸餾攻擊、KV 快取攻擊、MoE 路由操控與上下文視窗利用。
architecturequantizationdistillationkv-cachemoecontext-window
MoE 路由操弄
攻擊 Mixture-of-Experts 路由:專家選擇操弄、負載平衡利用、安全專家繞過,以及路由感知對抗輸入。
moemixture-of-expertsroutingexpert-selectionload-balancingarchitecture