# transfer
標記為「transfer」的 14 篇文章
Cross-Model Transfer 評估
評估 of 攻擊 transferability 跨 model families、versions、providers。
assessmenttransfercross-model
研究挑戰:跨模型轉移
研究導向挑戰,探討對抗技術跨模型家族的可轉移性,並發表成果。
communitychallengeresearchtransfer
知識蒸餾攻擊
透過蒸餾攻擊與以查詢為基礎的擷取方式竊取教師模型的知識。
data-trainingdistillationtransferextraction
多任務微調攻擊
利用多任務微調在安全關鍵與效用導向訓練目標之間製造干擾。
fine-tuningmulti-tasktransferattacks
跨語言轉移的安全性
跨語言能力轉移的安全影響,包括跨語言越獄與安全轉移失敗。
frontier-researchcross-lingualtransfersecurity
跨架構注入轉移
研究注入技術如何跨越模型架構轉移,以及哪些架構特性決定轉移性。
researchinjectiontransferarchitecture
Cross-Model Transfer Attacks
開發 attacks on open-source models that transfer to closed-source commercial APIs.
labstransfercross-modeladvanced
Cross-模型 GCG 遷移 Attacks
Generate adversarial suffixes on open-source models與test their transferability to commercial APIs.
labsgcgcross-modeltransferadvanced
Cross-Architecture 遷移 實驗室
發展attacks on one model architecture that reliably transfer to fundamentally different architectures.
architecturecrosstransferlabexpertlabs
跨模態傳遞攻擊實作指南
在多模態模型中,透過一個輸入通道攻擊另一模態處理流程的對抗性輸入技術,涵蓋圖像轉文字、音訊轉行動,以及文件轉工具的攻擊鏈。
multimodalcross-modaltransferattack-chainmodality
跨模態傳遞攻擊
攻擊者如何將對抗樣本從一個模態轉移到另一個模態,以提升攻擊的通用性與可轉移性。
multimodalcross-modaltransferattacks
通用對抗性觸發
發掘並部署能跨多個大型語言模型家族可靠覆寫安全對齊的通用對抗性觸發序列,包含基於梯度的搜尋、轉移攻擊與防禦規避。
prompt-injectionuniversal-triggeradversarialgcgtransfer
通用越獄技術
跨多個模型與供應商轉移的越獄技術分析。
prompt-injectionuniversaljailbreaktransfer
通用後綴攻擊
跨模型與提示詞轉移的通用對抗性後綴的研究與實務。
prompt-injectionuniversal-suffixgcgtransfer