What is Hugging Face Hub 安全?

Hugging Face Hub 之攻擊面分析：惡意模型上傳、pickle 反序列化 exploit、模型卡操弄、信任訊號限制、gated 模型繞過，與社群驅動之信任利用。

What is 模型 Signing and Provenance?

Cryptographic signing for ML models: Sigstore for ML artifacts, cosign for model weights, SLSA framework applied to ML pipelines, supply chain levels for model provenance, and practical implementation of model artifact verification.

What is Registry-Specific 攻擊s?

攻擊 techniques targeting model registries: version confusion, dependency resolution exploitation, namespace squatting, model aliasing attacks, and practical exploitation of registry trust models.

模型登錄安全（LLMOps 安全）

中級3 分鐘閱讀更新於 2026-03-15

模型登錄之安全概觀：登錄如何管理模型生命週期、存取控制模型、信任邊界，以及儲存與散發不透明 ML 產物的獨特安全挑戰。

model-registry artifact-management access-control trust-boundaries ml-security model-lifecycle

模型登錄安全

模型登錄是模型開發與生產部署之間的守門人。它們儲存版本化的模型產物、管理生命週期階段，並提供部署管線拉取服務於終端使用者之模型的介面。遭入侵的登錄是部署惡意模型最直接的途徑——攻擊者無需入侵訓練管線、投毒資料、或操弄部署基礎設施，只需替換該產物即可。

模型登錄儲存什麼

模型登錄不只是檔案儲存庫。它與不透明二進位產物一同管理結構化 metadata。

產物組成

元件	內容	安全相關性
模型權重	序列化張量（safetensors、pickle、GGUF）	替換之主要目標；可能含可執行程式碼
組態	架構參數、tokenizer 組態、生成預設值	定義模型行為；竄改可改變輸出
Tokenizer	詞彙檔、merges、特殊 token、自訂程式碼	自訂 tokenizer 可執行任意程式碼
Adapters	LoRA 權重、prefix tuning 參數	替換的較小目標；行為修改
Metadata	模型卡、授權、訓練細節、效能指標	信任訊號；操弄影響採用決策

生命週期管理

登錄經由生命週期階段管理模型，該階段決定哪個版本服務生產流量：

開發 -> 預備 -> 生產 -> 封存

每次轉換代表一次信任決策。整個系統的安全性取決於這些轉換是否經過適當授權與驗證。

信任問題

產物的不透明性

模型登錄的根本安全挑戰在於主要產物——模型權重——是不透明的。你無法檢查權重檔案以判定模型將做什麼。不同於套件登錄中的原始碼——審查者可於部署前閱讀程式碼——模型權重檔案是浮點數矩陣，唯有執行時才揭示其行為。

這表示：

傳統程式碼審查無法套用於模型產物
針對模型權重的靜態分析工具尚屬起步
行為測試是主要驗證機制，且本質上不完整
含精心構造後門的投毒模型可通過標準評估基準，同時暗藏惡意行為

信任訊號及其侷限

登錄使用各種訊號表明產物可信度：

訊號	其聲稱	為何不足
下載數	熱門即意味品質	可人為灌水；熱門並不等於安全
組織徽章	由已辨識組織發布	組織帳號可能被入侵；徽章不驗證產物內容
社群讚數	使用者背書該模型	社會認同可操作，且未必代表安全審查
模型卡	記錄訓練與能力	自陳；無驗證
授權	法律使用條款	不表明安全性質
Safetensors 格式	僅序列化權重	不防範自訂程式碼、組態操弄或 adapter 投毒

可變版本——發布後可被覆寫
無強制的版本轉換審查流程
自動化「latest」標籤——永遠指向最新上傳
對誰何時更動版本記錄不足

跨租戶隔離

多租戶登錄（雲端 ML 平台、共享 Hugging Face 組織）必須於租戶間隔離模型。常見隔離失誤：

以路徑為基礎隔離之共享儲存後端（路徑穿越風險）
繞過存取控制之跨租戶產物參照
登錄存取過寬之服務帳號
被提供給錯誤租戶之快取產物

API 驗證

模式	風險
長期 API token	token 洩漏提供持久存取
無 token 範圍	token 授予完整帳號存取，而非每登錄授權
僅 Bearer 驗證	無雙向 TLS 或額外驗證
無 token 輪替	被入侵 token 無限期有效

依預期效能基準之基準評估
針對安全違規之紅隊測試
對先前模型版本之差分測試
偏誤與公平性評估

攻擊面摘要

攻擊向量	登錄元件	影響
模型替換	版本管理	惡意模型被提供給所有使用者
命名空間搶註	名稱註冊	使用者下載攻擊者之模型而非合法者
Metadata 操弄	模型卡、標籤	灌水之信任訊號誤導使用者
存取 token 竊取	API 驗證	完整登錄存取以外洩或投毒
晉升繞過	生命週期管理	未經審查之模型抵達生產
快取投毒	散發 CDN	自快取提供惡意模型
依賴混淆	產物解析	解析並部署錯誤之模型版本

防禦檢查清單

控制	實作
產物簽章	註冊前對所有模型簽章；部署前驗證
Hash 驗證	於各階段計算並驗證 SHA-256 hash
存取控制	對上傳、下載、階段轉換落實最小權限
稽核日誌	記錄所有登錄操作及其使用者身分
行為閘	晉升至生產前之自動化評估
不可變版本	防止已發布版本被覆寫
網路隔離	分離開發與生產登錄存取

模型登錄安全（LLMOps 安全）

中級3 分鐘閱讀更新於 2026-03-15

模型登錄之安全概觀：登錄如何管理模型生命週期、存取控制模型、信任邊界，以及儲存與散發不透明 ML 產物的獨特安全挑戰。

model-registry artifact-management access-control trust-boundaries ml-security model-lifecycle

模型登錄安全

模型登錄儲存什麼

模型登錄不只是檔案儲存庫。它與不透明二進位產物一同管理結構化 metadata。

產物組成

元件	內容	安全相關性
模型權重	序列化張量（safetensors、pickle、GGUF）	替換之主要目標；可能含可執行程式碼
組態	架構參數、tokenizer 組態、生成預設值	定義模型行為；竄改可改變輸出
Tokenizer	詞彙檔、merges、特殊 token、自訂程式碼	自訂 tokenizer 可執行任意程式碼
Adapters	LoRA 權重、prefix tuning 參數	替換的較小目標；行為修改
Metadata	模型卡、授權、訓練細節、效能指標	信任訊號；操弄影響採用決策

生命週期管理

登錄經由生命週期階段管理模型，該階段決定哪個版本服務生產流量：

開發 -> 預備 -> 生產 -> 封存

每次轉換代表一次信任決策。整個系統的安全性取決於這些轉換是否經過適當授權與驗證。

信任問題

產物的不透明性

這表示：

傳統程式碼審查無法套用於模型產物
針對模型權重的靜態分析工具尚屬起步
行為測試是主要驗證機制，且本質上不完整
含精心構造後門的投毒模型可通過標準評估基準，同時暗藏惡意行為

信任訊號及其侷限

登錄使用各種訊號表明產物可信度：

訊號	其聲稱	為何不足
下載數	熱門即意味品質	可人為灌水；熱門並不等於安全
組織徽章	由已辨識組織發布	組織帳號可能被入侵；徽章不驗證產物內容
社群讚數	使用者背書該模型	社會認同可操作，且未必代表安全審查
模型卡	記錄訓練與能力	自陳；無驗證
授權	法律使用條款	不表明安全性質
Safetensors 格式	僅序列化權重	不防範自訂程式碼、組態操弄或 adapter 投毒

可變版本——發布後可被覆寫
無強制的版本轉換審查流程
自動化「latest」標籤——永遠指向最新上傳
對誰何時更動版本記錄不足

跨租戶隔離

多租戶登錄（雲端 ML 平台、共享 Hugging Face 組織）必須於租戶間隔離模型。常見隔離失誤：

以路徑為基礎隔離之共享儲存後端（路徑穿越風險）
繞過存取控制之跨租戶產物參照
登錄存取過寬之服務帳號
被提供給錯誤租戶之快取產物

API 驗證

模式	風險
長期 API token	token 洩漏提供持久存取
無 token 範圍	token 授予完整帳號存取，而非每登錄授權
僅 Bearer 驗證	無雙向 TLS 或額外驗證
無 token 輪替	被入侵 token 無限期有效

依預期效能基準之基準評估
針對安全違規之紅隊測試
對先前模型版本之差分測試
偏誤與公平性評估

攻擊面摘要

攻擊向量	登錄元件	影響
模型替換	版本管理	惡意模型被提供給所有使用者
命名空間搶註	名稱註冊	使用者下載攻擊者之模型而非合法者
Metadata 操弄	模型卡、標籤	灌水之信任訊號誤導使用者
存取 token 竊取	API 驗證	完整登錄存取以外洩或投毒
晉升繞過	生命週期管理	未經審查之模型抵達生產
快取投毒	散發 CDN	自快取提供惡意模型
依賴混淆	產物解析	解析並部署錯誤之模型版本

防禦檢查清單

控制	實作
產物簽章	註冊前對所有模型簽章；部署前驗證
Hash 驗證	於各階段計算並驗證 SHA-256 hash
存取控制	對上傳、下載、階段轉換落實最小權限
稽核日誌	記錄所有登錄操作及其使用者身分
行為閘	晉升至生產前之自動化評估
不可變版本	防止已發布版本被覆寫
網路隔離	分離開發與生產登錄存取

模型登錄安全（LLMOps 安全）

學習路徑

相關文章

模型登錄安全（LLMOps 安全）

學習路徑

相關文章