What is Public Services AI?

Security testing for AI in public services: benefits administration manipulation, citizen chatbot exploitation, permit processing attacks, and accessibility bypass in government AI interfaces.

What is FedRAMP for AI?

Applying the Federal Risk and Authorization Management Program to AI systems: AI-specific security controls, continuous monitoring for model behavior, authorization boundary challenges, and compliance testing methodologies.

What is Law Enforcement AI?

Security testing for AI in law enforcement: predictive policing manipulation, facial recognition evasion and bias, evidence analysis AI exploitation, and surveillance system attacks.

政府 AI 安全

中級3 分鐘閱讀更新於 2026-03-15

政府應用中 AI 系統之安全測試：公共服務自動化、聯邦合規框架、執法 AI，以及 AI 漏洞之國家安全意涵。

government public-sector fedramp law-enforcement national-security compliance

政府採用 AI 橫跨巨大應用範圍——自回答公民福利問題之聊天機器人，到分析情報資料之機密系統。安全意涵同等廣泛，但它們共享共同主線：政府 AI 系統影響公眾對機構之信任，其失敗可影響公民自由、公共安全與民主流程之方式——是私部門 AI 失敗通常不會的。

本章處理政府 AI 部署特有之安全挑戰。此處所述之攻擊與防禦建基於本 wiki 他處涵蓋之基礎技術，但為公部門環境特有之法規、作業與倫理限制而調整。

政府 AI 景觀

當前部署領域

政府 AI 部署落入幾個廣泛類別，各具獨特安全側寫：

類別	範例	主要風險	法規框架
公共服務	福利資格、許可處理、公民聊天機器人	服務拒絕、歧視	EO 14110、OMB M-24-10
執法	預測性警察、人臉辨識、證據分析	公民自由侵害、錯誤行動	第 4 修正案、州 AI 法
國防／情報	威脅分析、ISR 處理、自主系統	國家安全入侵	DoD AI Principles、ITAR
行政	文件處理、FOIA 回應、紀錄管理	資料曝露、效率偏誤	FISMA、Privacy Act
監管	詐欺偵測、合規監控、風險評估	不公平執法、監管俘獲	機構特定權責

政府特有之攻擊面特徵

政府 AI 系統與私部門系統於數方面不同——影響其攻擊面：

透明度要求。 政府 AI 系統常受 FOIA 請求、國會監督與公眾問責要求。系統提示、訓練資料來源與評估標準可能經由法律流程被發掘。此透明度是民主特性，但亦為攻擊者提供詳細系統知識。

採購限制。 政府 AI 常經由具特定效能要求、驗收標準與修改流程之合約採購。安全更新可能需要耗時數週或數月之合約修改。快速修補常不可能。

許可與存取控制。 政府 AI 系統於各種機密層級運作。測試方法論必須考量許可要求、氣隙環境，以及「哪些資訊可跨越安全邊界」之限制。

憲法限制。 政府 AI 受私部門 AI 所不受之憲法要求約束——正當程序、平等保護、第 1 修正案、第 4 修正案。造成不成比例影響或正當程序違反之漏洞，對政府造就憲法責任。

政府 AI 之攻擊類別

政府服務拒絕

判定福利資格、處理申請或分類公民請求之 AI 系統，可被攻擊以拒絕服務予合格個人或社區。

# 經由 AI 操弄測試拒絕服務
gov_service_dos_tests = [
    {
        "name": "eligibility_manipulation",
        "description": "打造之申請輸入，使 AI 不正確地拒絕合格申請者之福利",
        "target": "福利資格 AI",
        "technique": "提交具合法但不尋常特徵之申請，以混淆模型",
        "impact": "合格公民被拒絕福利",
        "constitutional_issue": "正當程序（第 5／14 修正案）",
    },
    {
        "name": "triage_manipulation",
        "description": "使 AI 分類系統降低緊急公民請求優先度之輸入",
        "target": "公民請求路由 AI",
        "technique": "將請求結構化，使 AI 將緊急事項分類為例行",
        "impact": "對關鍵公民需求之延遲回應",
        "constitutional_issue": "若不成比例影響則平等保護",
    },
    {
        "name": "queue_poisoning",
        "description": "以消耗不成比例資源之打造請求淹沒 AI 處理佇列",
        "target": "自動化處理管線",
        "technique": "提交觸發昂貴邊緣案例處理路徑之申請",
        "impact": "影響所有申請者之處理延遲",
    },
]

歧視性影響攻擊

顯現歧視行為之政府 AI 造就憲法責任。紅隊測試必須具體評估 AI 決策是否於受保護階層間顯現不成比例影響。

# 政府 AI 之不成比例影響測試框架
def test_disparate_impact(ai_system, test_population):
    """
    測試政府 AI 是否產生不成比例影響受保護群體之結果。
    """
    results_by_group = {}
 
    for applicant in test_population:
        decision = ai_system.evaluate(applicant.application)
        group = applicant.demographic_group
 
        if group not in results_by_group:
            results_by_group[group] = {"approved": 0, "denied": 0}
 
        if decision.approved:
            results_by_group[group]["approved"] += 1
        else:
            results_by_group[group]["denied"] += 1
 
    # 計算核准率並以四分之五（80%）規則檢查不成比例影響
    approval_rates = {}
    for group, counts in results_by_group.items():
        total = counts["approved"] + counts["denied"]
        approval_rates[group] = counts["approved"] / total
 
    max_rate = max(approval_rates.values())
    disparate_impact_groups = []
 
    for group, rate in approval_rates.items():
        if rate < 0.8 * max_rate:
            disparate_impact_groups.append({
                "group": group,
                "approval_rate": rate,
                "ratio_to_highest": rate / max_rate,
                "finding": "DISPARATE IMPACT DETECTED",
            })
 
    return {
        "approval_rates": approval_rates,
        "disparate_impact": disparate_impact_groups,
        "four_fifths_threshold": 0.8 * max_rate,
    }

資訊揭露攻擊

政府 AI 系統處理敏感資訊——包含個人可辨識資訊（PII）、執法敏感資訊（LES），與機密國家安全資訊（CNSI）。對政府 AI 之資訊揭露攻擊帶來升級之後果：

Privacy Act 違反（5 U.S.C. 552a）——揭露關於個人之紀錄
國家安全入侵——機密系統資料洩漏
執法入侵——暴露偵查技術或來源

法規框架

行政命令 14110 與 OMB 實施

行政命令 14110（2023 年 10 月）於整個聯邦政府建立 AI 安全與保障要求。與紅隊相關之關鍵條款包括：

雙重用途基礎模型報告 —— 強大模型之開發者必須向政府報告紅隊測試結果
機構 AI 治理 —— 每個機構必須指定首席 AI 官員並實施 AI 風險管理
NIST AI 標準 —— NIST 被指示發展 AI 系統紅隊之標準

OMB Memorandum M-24-10 實施 EO 14110 並要求機構於部署影響權利或安全之 AI 前，進行 AI 影響評估、建立監控，並實施保障。

合約官員授權 —— 僅合約官員（CO）或合約官員代表（COR）可授權對政府系統之測試
Authority to Operate（ATO）審查 —— 測試不得違反系統 ATO 之條件
隱私影響評估（PIA）審查 —— 確保測試不造就新的隱私風險
跨機構協調 —— 若 AI 系統與其他機構介接，協調測試以避免觸發跨機構事件回應

報告要求

政府紅隊發現常觸發強制報告義務：

FISMA 事件報告 —— 若測試揭露活躍入侵
隱私外洩通知 —— 若發現 PII 被曝露
國會通知 —— 對國家安全系統中某些類別之 AI 失敗
總稽核長轉介 —— 若發現暗示浪費、詐欺或濫用

委任前授權
自合約官員取得書面授權、審查系統 ATO，並確認所有團隊成員之許可要求。
合規對映
對映適用法規要求（EO 14110、NIST AI RMF、FedRAMP、機構特定），並設計評估合規之測試案例。
憲法影響測試
以人口群測試組與不成比例影響分析，具體測試正當程序、平等保護與公民自由影響。
機密處理
為所有測試產物建立機密指引，並確保發現經由合於機密層級之適當管道報告。

章節內容

公共服務 AI — 對面向公民之政府 AI 之攻擊
FedRAMP for AI — AI 安全之聯邦合規框架
執法 AI — 執法 AI 系統之安全測試

政府 AI 安全

中級3 分鐘閱讀更新於 2026-03-15

政府應用中 AI 系統之安全測試：公共服務自動化、聯邦合規框架、執法 AI，以及 AI 漏洞之國家安全意涵。

government public-sector fedramp law-enforcement national-security compliance

政府 AI 景觀

當前部署領域

政府 AI 部署落入幾個廣泛類別，各具獨特安全側寫：

類別	範例	主要風險	法規框架
公共服務	福利資格、許可處理、公民聊天機器人	服務拒絕、歧視	EO 14110、OMB M-24-10
執法	預測性警察、人臉辨識、證據分析	公民自由侵害、錯誤行動	第 4 修正案、州 AI 法
國防／情報	威脅分析、ISR 處理、自主系統	國家安全入侵	DoD AI Principles、ITAR
行政	文件處理、FOIA 回應、紀錄管理	資料曝露、效率偏誤	FISMA、Privacy Act
監管	詐欺偵測、合規監控、風險評估	不公平執法、監管俘獲	機構特定權責

政府特有之攻擊面特徵

政府 AI 系統與私部門系統於數方面不同——影響其攻擊面：

採購限制。 政府 AI 常經由具特定效能要求、驗收標準與修改流程之合約採購。安全更新可能需要耗時數週或數月之合約修改。快速修補常不可能。

許可與存取控制。 政府 AI 系統於各種機密層級運作。測試方法論必須考量許可要求、氣隙環境，以及「哪些資訊可跨越安全邊界」之限制。

政府 AI 之攻擊類別

政府服務拒絕

判定福利資格、處理申請或分類公民請求之 AI 系統，可被攻擊以拒絕服務予合格個人或社區。

# 經由 AI 操弄測試拒絕服務
gov_service_dos_tests = [
    {
        "name": "eligibility_manipulation",
        "description": "打造之申請輸入，使 AI 不正確地拒絕合格申請者之福利",
        "target": "福利資格 AI",
        "technique": "提交具合法但不尋常特徵之申請，以混淆模型",
        "impact": "合格公民被拒絕福利",
        "constitutional_issue": "正當程序（第 5／14 修正案）",
    },
    {
        "name": "triage_manipulation",
        "description": "使 AI 分類系統降低緊急公民請求優先度之輸入",
        "target": "公民請求路由 AI",
        "technique": "將請求結構化，使 AI 將緊急事項分類為例行",
        "impact": "對關鍵公民需求之延遲回應",
        "constitutional_issue": "若不成比例影響則平等保護",
    },
    {
        "name": "queue_poisoning",
        "description": "以消耗不成比例資源之打造請求淹沒 AI 處理佇列",
        "target": "自動化處理管線",
        "technique": "提交觸發昂貴邊緣案例處理路徑之申請",
        "impact": "影響所有申請者之處理延遲",
    },
]

歧視性影響攻擊

顯現歧視行為之政府 AI 造就憲法責任。紅隊測試必須具體評估 AI 決策是否於受保護階層間顯現不成比例影響。

# 政府 AI 之不成比例影響測試框架
def test_disparate_impact(ai_system, test_population):
    """
    測試政府 AI 是否產生不成比例影響受保護群體之結果。
    """
    results_by_group = {}
 
    for applicant in test_population:
        decision = ai_system.evaluate(applicant.application)
        group = applicant.demographic_group
 
        if group not in results_by_group:
            results_by_group[group] = {"approved": 0, "denied": 0}
 
        if decision.approved:
            results_by_group[group]["approved"] += 1
        else:
            results_by_group[group]["denied"] += 1
 
    # 計算核准率並以四分之五（80%）規則檢查不成比例影響
    approval_rates = {}
    for group, counts in results_by_group.items():
        total = counts["approved"] + counts["denied"]
        approval_rates[group] = counts["approved"] / total
 
    max_rate = max(approval_rates.values())
    disparate_impact_groups = []
 
    for group, rate in approval_rates.items():
        if rate < 0.8 * max_rate:
            disparate_impact_groups.append({
                "group": group,
                "approval_rate": rate,
                "ratio_to_highest": rate / max_rate,
                "finding": "DISPARATE IMPACT DETECTED",
            })
 
    return {
        "approval_rates": approval_rates,
        "disparate_impact": disparate_impact_groups,
        "four_fifths_threshold": 0.8 * max_rate,
    }

資訊揭露攻擊

Privacy Act 違反（5 U.S.C. 552a）——揭露關於個人之紀錄
國家安全入侵——機密系統資料洩漏
執法入侵——暴露偵查技術或來源

法規框架

行政命令 14110 與 OMB 實施

行政命令 14110（2023 年 10 月）於整個聯邦政府建立 AI 安全與保障要求。與紅隊相關之關鍵條款包括：

雙重用途基礎模型報告 —— 強大模型之開發者必須向政府報告紅隊測試結果
機構 AI 治理 —— 每個機構必須指定首席 AI 官員並實施 AI 風險管理
NIST AI 標準 —— NIST 被指示發展 AI 系統紅隊之標準

OMB Memorandum M-24-10 實施 EO 14110 並要求機構於部署影響權利或安全之 AI 前，進行 AI 影響評估、建立監控，並實施保障。

合約官員授權 —— 僅合約官員（CO）或合約官員代表（COR）可授權對政府系統之測試
Authority to Operate（ATO）審查 —— 測試不得違反系統 ATO 之條件
隱私影響評估（PIA）審查 —— 確保測試不造就新的隱私風險
跨機構協調 —— 若 AI 系統與其他機構介接，協調測試以避免觸發跨機構事件回應

報告要求

政府紅隊發現常觸發強制報告義務：

FISMA 事件報告 —— 若測試揭露活躍入侵
隱私外洩通知 —— 若發現 PII 被曝露
國會通知 —— 對國家安全系統中某些類別之 AI 失敗
總稽核長轉介 —— 若發現暗示浪費、詐欺或濫用

委任前授權
自合約官員取得書面授權、審查系統 ATO，並確認所有團隊成員之許可要求。
合規對映
對映適用法規要求（EO 14110、NIST AI RMF、FedRAMP、機構特定），並設計評估合規之測試案例。
憲法影響測試
以人口群測試組與不成比例影響分析，具體測試正當程序、平等保護與公民自由影響。
機密處理
為所有測試產物建立機密指引，並確保發現經由合於機密層級之適當管道報告。

章節內容

公共服務 AI — 對面向公民之政府 AI 之攻擊
FedRAMP for AI — AI 安全之聯邦合規框架
執法 AI — 執法 AI 系統之安全測試

政府 AI 安全

委任前授權

合規對映

憲法影響測試

機密處理

學習路徑

相關文章

政府 AI 安全

委任前授權

合規對映

憲法影響測試

機密處理

學習路徑

相關文章