# harmbench
標記為「harmbench」的 7 篇文章
HarmBench:標準化紅隊評估
深入解析 HarmBench 框架之標準化紅隊評估:攻擊方法、評估管線、執行基準、結果解讀,以及跨供應商的模型安全比較。
harmbenchbenchmarkevaluationstandardized
HarmBench Custom 攻擊 Submission
Develop與evaluate custom attack methods 對抗 the HarmBench standardized evaluation framework.
labsharmbenchcustom-attacksevaluationadvanced
Your First HarmBench 評估
Run a standardized safety evaluation using the HarmBench framework 對抗 a target model.
labsharmbenchevaluationbeginner
自動化紅隊工具比較
自動化 AI 紅隊工具的完整比較,包含 PyRIT、Garak、DeepTeam、AutoRedTeamer、HarmBench 與 ART,附詳細能力矩陣、優勢分析與使用案例建議。
referencetoolscomparisonpyritgarakdeepteamautoredteamerharmbenchart
HarmBench 自訂行為集
以自訂行為規格擴充 HarmBench,進行領域特定的漏洞測試。
customtoolsbehaviorsharmbenchwalkthroughs
HarmBench 評測詳解
使用 HarmBench 框架執行標準化攻擊評測並解讀結果。
walkthroughsharmbenchevaluationbenchmark
HarmBench Evaluation Framework 導覽
Complete walkthrough of the HarmBench evaluation framework: installation, running standardized benchmarks against models, interpreting results, creating custom behavior evaluations, and comparing model safety across versions.
harmbenchevaluationbenchmarkssafetyred-team-automationwalkthrough