# transformer
標記為「transformer」的 7 篇文章
大型語言模型如何運作
從安全視角理解大型語言模型——涵蓋 transformer 架構、分詞、注意力、訓練流程與安全對齊機制。
llmtransformerarchitecturetrainingalignmentfoundations
給攻擊者的 Transformer 架構
深入探討 transformer 架構——注意力、前饋層與殘差連接——從哪些元件可被利用的視角。
transformerattentionarchitectureintermediate
Transformer 架構基礎(安全視角)
從安全視角理解 transformer 架構基礎:注意力、嵌入、生成如何建立可利用的特性。
transformerarchitecturesecurityfoundations
Attention Pattern 操控
Craft inputs that manipulate transformer attention patterns to prioritize adversarial content over safety instructions.
labsattentionmanipulationtransformeradvanced
注意力利用
利用 transformer 注意力機制引導模型行為——涵蓋注意力稀釋、位置偏誤利用、注意力劫持與上下文視窗操控。
attentiontransformerexploit-primitivescontext-windowposition-bias
Transformer 注意力機制攻擊
針對 Transformer 注意力機制的攻擊,包括注意力偏置與長上下文利用。
model-deep-divestransformerattentionattacks
注意力劫持攻擊詳解
Hijack transformer attention mechanisms to redirect model focus toward adversarial instructions in the context.
walkthroughsattentionhijackingtransformer