# transformer

標記為「transformer」的 7 篇文章

大型語言模型如何運作

從安全視角理解大型語言模型——涵蓋 transformer 架構、分詞、注意力、訓練流程與安全對齊機制。

深入探討 transformer 架構——注意力、前饋層與殘差連接——從哪些元件可被利用的視角。

從安全視角理解 transformer 架構基礎：注意力、嵌入、生成如何建立可利用的特性。

Craft inputs that manipulate transformer attention patterns to prioritize adversarial content over safety instructions.

利用 transformer 注意力機制引導模型行為——涵蓋注意力稀釋、位置偏誤利用、注意力劫持與上下文視窗操控。

針對 Transformer 注意力機制的攻擊,包括注意力偏置與長上下文利用。

Hijack transformer attention mechanisms to redirect model focus toward adversarial instructions in the context.