1. 一场关于位置编码的"几何觉醒"1.1 从RoPE说起:旋转位置编码的优雅与局限1.1.1 圆上的舞蹈:RoPE如何将位置信息编码为平面旋转想象你是一位指挥家,站在舞台中央,手中的指挥棒划出一道道优美的弧线。每一个音符的位置,都被编码为指挥棒在二维平面上的一次旋转——这就是旋转位置编码(Rotary Position Embeddings, RoPE)的核心直觉。RoPE自2021年诞生以来,便以其数学上的优雅性和实践中的卓越表现,成为Transformer架构中位置编码的事实标准。RoPE的巧妙之处在于它将位置信息转化为一种几何变换:对于序列中的第mmm个位置,嵌入向量被旋转一个与mm