本文档基于配套 Excel 文件《LSTM 完整计算过程.xlsx》编写完整拆解了单时间步、最简结构 LSTM的全流程计算逻辑包含数学公式、Excel 实现、数值计算过程、门控机制说明可直接用于 LSTM 原理学习、公式验证与手动复现。一、文档概述本文档对应的 Excel 文件实现了单时间步 LSTM 的完整前向计算核心特点所有初始参数可自由修改黄色单元格修改后所有计算结果自动更新每一步计算均保留了原生 Excel 公式可直接查看公式逻辑与计算结果采用最简 LSTM 结构单输入特征、单隐藏单元无多余复杂度适合原理学习完整覆盖 LSTM 的 3 个门控遗忘门、输入门、输出门、2 个状态更新细胞状态、隐藏状态全流程二、可修改初始参数说明Excel 文件中黄色单元格为可自由编辑的初始参数所有计算均基于这些参数完成参数详情如下表格参数名称参数符号默认值参数说明当前时刻输入值xt​0.5LSTM 当前时间步的输入特征值单维度最简结构上一时刻隐藏状态ht−1​0LSTM 上一时间步的输出隐藏状态初始时刻默认为 0上一时刻细胞状态Ct−1​0LSTM 上一时间步的长时记忆细胞状态初始时刻默认为 0遗忘门权重Wf​0.2遗忘门的权重参数控制上一时刻记忆的保留程度遗忘门偏置bf​0.1遗忘门的偏置参数用于调整门控的基础激活程度输入门权重Wi​0.3输入门的权重参数控制当前时刻新信息的写入程度输入门偏置bi​0.2输入门的偏置参数用于调整门控的基础激活程度候选细胞权重Wg​0.4候选细胞状态的权重参数用于生成当前时刻的新记忆内容候选细胞偏置bg​0.3候选细胞状态的偏置参数用于调整新记忆的基础数值输出门权重Wo​0.5输出门的权重参数控制长时记忆的输出程度输出门偏置bo​0.4输出门的偏置参数用于调整门控的基础激活程度补充说明本文档所有计算均基于上述默认值完成若修改参数可按照本文档的计算逻辑重新复现所有步骤。三、LSTM 核心分步计算详解LSTM 的前向计算分为 6 个核心步骤依次完成 3 个门控的计算、候选记忆生成、长时记忆更新、最终输出生成每一步的数学公式、Excel 实现、数值计算过程如下步骤 1遗忘门计算遗忘门是 LSTM 的第一个门控核心作用是控制上一时刻长时记忆的保留 / 遗忘程度输出值范围为 0~10 代表完全遗忘旧记忆1 代表完全保留旧记忆。数学公式ft​σ(Wf​⋅[ht−1​,xt​]bf​)其中σ 为 Sigmoid 激活函数公式为 σ(z)1e−z1​作用是将数值压缩到 0~1 区间[ht−1​,xt​] 为上一时刻隐藏状态与当前时刻输入的拼接最简结构下直接为两者的线性组合Excel 原生公式excel1/(1EXP(-(C8*C6C8*C5C9)))公式对应关系C8遗忘门权重 Wf​C6上一时刻隐藏状态 ht−1​C5当前时刻输入值 xt​C9遗忘门偏置 bf​数值计算过程拆解计算线性部分Wf​⋅[ht−1​,xt​]bf​0.2∗00.2∗0.50.100.10.10.2计算 Sigmoid 激活σ(0.2)1e−0.21​≈10.818731​≈0.549834最终计算结果ft​0.549833997312478步骤 2输入门计算输入门是 LSTM 的第二个门控核心作用是控制当前时刻新信息的写入程度输出值范围为 0~10 代表完全不写入新信息1 代表完全写入新信息。数学公式it​σ(Wi​⋅[ht−1​,xt​]bi​)Excel 原生公式excel1/(1EXP(-(C10*C6C10*C5C11)))公式对应关系C10输入门权重 Wi​C6上一时刻隐藏状态 ht−1​C5当前时刻输入值 xt​C11输入门偏置 bi​数值计算过程拆解计算线性部分Wi​⋅[ht−1​,xt​]bi​0.3∗00.3∗0.50.200.150.20.35计算 Sigmoid 激活σ(0.35)1e−0.351​≈10.704691​≈0.586618最终计算结果it​0.58661757891733步骤 3候选细胞状态计算候选细胞状态是当前时刻生成的新记忆内容核心作用是提取当前时刻输入的新特征等待写入长时记忆输出值范围为 - 1~1。数学公式gt​tanh(Wg​⋅[ht−1​,xt​]bg​)其中tanh 为双曲正切激活函数公式为 tanh(z)eze−zez−e−z​作用是将数值压缩到 - 1~1 区间适合记忆内容的归一化Excel 原生公式excelTANH(C12*C6C12*C5C13)公式对应关系C12候选细胞权重 Wg​C6上一时刻隐藏状态 ht−1​C5当前时刻输入值 xt​C13候选细胞偏置 bg​数值计算过程拆解计算线性部分Wg​⋅[ht−1​,xt​]bg​0.4∗00.4∗0.50.300.20.30.5计算 Tanh 激活tanh(0.5)e0.5e−0.5e0.5−e−0.5​≈1.648720.606531.64872−0.60653​≈0.462117最终计算结果gt​0.46211715726001步骤 4细胞状态更新长时记忆细胞状态是 LSTM 的长时记忆载体贯穿整个时间序列核心作用是保留从过去到当前的所有有效记忆是 LSTM 解决梯度消失问题的核心结构。数学公式Ct​ft​⋅Ct−1​it​⋅gt​公式逻辑第一部分 ft​⋅Ct−1​上一时刻的长时记忆经过遗忘门过滤保留有效部分第二部分 it​⋅gt​当前时刻生成的新记忆经过输入门过滤写入有效部分两者相加完成当前时刻长时记忆的更新Excel 原生公式excelD19*C7D20*D21公式对应关系D19遗忘门计算结果 ft​C7上一时刻细胞状态 Ct−1​D20输入门计算结果 it​D21候选细胞状态计算结果 gt​数值计算过程拆解计算旧记忆保留部分ft​⋅Ct−1​0.549834∗00计算新记忆写入部分it​⋅gt​0.586618∗0.462117≈0.271086两者相加得到当前时刻细胞状态00.2710860.271086最终计算结果Ct​0.271086047968026步骤 5输出门计算输出门是 LSTM 的第三个门控核心作用是控制长时记忆的输出程度输出值范围为 0~10 代表完全不输出记忆1 代表完全输出记忆。数学公式ot​σ(Wo​⋅[ht−1​,xt​]bo​)Excel 原生公式excel1/(1EXP(-(C14*C6C14*C5C15)))公式对应关系C14输出门权重 Wo​C6上一时刻隐藏状态 ht−1​C5当前时刻输入值 xt​C15输出门偏置 bo​数值计算过程拆解计算线性部分Wo​⋅[ht−1​,xt​]bo​0.5∗00.5∗0.50.400.250.40.65计算 Sigmoid 激活σ(0.65)1e−0.651​≈10.522051​≈0.657010最终计算结果ot​0.657010462673499步骤 6隐藏状态更新最终输出隐藏状态是 LSTM当前时刻的最终输出可直接用于后续的分类、回归、序列生成等任务输出值范围为 - 1~1。数学公式ht​ot​⋅tanh(Ct​)公式逻辑先对当前时刻的长时记忆 Ct​ 做 Tanh 激活将数值压缩到 - 1~1 区间再经过输出门 ot​ 过滤控制最终输出的记忆内容得到当前时刻的隐藏状态Excel 原生公式excelD23*TANH(C22)公式对应关系D23输出门计算结果 ot​C22当前时刻细胞状态 Ct​数值计算过程拆解计算细胞状态的 Tanh 激活tanh(Ct​)tanh(0.271086)≈e0.271086e−0.271086e0.271086−e−0.271086​≈0.264625经过输出门过滤得到最终隐藏状态ot​⋅tanh(Ct​)0.657010∗0.264625≈0.173868最终计算结果ht​0.173868039720512四、LSTM 当前时刻最终计算结果完成上述 6 个步骤的计算后得到 LSTM 当前时间步的两个核心输出结果详情如下表格结果名称结果符号最终数值结果说明当前时刻细胞状态长时记忆Ct​0.271086047968026LSTM 的长时记忆载体贯穿整个时间序列将作为下一时刻的 Ct−1​ 参与计算当前时刻隐藏状态最终输出ht​0.173868039720512LSTM 当前时间步的最终输出可直接用于后续分类 / 回归 / 序列生成等任务将作为下一时刻的 ht−1​ 参与计算五、LSTM 核心公式与门控机制说明核心门控与公式汇总表格门控 / 公式核心作用取值范围物理意义遗忘门 ft​控制上一时刻长时记忆的保留 / 遗忘0~10 完全遗忘旧记忆1 完全保留旧记忆输入门 it​控制当前时刻新信息的写入程度0~10 完全不写入新信息1 完全写入新信息候选细胞 gt​生成当前时刻的新记忆内容-1~1当前时刻提取的新特征等待写入长时记忆细胞状态 Ct​LSTM 的长时记忆载体无固定范围由旧记忆和新记忆共同组成贯穿整个时间序列输出门 ot​控制长时记忆的输出程度0~10 完全不输出记忆1 完全输出记忆隐藏状态 ht​LSTM 当前时刻的最终输出-1~1由输出门控制的记忆内容可直接用于后续任务激活函数说明Sigmoid 激活函数 σ公式σ(z)1e−z1​取值范围0~1核心作用用于 LSTM 的 3 个门控的开关控制输出值直接代表门的开启程度0 代表门完全关闭1 代表门完全打开。Tanh 激活函数公式tanh(z)eze−zez−e−z​取值范围-1~1核心作用用于记忆内容的归一化确保数值在合理范围内避免记忆内容的数值无限增长同时保留正负号的特征信息。六、补充说明Excel 文件使用方法打开《LSTM 完整计算过程.xlsx》后直接修改黄色单元格的初始参数所有计算结果会自动更新可实时观察参数变化对 LSTM 输出的影响。多时间步扩展本文档为单时间步的计算过程若需实现多时间步的 LSTM 计算只需将当前时刻的 Ct​ 和 ht​ 作为下一时刻的 Ct−1​ 和 ht−1​重复本文档的 6 个计算步骤即可。最简结构说明本文档采用的是单输入特征、单隐藏单元的最简 LSTM 结构无输入 / 输出的维度拼接、无偏置的维度扩展核心逻辑与标准 LSTM 完全一致适合入门学习。