大白话彻底听懂PyTorch autograd的底层逻辑

张

张建站

2026/5/26 16:13:02

10分钟阅读

博客主页瑕疵的CSDN主页 Gitee主页瑕疵的gitee主页⏩ 文章专栏《热点资讯》被PyTorch autograd坑到凌晨三点终于摸清了反向传播的底裤文章目录上周写自定义层时梯度全为0。我盯着屏幕从下午熬到凌晨报错信息就一句“grad is None”。翻遍文档发现根本不是代码写错——是脑子没转过弯。问题报错我写了这个ReLU变种defcustom_relu(x):returnx*(x0)# 用张量比较实现训练时直接调用xtorch.tensor([1.0,-1.0],requires_gradTrue)ycustom_relu(x)y.sum().backward()# 梯度全0print(x.grad)# 输出tensor([0., 0.])我反复检查输入输出明明逻辑没问题啊核心根源autograd不是魔法它就是个记账本。每一步操作比如x * y它都记一笔。反向时按账本用链式法则算梯度。但x 0是Python的布尔比较不是PyTorch操作autograd看不见这步账本漏记了反向时自然算不出梯度。简单说它只认torch.relu这种操作不认if x0这种Python逻辑错误示范 vs 正确姿势错误只写前向没告诉autograd怎么反向importtorch xtorch.tensor([1.0,-1.0],requires_gradTrue)# 错误自定义函数没实现backwardycustom_relu(x)# 问题在这里y.sum().backward()# 梯度全0print(x.grad)# tensor([0., 0.])正确必须继承Function实现backwardimporttorchclassCustomReLU(torch.autograd.Function):staticmethoddefforward(ctx,x):# 保存中间变量反向要用ctx.save_for_backward(x)returnx*(x0)# 这里x0是PyTorch操作autograd会记录staticmethoddefbackward(ctx,grad_output):# 关键手动算梯度x,ctx.saved_tensors grad_xgrad_output.clone()grad_x[x0]0# 梯度掩码负值梯度设为0returngrad_x xtorch.tensor([1.0,-1.0],requires_gradTrue)yCustomReLU.apply(x)# 用apply调用y.sum().backward()print(x.grad)# tensor([1., 0.]) ✅ 正确避坑总结自定义操作必继承Function没写backwardautograd直接给你0梯度别问为什么。forward里用PyTorch操作x 0是合法的因为是张量比较但别用if x0这种Python逻辑它不被记录。测试梯度写完马上用torch.autograd.gradcheck验证别等到训练崩溃。核心真相autograd不是黑盒。它只负责按账本算你得把账本填对。我踩过坑才懂反向传播不是自动的是你告诉它怎么算的。现在写模型先写backward再写forward效率高多了。别再被梯度消失坑了——可能只是你的账本漏记了一页。

集成学习与预训练模型：攻克低资源语言文本分类难题的工程实践

1. 项目概述：乌尔都语社交媒体内容治理的挑战与机遇在当今全球化的社交媒体生态中，乌尔都语作为南亚地区数亿人口使用的语言，其线上空间的言论健康正面临严峻挑战。与英语、中文等高资源语言不同，乌尔都语的自然语言处理研究长期受…...

2026/5/26 16:04:51 阅读更多 →

基于双编码器VAEGAN与XGBoost的信用卡欺诈检测实战

1. 项目概述与核心挑战在金融科技领域，尤其是信用卡交易风控中，我们面临着一个经典且棘手的难题：数据极度不平衡。想象一下，你手头有28万多条交易记录，但其中只有不到500条是欺诈交易，占比不到0.2%。这就好…...

2026/5/26 16:04:36 阅读更多 →

TCP MSS协商：从握手到传输，详解避免分片的网络优化策略

1. 为什么我们需要关注TCP MSS 第一次听说TCP MSS这个概念时，我也觉得这不过是协议栈里又一个晦涩难懂的技术参数。直到有次在排查一个视频会议系统卡顿问题时，抓包发现大量IP分片报文，才真正意识到MSS协商的重要性。那次经历让我明白&#x…...

2026/5/26 16:04:33 阅读更多 →

PS5 NOR修改器终极指南：简单三步修复你的游戏主机

PS5 NOR修改器终极指南：简单三步修复你的游戏主机【免费下载链接】PS5NorModifier The PS5 Nor Modifier is an easy to use Windows based application to rewrite your PS5 NOR file. This can be useful if your NOR is corrupt, or if you have a disc edition…...

2026/5/25 2:11:12 阅读更多 →

毕业论文，如何合规使用AI

2022年11月出现了大语言模型ChatGPT，今年是第一批使用大模型大学生毕业的第一年，如何安全、高效地使用AIGC正在成为不少人关心的重要事情。大学生或研究生毕业论文使用AIGC的核心原则是：把它当成你的“科研实习生”，而不是“代笔枪…...

2026/5/26 15:59:40 阅读更多 →

3步彻底解决RDP Wrapper [not supported]问题：实战修复指南

3步彻底解决RDP Wrapper [not supported]问题：实战修复指南【免费下载链接】rdpwrap RDP Wrapper Library 项目地址: https://gitcode.com/gh_mirrors/rd/rdpwrap RDP Wrapper是一款让Windows家庭版支持多用户远程桌面的开源工具，但许多用户在系…...

2026/5/24 0:32:45 阅读更多 →