028、知识蒸馏：大模型教小模型

张

张建站

2026/5/28 21:23:08

10分钟阅读

028 知识蒸馏：大模型教小模型昨晚调试一个手势识别模型，板子上Flash只剩12KB，模型死活塞不进去。同事说要不换更大的Flash芯片，我盯着示波器上跳动的波形，突然想起去年在服务器上训的那个ResNet-50教师模型——它参数量是目标模型的200倍，但推理时90%的神经元根本没激活。这不就是典型的“大材小用”吗？知识蒸馏，就是让这个庞然大物把毕生功力传给小模型，而不是让它带着一身本事烂在服务器里。从“硬学”到“软学”的认知转变传统训练小模型，我们让它直接学习真实标签。比如一张图片是猫，标签就是[0,1,0,0…]。这叫硬标签，每个样本只告诉你一个正确答案。但教师模型输出的不是这么生硬的东西——它可能输出[0.01, 0.85, 0.12, 0.02…]，意思是“我觉得有85%可能是猫，12%可能是狗，2%可能是兔子”。这个分布里藏着教师模型对类别间相似性的理解：猫和狗在某些特征上确实接近，而猫和兔子差距更大。我踩过的一个坑：第一次做蒸馏时，直接把教师模型的输出当软标签，和学生模型的交叉熵损失加起来训练。结果学生模型学得比直接训练还差。后来才明白，教师模型的输出分布太平滑了——比如猫的概率0.85，狗0.12，其他类别几乎为零。这种分布里，狗和兔子的微小差异被淹没了。需要引入一个温度参数T，把分布“软化”：softmax(z_i / T)T越大，分布越平滑。T=1就是原始softmax，T=5时，原来0.85和0.12的差距会缩小，让模型学到“猫和狗更相似”这种高阶知识。别这样写：T设成100，那所有类别概率都趋近于0.5，信息全丢了。经验值T在3

3步解锁惠普OMEN游戏本完整性能：OmenSuperHub终极指南

3步解锁惠普OMEN游戏本完整性能：OmenSuperHub终极指南【免费下载链接】OmenSuperHub Control Omen laptop performance, fan speeds, and keyboard lighting, and unlock power limits. 项目地址: https://gitcode.com/gh_mirrors/om/OmenSuperHub 你是否对…...

2026/5/28 21:22:56 阅读更多 →

开源128通道电生理采集系统HiCCE-128：从FPGA到脑电信号采集的工程实践

1. 项目概述：为什么我们需要一个开源的128通道电生理采集系统？在神经科学、康复医学和脑机接口（BCI）的研究与应用前沿，数据采集系统扮演着“感官”的角色。它负责捕捉大脑、心脏、肌肉等组织产生的微弱电信号——这些信…...

2026/5/28 21:21:59 阅读更多 →

独立站建站还能做吗？今年很多人都看懂了

平台越来越卷、广告越来越贵、流量越来越难，真正开始长期布局的人，正在重新回到独立站。过去几年，只要提到“独立站”，很多人第一反应都是：“现在做独立站是不是已经晚了？”但到了今年，越来越多…...

2026/5/28 21:20:53 阅读更多 →

PS5 NOR修改器终极指南：简单三步修复你的游戏主机

PS5 NOR修改器终极指南：简单三步修复你的游戏主机【免费下载链接】PS5NorModifier The PS5 Nor Modifier is an easy to use Windows based application to rewrite your PS5 NOR file. This can be useful if your NOR is corrupt, or if you have a disc edition…...

2026/5/28 16:28:31 阅读更多 →

毕业论文，如何合规使用AI

2022年11月出现了大语言模型ChatGPT，今年是第一批使用大模型大学生毕业的第一年，如何安全、高效地使用AIGC正在成为不少人关心的重要事情。大学生或研究生毕业论文使用AIGC的核心原则是：把它当成你的“科研实习生”，而不是“代笔枪…...

2026/5/26 15:59:40 阅读更多 →

3步彻底解决RDP Wrapper [not supported]问题：实战修复指南

3步彻底解决RDP Wrapper [not supported]问题：实战修复指南【免费下载链接】rdpwrap RDP Wrapper Library 项目地址: https://gitcode.com/gh_mirrors/rd/rdpwrap RDP Wrapper是一款让Windows家庭版支持多用户远程桌面的开源工具，但许多用户在系…...

2026/5/24 0:32:45 阅读更多 →