神经网络基础面试|神经元、激活函数、反向传播
前言深度学习面试开篇必问基础内容,不管 CNN、RNN 还是 Transformer,根源都在人工神经网络。本文整理神经元原理、主流激活函数、正向传播、反向传播核心考点,答案精简好记,快速吃透深度学习入门必考内容。一、人工神经网络基础单个神经元作用接收多个输入特征,加权求和后加入偏置项,再经过激活函数做非线性变换,输出结果。三层基础网络结构输入层:接收原始数据特征隐藏层:提取高阶抽象特征输出层:输出最终预测结果为什么需要多层网络单层网络只能拟合线性关系,叠加隐藏层能够无限逼近任意复杂非线性函数。二、正向传播流程输入数据 → 逐层加权求和 + 偏置 → 激活函数映射 → 最后输出预测值作用:完成数据特征逐层提取,得到当前参数下的预测结果。三、五大主流激活函数面试详解1. Sigmoid公式:\(f(x)=\frac{1}{1+e^{-x}}\)特点:输出压缩至 0~1,适合概率输出缺点:容易梯度消失、输出非零均值、计算量大适用:二分类输出层2. Tanh输出区间 - 1~1,零均值,收敛比 Sigmoid 更快依旧存在梯度消失问题, hidden 层早年常用,现在少用3. ReLU(当前最主流)公式:小于 0 置 0,大于 0 直接保留优点计算极简,训练速度快正数区间无梯度消失收敛速度远快于 sigmoid/tanh缺点负数区域梯度永久为 0,容易出现神经元死亡适用:绝大多数隐藏层首选4. Leaky ReLU给负数区域保留微小梯度,解决 ReLU 神经元死亡问题,日常优化常用5. Softmax