脑机前沿|DeeperBrain:浙大潘纲团队让脑电基础模型真正“懂”神经机制
当抑郁症患者首次佩戴非侵入式脑电EEG头环系统在未进行任何个性化校准的情况下即刻解析其情绪状态并启动干预——这一开箱即用的脑机接口能力正由浙江大学团队从理论推向实践。近日该校潘纲教授团队提出一种神经生理学启发的脑电基础模型DeeperBrain通过将神经电生理的物理先验嵌入深度学习架构实现了真正意义上的跨任务通用脑机接口。通用脑机接口的异质性困境脑电信号解码面临多重异质性挑战在信号层面EEG具有非平稳性和低信噪比SNR特征受试者个体差异、肌肉伪迹及工频噪声50/60Hz严重干扰信号质量。在硬件层面不同设备采用6至128个电极采样率从200 Hz到2048Hz不等导致空间对齐不一致。在功能层面运动想象、情绪识别、癫痫检测等任务依赖截然不同的神经机制涵盖从特定频段的感觉运动节律到复杂的广泛网络振荡。现有EEG基础模型多采用通用序列建模架构通过掩码自编码masked autoencoding进行预训练。然而这些模型在端到端微调时表现尚可在冻结探测frozen-probing协议下——即固定预训练主干网络仅训练任务特定的预测头——性能急剧下降。研究人员指出这表明现有模型学到的只是场景特定的统计规律而非普适的神经生理学表征。要实现通用BCI模型必须内化大脑活动的生物物理原理。图1. DeeperBrain概览。神经物理先验的架构嵌入DeeperBrain的核心创新在于将EEG生成的物理定律转化为架构层面的归纳偏置。在空间维度团队针对容积传导volume conduction现象建模。头皮EEG电位源于电流通过头颅导电组织的被动扩散遵循准静态麦克斯韦方程。团队基于三维电极坐标MNI空间构建可学习的空间衰减核信号相似度随电极间欧氏距离呈指数衰减衰减系数τ初始化为8 厘米典型电极间距。这种设计模拟了神经源信号经容积传导后的空间混叠效应使模型能够从模糊的传感器观测中解耦潜在神经源。图2显示相比基线方法的离散脉冲响应DeeperBrain的中央电极Cz感受野呈现平滑的各向同性扩散模式符合物理定律。图2 高密度10-5电极排列空间感受野的比较。在时间维度团队设计了神经动力学感知的位置编码。传统正弦位置编码仅捕捉序列顺序缺乏对时间之箭的建模。DeeperBrain结合两种生物学启发的基函数慢振荡基覆盖0.01–0.5 赫兹周期2–100 秒用于建模持续性注意或睡眠阶段转换自适应衰减基采用指数函数时间常数τ覆盖1–100 秒模拟神经适应的耗散特性。图3对比显示这种编码显式分离了准周期性节律上部与单向衰减记忆下部为Transformer提供了符合神经动力学的时间结构先验。图3 时序位置编码的比较双目标预训练策略预训练阶段采用双目标框架掩码脑电重建Masked EEG Reconstruction, MER与神经动力学统计预测Neurodynamics Statistics Prediction, NSP。MER任务要求模型从50%掩码的输入中重建原始波形使用Smooth L1损失Huber损失β1.0确保对癫痫尖波、睡眠纺锤波等瞬态事件的精细捕捉。NSP任务则强制模型预测19种宏观脑状态参数包括相对谱功率δ、θ、α、β、γ频段、相位锁定值phase-locking value, PLV表征的功能连接、跨频率耦合cross-frequency coupling, CFC及样本熵表征的动态复杂度。图4显示在FACED数据集上的零样本测试中模型对α频段功率的预测与地面真值的皮尔逊相关系数达0.82样本熵达0.75证实了表征与神经生理机制的对齐。值得注意的是CFC指标相关系数仅0.01这并非模型缺陷而是反映了该指标在被动观看任务中的稀疏性——模型学会了识别噪声主导的指标并避免过度拟合。图4 神经动力学一致性可视化在FACED上的零样本跨任务泛化验证DeeperBrain在14个公开数据集总计17,200 小时2,438,653个样本上进行预训练覆盖临床诊断、睡眠研究、认知神经科学等领域。下游任务涵盖9分类情绪识别FACED、4分类运动想象PhysioNet-MI, BCIC-IV-2a、5分类睡眠分期ISRUC、癫痫检测CHB-MIT等10项任务。在端到端微调下DeeperBrain在FACED数据集上达到60.32%平衡准确率Balanced Accuracy较EEGNet40.90%和LaBraM52.73%显著提升。在更为严苛的冻结探测协议下DeeperBrain在FACED上仍保持50.96%的准确率而LaBraM降至16.13%CBraMod降至25.84%。表IV数据显示在PhysioNet-MI4分类、SHU-MI2分类、MODMA抑郁症诊断等任务中DeeperBrain在冻结设置下均优于现有基线证明其学到的表征具有内在普适性无需任务特定适应即可支持高性能解码。消融实验图5、图6验证了各组件的贡献。移除容积传导感知编码后空间泛化能力下降移除神经动力学时间编码后时序建模精度降低仅使用单一预训练目标MER或NSP均导致性能下降表明信号保真度与动力学一致性是互补而非冗余的目标。图5 在位置编码上的性能比较均值±标准差%不平衡准确率。图6 在预训练目标上的性能比较平均值±标准差%不平衡准确率。临床转化前景该研究填补了神经物理启发表征学习的空白。研究人员表示团队下一步将探索流式推理机制以支持实时BCI应用并扩展预训练数据的全球人口代表性减少地理集中度带来的偏差。DeeperBrain的冻结探测性能具有重要工程意义在实际临床场景中新患者往往只有少量校准数据。该模型可作为鲁棒的通用特征提取器仅需训练轻量级预测头大幅降低计算开销和过拟合风险为穿戴式情绪监测、神经疾病筛查等应用铺平道路。来源https://arxiv.org/abs/2601.06134仅用于学术分享若侵权请留言即时删侵推广丨商务合作请联系微信ZuoLeiLeiya 备注姓名-单位-商务合作交流 | 加群交流请联系微信RoseBCI备注姓名-单位-交流投稿丨成为创作者请联系微信RoseBCI备注姓名-创作者一键关注点亮星标不错过每一条脑机前沿进展一键三连「分享」、「点赞」和「在看」欢迎在评论区聊聊