深度学习周报（3.23~3.29）

张

张建站

2026/6/24 17:01:52

10分钟阅读

摘要本周主要阅读了两篇关于甲烷泄漏检测的文献两篇都基于同样的数据集 GasVid前者侧重于检测甲烷是否泄漏属于二分类任务后者在前者的基础上侧重于对甲烷泄漏的程度进行划分定级。此外拓展了部分相关知识如全球变暖潜能、羽流以及甲烷泄漏的相关量化技术等。AbstractThis week, I mainly read two papers on methane leak detection, both based on the same dataset, GasVid. The former focused on detecting whether methane is leaking, which is a binary classification task, while the latter built on this to further classify and grade the severity of methane leaks. In addition, I expanded my knowledge on related topics, such as global warming potential, plumes, and quantification techniques for methane leaks.1 《Machine vision for natural gas methane emissions detection using an infrared camera》链接Machine vision for natural gas methane emissions detection using an infrared camera - ScienceDirect1.1 研究背景天然气在全球能源体系中占据重要地位但其主要成分甲烷在全球变暖潜能GWP上远高于二氧化碳故在低碳未来中的作用仍存在争议也因此及时发现天然气基础设施中的甲烷泄漏对于应对气候变化和减少经济损失至关重要。p.s 全球变暖潜能GWP是指在一定时间尺度内某种温室气体排放到大气中对全球变暖的影响相对于等质量的二氧化碳的影响。目前广泛使用光学气体成像OGI红外摄像机进行人工巡检因为不同性质的气体羽流在红外摄像机中会呈现为不同颜色但这种方法会耗费较高的劳动力成本、无法持续监测与实时反馈不同 OGI 运营商的调查质量也参差不齐。因此需要利用自动化技术来代替人工检测甲烷泄漏的情况。p.s 羽流是指从源头排放出来的气态或液态流体在本文情境中则特指天然气从泄漏点喷射出来后在空气中流动、扩散形成的类似羽毛或烟雾状的可见区域。1.2 方法论首先论文通过在科罗拉多州 METEC 设施进行受控释放构建了 GasVid 数据集包含来自不同泄漏源的甲烷泄漏标注视频共覆盖 5 种距离和 7 种泄漏速率。其次为了消除红外视频中背景波动的影响让模型更容易锁定羽流论文对数据进行了预处理即背景减除与归一化对比了无背景减除、固定背景减除、移动平均背景减除和基于高斯混合模型MOG的背景减除几种方法的效果。最后论文基于 TensorFlow 开发了名为GasNet的二维卷积神经网络测试了不同复杂度架构的效果并设计了基于光流法的传统机器视觉方法作为基线模型进行对比。1.3 创新点第一这是该领域内首次将深度学习和计算机视觉直接应用于红外摄像机甲烷泄漏视频的自动检测。第二系统性分析了背景扣除算法对深度学习在气体检测中精度的影响验证了在红外气体成像背景下进行合适的图像背景扣除确实对提高深度学习模型精度能起到一定作用。1.4 实验及结果实验在多个成像距离和不同泄漏尺寸下进行。对于不同背景减除方法不采用的最高准确率为82%标准差均低于2.0%随着距离增加和泄漏尺寸减小性能会迅速退化总体而言效果最差固定减除在4.6米和6.9米下的所有准确率水平均超过93%且标准差较小平均减除相较于固定减除的检测精度均显著提升高斯混合优于固定减除但在十米左右及更远时效果逊于平均减除更近距离与平均减除相似。对于不同复杂度的模型架构在近距离时准确率均保持高位架构差异并不显著随着距离增大GasNet-2性能优于其他两种架。对于不同聚合程度通过将所有距离和泄漏大小的数据混合训练一个通用模型比单独针对每个距离训练的模型表现出更好的泛化能力平均准确率达到 95%。2 《VideoGasNet: Deep learning for natural gas methane leak classification using an infrared camera》链接VideoGasNet: Deep learning for natural gas methane leak classification using an infrared camera - ScienceDirect2.1 研究背景在成功实现了对是否发生泄漏进行自动检测即上篇论文之后工业界进一步地需要评估泄漏的严重程度以优先安排对大规模泄漏源的修复因为少数大泄漏源的泄漏量往往占据总泄漏量的大部分。此外前文主要针对静态单帧图像进行处理但甲烷羽流是具有高度时空动态特性的流体静态的单帧图像可能无法捕捉其完整的物理特征。本文主要基于此进行深入研究。2.2 方法论首先将问题由简单的二分类升级为八分类不同流率等级与三分类小、中、大两种多分类问题从而实现按程度分类泄漏情况以确定大规模泄漏源。其次不再局限于静态处理而是引入处理视频序列的深度学习架构将较长视频划分为不同帧数的短视频并对比效果比如一段视频有 750 帧每段 5 帧则一共 150 段编号为 5随后对比了不同模型结构的效果即类似于 GasNet 的 2D CNN、加入时间维度提取时空特征的 3D CNN 与结合卷积和长短期记忆网络处理时序依赖的 ConvLSTM。最后对损失函数进行优化引入错误惩罚系数即将大泄漏误判为无泄漏的惩罚要远高于将其误判为中泄漏。2.3 创新点第一首次提出并实现了基于红外视频的甲烷泄漏程度分类技术。第二不仅关注画面空间信息还提出了利用连续多帧视频片段和时序模型来捕捉气体羽流随时间扩散的动态特征。2.4 实验及结果在原始的八分类实验中对于不同的视频帧数3D CNN 均优于 ConvLSTM 和 2D CNN视频帧编号 15 和 60 的预测准确率高于视频帧编号 5 和 100 而对于不同的距离在 4.6 米和 6.9 米时3D CNN 与 ConvLSTM 之间的准确率差异并不显著但该实验最高准确率不超过 40%体现在 3D CNN 上故将其命名为 VideoGasNet。在最简单的二分类实验中本文提出的 VideoGasNet 架构优于前文的 GasNet这表明本文架构适用于简单检测场景。对于三分类实验则主要是将复杂的八级气体排放数据映射并预测出具有实际指导意义的三级Small, Medium, Large排放流率规模在 4.6 米下其准确率达到 78.2%。3 总结本周主要阅读的两篇论文是同一个团队的都与甲烷泄漏检测有关整体上构成了递进的关系前者通过视频的单帧静态画面检测有无甲烷泄漏后者则联系了时序关系对甲烷泄漏程度进行多分类大体都是采用卷积结构加一点混合的 LSTM后续打算看看有没有相关领域应用注意力机制的文献。

Cuvil加速PyTorch推理：从零部署到毫秒级响应的7步高阶工作流

第一章：Cuvil编译器在Python AI推理中的核心定位与价值跃迁Cuvil编译器并非传统意义上的通用语言编译器，而是专为Python生态中AI模型推理场景深度优化的静态编译基础设施。它通过将PyTorch/TensorFlow动态图或Triton内核等高层语义，直接映射为…...

2026/5/21 22:09:53 阅读更多 →

DeEAR镜像免配置实战：无需修改config.py，直接运行app.py启用全部功能模块

DeEAR镜像免配置实战：无需修改config.py，直接运行app.py启用全部功能模块 1. 开篇：语音情感识别的技术革新语音情感识别技术正在改变我们与机器交互的方式。想象一下，你的智能助手不仅能听懂你说什么，还能理解你说话…...

2026/5/21 22:09:54 阅读更多 →

UDOP-large实战：英文发票信息自动提取，效率提升10倍

UDOP-large实战：英文发票信息自动提取，效率提升10倍 1. 为什么选择UDOP-large处理英文发票？ 财务人员每月需要处理大量英文发票，传统手动录入方式不仅耗时耗力，还容易出错。UDOP-large作为微软研发的文档理解模型&am…...

2026/5/21 22:09:56 阅读更多 →

手撕CNN：从卷积计算到工程落地的全链路解析

1. 这不是“讲概念”的课，是带你亲手拆开CNN看齿轮怎么咬合你点开这篇，大概率不是为了背定义——可能刚被导师甩来一篇CVPR论文，满页的feature map、stride、padding看得头皮发麻；也可能在调一个图像分类模型，loss曲线…...

2026/6/23 10:08:12 阅读更多 →

PVZ Toolkit完整指南：植物大战僵尸终极修改器使用教程

PVZ Toolkit完整指南：植物大战僵尸终极修改器使用教程【免费下载链接】pvztoolkit 植物大战僵尸 PC 版综合修改器项目地址: https://gitcode.com/gh_mirrors/pv/pvztoolkit PVZ Toolkit是一款专为经典游戏植物大战僵尸设计的综合修改器，它为玩家…...

2026/6/22 7:39:46 阅读更多 →

嵌入式功能安全实践：NXP IEC60730B安全库核心测试与集成指南

1. 项目概述与功能安全背景在嵌入式系统开发领域，尤其是涉及家电、工业控制、汽车电子等安全关键型应用时，仅仅实现功能正确是远远不够的。系统必须在整个生命周期内，具备检测并响应内部硬件故障的能力，以防止因随机硬件失效导致…...

2026/6/23 1:26:41 阅读更多 →

XXMI启动器：6款热门二次元游戏模组管理的技术实现与效率革命

XXMI启动器：6款热门二次元游戏模组管理的技术实现与效率革命【免费下载链接】XXMI-Launcher Modding platform for GI, HSR, WW and ZZZ 项目地址: https://gitcode.com/gh_mirrors/xx/XXMI-Launcher XXMI启动器是一款专为二次元游戏模组管理设计的开源平台…...

2026/6/23 16:02:29 阅读更多 →