上周调一个产线瑕疵检测模型,产线主管跑过来指着屏幕问:“为啥传送带上两个叠在一起的零件,系统只报一个?”我盯着推理结果看了半天——两个零件明明有部分轮廓可见,但模型只给最上面那个画了框。这就是典型的遮挡目标漏检问题,在产线、交通、安防场景太常见了。一、遮挡不是小问题传统目标检测模型(包括YOLO系列)在遮挡场景下表现不佳,本质是两重原因:第一,模型过度依赖局部显著特征。两个目标重叠时,共享的特征区域会让模型误判为单一实体。第二,后处理的NMS(非极大值抑制)会直接干掉重叠框,这是很多工程师没意识到的“暗坑”。RT-DETR本身基于Transformer架构,全局注意力机制理论上应该更擅长处理遮挡,但实际部署时发现,默认配置在密集遮挡场景还是不够用。下面这段是原始的注意力计算,问题就藏在里面:# 原始的自注意力计算(简化版)defattention(query,key,value)