一、从真实问题说起上周在部署一个工业缺陷检测项目时遇到了头疼事:产线上某些罕见缺陷的样本太少,整个类别只有十几张有效图像。直接扔进YOLOv11训练,模型要么认不出这类缺陷,要么把正常工件误判成缺陷。数据增强试了一圈——旋转、裁剪、色彩抖动——生成的都是“相似的异常”,模型泛化能力还是上不去。这时候想起实验室那台闲置的RTX 4090,琢磨着能不能用生成对抗网络(GAN)造点“新的异常”出来。结果踩了三天坑,终于跑通了从GAN生成到YOLOv11训练的全流程。今天把关键步骤和坑点记下来,给遇到类似问题的兄弟参考。二、为什么需要GAN做数据增强?传统数据增强本质是几何或色彩变换,缺陷的形态结构并没有真正创新。比如一个划痕样本,怎么旋转缩放它还是那条划痕。而GAN能学会缺陷的底层分布特征,生成从未见过的、但符合真实缺陷规律的样本。举个例子:训练GAN时喂给它50张划痕图像,它可能学会“划痕通常出现在边缘区域”“划痕的明暗对比规律”“划痕的走向与材质纹理的关系”。然后生成一张在全新位置、有着合理形态的划痕图像。这种“结构性创新”才是小样本场景真正需要的。三、实战:用StyleGAN2生成缺陷样本选StyleGAN2是因为它在生成质量和训练稳定性上比较均衡。下面这段是核心训练配置,注意看注释里的坑: