样本收集的致命误区:为什么你的AI模型“一上产线就拉胯”?

张开发
2026/4/5 19:38:32 15 分钟阅读

分享文章

样本收集的致命误区:为什么你的AI模型“一上产线就拉胯”?
很多工程师在收集TVA训练集时喜欢从良品堆里挑50个再从废品筐里挑50个觉得凑够100个样本就能让AI“快速学习”了。结果一上线只要背景稍微有点灰尘或者螺母有点偏转角度系统就疯狂误报。这就是典型的样本分布失衡与缺乏泛化性。实验室里的废品是静态挑出来的而产线上的状态是动态千变万化的。避坑指南样本收集是一门脏活累活但有严格规范覆盖全工艺方差不仅要收集极限缺陷缺焊、错位更要收集“边界样本”比如焊得勉强合格但外观很差的。同时必须包含早班、晚班、不同批次原材料、甚至不同操作工打出来的零件。加入“噪声样本”故意收集带有油污、水渍、边缘毛刺但焊接本身合格的零件让TVA学习告诉它“这些脏东西不是缺陷”。姿态多样性同一个零件在传送带上可能有±5°的旋转偏差样本图必须包含这些实际工况下的偏转角否则模型会极其脆弱。另外现场调试工程师最怕听到的一句话就是“图像拍不清楚你算法能不能处理一下”兄弟GIGO垃圾进垃圾出算法再牛也还原不出图像传感器上没捕捉到的信息。汽车冲压件的焊接点检测光学环境极其恶劣金属反光镜面反射、焊渣飞溅、表面油污。如果只用一个同轴光或者普通环形光拍出来的螺母要么是一片死白反光要么是一片死黑。在这种图像上跑AI模型一定会过拟合到光斑上换个角度就全报错。避坑指南在TVA系统实施初期千万别急着开跑算法。光学方案的搭建决定了项目80%的成败。克制反光对于螺母平面必须使用漫反射光或低角度组合光打匀焊点周围的底色。凸显特征对于焊点本身的凹凸不平虚焊是平的合格是凸起的必须引入特定角度的定向光利用阴影来凸显三维形貌。物理隔离加装除尘气吹防止飞溅物污染镜头。记住把特征在物理层面上打好TVA的快速学习能力才能事半功倍。

更多文章