图像数据语义分割标注联合扩散框架 JoDiffusion

张开发
2026/4/18 17:49:44 15 分钟阅读

分享文章

图像数据语义分割标注联合扩散框架 JoDiffusion
JoDiffusion: Jointly Diffusing Image with Pixel-Level Annotations for Semantic Segmentation Promotion一、研究背景二、现有方法存在的核心问题三、核心创新点四、方法详细流程五、实验内容六、实验结果七、总结与展望核心贡献提出 JoDiffusion首个仅文本驱动、同步生成图像 像素级标注的联合扩散框架。设计专用 Annotation VAE实现掩码高效压缩与高精度重建。提出联合扩散策略保证图像 - 掩码语义强一致。提出边界模态掩码优化显著降低生成噪声。在三大数据集上刷新合成数据训练分割模型的 SOTA。核心价值零标注成本不用真实掩码只用文本即可造高质量分割数据集高扩展性支持开放场景、低资源、小样本场景高一致性图像与掩码语义严格对齐训练更稳定局限性生成质量高度依赖文本提示提示差则结果差。纯合成数据在真实复杂场景的泛化仍弱于全量真实数据。生成速度略慢于传统 Mask2Image 方法。未来方向自适应提示优化更快的采样策略真实 - 合成数据自适应混合训练跨领域泛化增强

更多文章