Dalam pembuatan moden, pengesanan kecacatan yang tepat bukan sahaja kunci untuk memastikan kualiti produk, tetapi juga teras untuk meningkatkan kecekapan pengeluaran. Walau bagaimanapun, set data pengesanan kecacatan sedia ada selalunya tidak mempunyai ketepatan dan kekayaan semantik yang diperlukan untuk aplikasi praktikal, menyebabkan model tidak dapat mengenal pasti kategori atau lokasi kecacatan tertentu.
Untuk menyelesaikan masalah ini, pasukan penyelidik terkemuka yang terdiri daripada Universiti Sains dan Teknologi Hong Kong Guangzhou dan Simou Technology telah membangunkan set data "Spektrum Kecacatan" secara inovatif, yang menyediakan anotasi berskala besar yang terperinci dan kaya dengan semantik bagi kecacatan industri. Seperti yang ditunjukkan dalam Jadual 1, berbanding set data industri lain, set data "Spektrum Kecacatan" menyediakan anotasi kecacatan yang paling banyak (5438 sampel kecacatan), klasifikasi kecacatan paling terperinci (125 kategori kecacatan), dan menyediakan pelbagai jenis kecacatan menyediakan label terperinci tahap piksel. Selain itu, set data juga menyediakan penerangan linguistik terperinci untuk setiap sampel kecacatan. Perbandingan anotasi khusus ditunjukkan dalam Rajah 1.
Rajah 1: Berbanding dengan set data industri lain, Defect Spectrum mempunyai ketepatan yang lebih tinggi dan anotasi yang lebih kaya
Jadual 1: Perbandingan kuantiti dan sifat Spektrum Kecacatan
"set data sedia ada yang lain " memperkenalkan pendekatan revolusioner - "DefectGen" - berdasarkan model penyebaran terkini. Dengan menggunakan sejumlah kecil data kecacatan industri untuk menjana imej dan label kecacatan tahap piksel, kaedah ini meningkatkan prestasi model pengesanan kecacatan industri dengan ketara dan dilaksanakan pada beberapa set data standard industri (seperti MVTec AD, VISION, DAGM2007 dan Cotton-Fabric) Satu kejayaan prestasi yang tidak pernah berlaku sebelum ini.
Penyelidikan terobosan ini bukan sahaja meningkatkan ketepatan pengesanan kecacatan, tetapi juga membuka kemungkinan baharu untuk aplikasi AI dalam persekitaran industri yang kompleks. Kod dan model projek telah menjadi sumber terbuka sepenuhnya. . pautan ject: https : //envision-research.github.io/Defect_Spectrum/
Github Repo: https://github.com/EnVision-Research/Defect_Spectrum
Dataset Repo: https://huggingface.co/datasets/DefectSpectrum/Defect_SpectrumDi sebalik semua ini, set data "Spektrum Kecacatan" adalah seperti detektif yang maha kuasa dengan wawasan tentang segala-galanya. Ia bukan sahaja merangkumi pelbagai jenis kecacatan industri, tetapi juga menyediakan penerangan terperinci dan kaya untuk setiap kecacatan. Melalui alat berkuasa ini, sistem pengesan kecacatan dapat mengenal pasti dan mengklasifikasikan pelbagai kecacatan dengan lebih tepat tanpa kehilangan sebarang butiran. 想象一下,在实际的生产线上,通过“Defect Spectrum”数据集的帮助,检测系统能够迅速识别出这个至关重要的缺陷,立即标记并返回工厂进行修复。同时,对于那些面料上轻微的缺陷或颜色差异,系统可以根据缺陷的详细标注,判断其是否在可接受范围内,决定是否以打折价格销售。这种灵活的处理方式,不仅提高了产品的质量,还保证了生产的高效和成本的控制。 传统数据集如MVTEC和AeBAD尽管提供了像素级的标注,但常常局限于二元遮罩,无法细致区分缺陷类型和位置。《Defect Spectrum》数据集通过与工业界四大基准的合作,重新评估并精细化已有的缺陷标注。例如,对细微的划痕和凹坑进行了更精确的轮廓绘制,且通过专家的辅助填补了遗漏的缺陷,确保了标注的全面性和精确性。 创新的缺陷生成模型“Defect-Gen” 图三:Defect-Gen两阶段生成流程示意图 面对当前数据集中缺陷样本不足的问题,我们提出了“Defect-Gen”,一个两阶段的扩散式生成器。这个生成器在样本数量有限的情况下,通过两个关键方法提高了图像的多样性和质量:第一,使用Patch级建模;第二,限制感受野。 传统的扩散模型在训练样本少时,容易过拟合,生成的结果缺乏多样性,往往只是记住了训练样本。而我们的模型通过降低数据维度和增加样本量,有效地减少了这种过拟合现象。 为了弥补Patch级建模在表达整个图像结构上的不足,我们提出了两阶段的扩散过程。首先,在早期步骤中使用大感受野模型捕捉几何结构,然后在后续步骤中切换到小感受野模型生成局部Patch。这样做在保持图像质量的同时,显著提升了生成的多样性。通过调整两个模型的接入点和感受野,我们的模型在保真度和多样性之间实现了良好的平衡。 通过“Defect-Gen”,我们为工业缺陷检测提供了更丰富和多样的训练样本,推动了自动化检测技术的发展 全面评估与未来的研究方向 表二:部分缺陷检测网络在Defect Spectrum数据集上的测评结果 表三:Defect Spectrum数据集上的实际评估标准 表四:Defect Spectrum在实际评估中的优异表现 我们对Defect Spectrum数据集进行了全面的评估,标注如表三所示。这个实验验证了Defect Spectrum在各种工业缺陷检测挑战中的适用性和优越性。表四表明,比起原有的数据集,在我们数据集上训练的模型提升了10.74%的召回率(recall),降低了33.1%的过杀率(False Positive Rate)。此外,数据集的构建和评估过程不仅提供了一个坚实的研究基础,也为工业界和学术界的研究人员提供了一个评估和开发针对工业缺陷检测复杂需求的先进模型的平台。 Defect Spectrum数据集的引入,犹如为工业生产注入了一剂强心针。它让缺陷检测系统更加贴近实际生产需求,实现了高效、精准的缺陷管理。同时,它也为未来的预测性维护提供了宝贵的数据支持,通过记录每个缺陷的类别和位置,工厂可以不断优化生产流程,改进产品修复方法,最终实现更高的生产效益和产品质量。 总结 我们发布了Defect Spectrum数据集以及DefectGen缺陷生成器,提供了实际工业检测中所需的高精确度和丰富缺陷语义,解决了模型无法识别缺陷类别或位置的问题。 我们对Defect Spectrum数据集进行了全面的评估,验证了其在各种工业缺陷检测挑战中的适用性和优越性,比起原有的数据集,在我们数据集上训练的模型提升了10.74%的召回率(recall),降低了33.1%的过杀率(False Positive Rate)。 参考资料: 1. Bai, H., Mou, S., Likhomanenko, T., Cinbis, R.G., Tuzel, O., Huang, P., Shan, J., Shi, J., Cao, M.:视觉数据集:视觉数据集的基准基于视觉的工业检测。 arXiv 预印本 arXiv:2306.07890 (2023) 2. Silvestre-Blanes, J.、Albero-Albero, T.、Miralles, I.、Pérez-Llorens, R.、Moreno, J.:用于缺陷检测方法和结果的公共织物数据库。 Autex 研究杂志19(4), 363–374 (2019)。 https://doi.org/doi:10.2478/aut-2019-0035,https://doi.org/10.2478/aut-2019-0035 3. 张Z.,赵Z.,张X.,孙C.,陈X.:具有域转移的工业异常检测:真实世界数据集和屏蔽多尺度重建。 arXiv 预印本 arXiv:2304.02216 (2023) 4。 Mishra, P.、Verk, R.、Fornasier, D.、Piciarelli, C.、Foresti, G.L.:VT-ADL:用于图像异常检测和定位的视觉变换器网络。见:第 30 届 IEEE/IES 国际工业电子研讨会 (ISIE)(2021 年 6 月) 5。 Incorporated, C.:标准织物缺陷术语表 (2023),网址:https://www.棉花公司com / 质量 - 产品 / 纺织品 - 资源 / 面料 - 缺陷 - 术语表 6。 Wieler, M., Hahn, T.:工业光学检测的弱监督学习。见:DAGM 研讨会。卷。 6(2007) 7。 Tabernik, D.、Šela, S.、Skvarč, J.、Skočaj, D.:基于分割的深度学习表面缺陷检测方法。智能制造杂志31(3), 759–776 (2020) 8. Bergmann, P., Fauser, M., Sattlegger, D., Steger, C.:Mvtec ad——用于无监督异常检测的综合现实世界数据集。见:IEEE/CVF 计算机视觉和模式识别会议论文集。第 9592–9600 页(2019) 9。 Zou, Y.、Jeong, J.、Pemula, L.、Zhang, D.、Dabeer, O.:用于异常检测和分割的找出差异自监督预训练(2022)
Atas ialah kandungan terperinci Menerobos sempadan pengesanan kecacatan tradisional, 'Spektrum Kecacatan' mencapai ketepatan ultra tinggi dan pengesanan kecacatan industri semantik yang kaya buat kali pertama.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!