十個開源工業(yè)檢測數(shù)據(jù)集匯總
1.天池鋁型材表面缺陷數(shù)據(jù)集
大賽數(shù)據(jù)集里有1萬份來自實際生產(chǎn)中有瑕疵的鋁型材監(jiān)測影像數(shù)據(jù),每個影像包含一個或多種瑕疵。供機器學習的樣圖會明確標識影像中所包含的瑕疵類型。
2.Kylberg 紋理數(shù)據(jù)集
在布匹的實際生產(chǎn)過程中,由于各方面因素的影響,會產(chǎn)生污漬、破洞、毛粒等瑕疵,為保證產(chǎn)品質(zhì)量,需要對布匹進行瑕疵檢測。布匹疵點檢驗是紡織行業(yè)生產(chǎn)和質(zhì)量管理的重要環(huán)節(jié),目前人工檢測易受主觀因素影響,缺乏一致性;并且檢測人員在強光下長時間工作對視力影響極大。
由于布匹疵點種類繁多、形態(tài)變化多樣、觀察識別難道大,導(dǎo)致布匹疵點智能檢測是困擾行業(yè)多年的技術(shù)瓶頸。本數(shù)據(jù)涵蓋了紡織業(yè)中布匹的各類重要瑕疵,每張圖片含一個或多種瑕疵。數(shù)據(jù)包括包括素色布和花色布兩類,其中,素色布數(shù)據(jù)約8000張;花色布數(shù)據(jù)約12000張。
3.東北大學帶鋼表面缺陷數(shù)據(jù)集
數(shù)據(jù)集收集了夾雜、劃痕、壓入氧化皮、裂紋、麻點和斑塊6種缺陷,每種缺陷300張,圖像尺寸為200×200。數(shù)據(jù)集包括分類和目標檢測兩部分,不過目標檢測的標注中有少量錯誤,需要注意。
4.Severstal 帶鋼缺陷數(shù)據(jù)集
該數(shù)據(jù)集中提供了四種類型的帶鋼表面缺陷。訓(xùn)練集共有12568張,測試集5506張。圖像尺寸為1600×256。
5.UCI 帶鋼缺陷數(shù)據(jù)集
該數(shù)據(jù)集包含了7種帶鋼缺陷類型。這個數(shù)據(jù)集不是圖像數(shù)據(jù),而是帶鋼缺陷的28種特征數(shù)據(jù),可用于機器學習項目。鋼板故障的7種類型:裝飾、Z_劃痕、K_劃痕、污漬、骯臟、顛簸、其他故障。
6.DAGM 2007數(shù)據(jù)集
該數(shù)據(jù)集主要針對紋理背景上的雜項缺陷,為較弱監(jiān)督的訓(xùn)練數(shù)據(jù)。包含十個數(shù)據(jù)集,前六個為訓(xùn)練數(shù)據(jù)集,后四個為測試數(shù)據(jù)集。每個數(shù)據(jù)集均包含以灰度8位PNG格式保存的1000個“無缺陷”圖像和150個“有缺陷”圖像,每個數(shù)據(jù)集由不同的紋理模型和缺陷模型生成?!盁o缺陷”圖像顯示的背景紋理沒有缺陷,“無缺陷”圖像的背景紋理上恰好有一個標記的缺陷。所有數(shù)據(jù)集已隨機分為大小相等的訓(xùn)練和測試子數(shù)據(jù)集。弱標簽以橢圓形表示,大致表示缺陷區(qū)域。
7.磁瓦缺陷數(shù)據(jù)集
中國科學院自動所一個課題組收集的數(shù)據(jù)集,是“Saliency of magnetic tile surface defects”這篇論文的數(shù)據(jù)集。收集了6種常見磁瓦缺陷的圖像,并做了語義分割的標注。
8.RSDDs鐵軌表面缺陷數(shù)據(jù)集
RSDDs數(shù)據(jù)集包含兩種類型的數(shù)據(jù)集:第一種是從快車道捕獲的I型RSDDs數(shù)據(jù)集,其中包含67個具有挑戰(zhàn)性的圖像。第二個是從普通/重型運輸軌道捕獲的II型RSDDs數(shù)據(jù)集,其中包含128個具有挑戰(zhàn)性的圖像。
兩個數(shù)據(jù)集的每幅圖像至少包含一個缺陷,并且背景復(fù)雜且噪聲很大。
RSDDs數(shù)據(jù)集中的這些缺陷已由一些專業(yè)的人類觀察員在軌道表面檢查領(lǐng)域進行了標記。
9.KTH-TIPS 紋理圖像數(shù)據(jù)集
KTH-TIPS 是一個紋理圖像數(shù)據(jù)集,在不同的光照、角度和尺度下拍攝的不同材質(zhì)表面紋理圖片。類型包括砂紙、鋁箔、發(fā)泡膠、海綿、燈芯絨、亞麻、棉、黑面包、橙皮和餅干共10類。
10.印刷電路板(PCB)瑕疵數(shù)據(jù)集
這是一個公共的合成PCB數(shù)據(jù)集,由北京大學發(fā)布,其中包含1386張圖像以及6種缺陷(缺失孔,鼠咬壞,開路,短路,雜散,偽銅),用于檢測,分類和配準任務(wù)。