數(shù)字孿生彌合了深度學(xué)習(xí)的數(shù)據(jù)鴻溝
隨著企業(yè)開始使用可將其數(shù)據(jù)投入使用的深度學(xué)習(xí)(DL)項(xiàng)目,他們必須保護(hù)這些數(shù)據(jù),而數(shù)字孿生是成功的關(guān)鍵。
在當(dāng)今世界,數(shù)據(jù)為王。無論是亞馬遜、蘋果、Facebook、谷歌、沃爾瑪還是Netflix,世界上最有價(jià)值的公司都有一個(gè)共同點(diǎn):數(shù)據(jù)是他們最有價(jià)值的資產(chǎn)。所有這些公司都使用深度學(xué)習(xí)(DL)將這些數(shù)據(jù)投入使用。
無論您從事什么業(yè)務(wù),數(shù)據(jù)都是您最寶貴的資產(chǎn)。您需要通過執(zhí)行自己的DL保護(hù)這些資產(chǎn)。深度學(xué)習(xí)成功的最重要因素是擁有足夠的正確種類的數(shù)據(jù)。那就是數(shù)字孿生的由來。
數(shù)字孿生是實(shí)際物理過程、系統(tǒng)或設(shè)備的數(shù)字副本。簡單說,數(shù)字孿生就是在虛擬世界中再造一個(gè)現(xiàn)實(shí)世界。最重要的是,數(shù)字孿生可能是深度學(xué)習(xí)項(xiàng)目成功的關(guān)鍵,尤其是涉及危險(xiǎn)、昂貴或耗時(shí)的過程的深度學(xué)習(xí)項(xiàng)目。
深度學(xué)習(xí)的希望
到目前為止,包括半導(dǎo)體制造在內(nèi)的幾乎每個(gè)行業(yè)都已經(jīng)意識(shí)到DL創(chuàng)造戰(zhàn)略優(yōu)勢的潛力。深度學(xué)習(xí)使用神經(jīng)網(wǎng)絡(luò)來執(zhí)行高級(jí)模式匹配。深度學(xué)習(xí)已應(yīng)用于面部和語音識(shí)別、醫(yī)學(xué)圖像分析、生物信息學(xué)和材料檢查等各種領(lǐng)域。
在半導(dǎo)體制造中,深度學(xué)習(xí)已經(jīng)應(yīng)用于產(chǎn)品缺陷分類等領(lǐng)域。大多數(shù)領(lǐng)先的公司都爭先恐后地在這個(gè)充滿希望的新競爭環(huán)境中獲得優(yōu)勢。
隨著企業(yè)開始探索深度學(xué)習(xí)及其如何為他們提供幫助,許多企業(yè)發(fā)現(xiàn)了兩點(diǎn):第一,獲得深度學(xué)習(xí)原型很容易;其次,從“好的原型”到“生產(chǎn)質(zhì)量”的結(jié)果很難。
如今,有了所有從低成本到免費(fèi)的深度學(xué)習(xí)平臺(tái)、工具和套件,與常規(guī)應(yīng)用程序開發(fā)相比,深度學(xué)習(xí)應(yīng)用的初始開發(fā)非??焖偾蚁鄬?duì)容易。但是,產(chǎn)品化深度學(xué)習(xí)應(yīng)用并不比產(chǎn)品化傳統(tǒng)應(yīng)用更容易,甚至更難。
原因在于數(shù)據(jù)。在沒有提供生產(chǎn)質(zhì)量結(jié)果的深度學(xué)習(xí)應(yīng)用和徹底改變您解決特定問題方式的深度學(xué)習(xí)應(yīng)用之間,通常有足夠的數(shù)據(jù)以及足夠的正確類型的數(shù)據(jù)。
深度學(xué)習(xí)的數(shù)據(jù)缺口
深度學(xué)習(xí)基于模式匹配,它是通過向神經(jīng)網(wǎng)絡(luò)呈現(xiàn)表示要匹配的目標(biāo)的數(shù)據(jù)來進(jìn)行“編程”的。大量數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)以識(shí)別目標(biāo)(并知道何時(shí)不是目標(biāo))。
深度學(xué)習(xí)具有強(qiáng)大的功能,可快速生成原型并提供概念驗(yàn)證。但是深度學(xué)習(xí)的真正優(yōu)勢不是開發(fā)速度。這是事實(shí),它釋放了數(shù)據(jù)的力量來做其他任何方式都做不到的事情。
任何深度學(xué)習(xí)應(yīng)用的成功都取決于訓(xùn)練中使用的數(shù)據(jù)集的深度和廣度。如果訓(xùn)練數(shù)據(jù)集太小、太狹窄或太“正常”,那么深度學(xué)習(xí)方法將不會(huì)比標(biāo)準(zhǔn)技術(shù)做得更好。實(shí)際上,它可能會(huì)做得更差。重要的是,用足夠多的數(shù)據(jù)來訓(xùn)練網(wǎng)絡(luò),以表示所有重要狀態(tài)或演示的數(shù)據(jù),以使網(wǎng)絡(luò)學(xué)會(huì)掌握當(dāng)前問題的正確本質(zhì)。
對(duì)于某些領(lǐng)域(例如自動(dòng)駕駛或半導(dǎo)體制造)而言,困難之處在于(非常幸運(yùn)地)很少發(fā)生某些最嚴(yán)重的異常情況。但是,如果您想讓深度學(xué)習(xí)應(yīng)用識(shí)別出在汽車前面跑來跑去的孩子(或致命的光罩錯(cuò)誤),則必須使用大量這些情況來訓(xùn)練網(wǎng)絡(luò),而在實(shí)際情況是現(xiàn)實(shí)世界中并沒有太多這些數(shù)據(jù)。而數(shù)字孿生是創(chuàng)建足夠的異常數(shù)據(jù)以正確訓(xùn)練網(wǎng)絡(luò)識(shí)別這些條件的唯一方法。

上圖為帶有標(biāo)準(zhǔn)偏差的正態(tài)分布曲線圖。在半導(dǎo)體制造中,與駕駛一樣,“異常”事件非常少見,但是必須對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行盡可能多的訓(xùn)練,因?yàn)樽顗牡氖录?huì)導(dǎo)致芯片故障。使得整體平均效果還不夠好。
數(shù)字孿生縮小了差距
數(shù)字孿生,也就是實(shí)際過程、系統(tǒng)和設(shè)備的虛擬表示,是用于創(chuàng)建正確數(shù)量以及正確類型的數(shù)據(jù)以成功訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)的關(guān)鍵工具。
使用數(shù)字雙胞胎創(chuàng)建DL訓(xùn)練數(shù)據(jù)有以下幾個(gè)原因:
- 您所處的數(shù)據(jù)可能屬于您的客戶,因此您不能將其用于深度學(xué)習(xí)訓(xùn)練。
 - 您可能需要將創(chuàng)建深度學(xué)習(xí)所需數(shù)據(jù)的資源完全投入到客戶項(xiàng)目中。
 - 您已經(jīng)開發(fā)了深度學(xué)習(xí)應(yīng)用,但是發(fā)現(xiàn)您需要特定的數(shù)據(jù)來調(diào)整和訓(xùn)練您的神經(jīng)網(wǎng)絡(luò)以達(dá)到所需的準(zhǔn)確性,但是使用晶圓廠資源創(chuàng)建數(shù)據(jù)的成本高得令人望而卻步。
 - 您知道您將無法找到足夠的異常數(shù)據(jù)來適當(dāng)?shù)赜?xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)。最后一種情況幾乎是普遍存在的。
 
理想情況下,要保持對(duì)數(shù)據(jù)的完全控制,您需要三個(gè)數(shù)字孿生:生產(chǎn)流程中先于您的過程/設(shè)備的數(shù)字孿生子,以提供用于模擬您自己的過程的輸入數(shù)據(jù);您自己的過程/設(shè)備的數(shù)字孿生;以及在生產(chǎn)流程中跟隨您的過程/設(shè)備的數(shù)字孿生,以便您可以將輸出饋送到下游進(jìn)行驗(yàn)證。
在2019年SPIE光罩技術(shù)會(huì)議上,D2S展示了一篇論文,展示了使用深度學(xué)習(xí)技術(shù)創(chuàng)建的兩個(gè)數(shù)字孿生,即掃描電子顯微鏡(SEM)數(shù)字孿生子和曲線反光刻技術(shù)(ILT)數(shù)字孿生(圖2顯示了SEM數(shù)字孿生的輸出)。雖然數(shù)字孿生的輸出通常不足以用于制造,但這些數(shù)字孿生已被用于訓(xùn)練深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)和驗(yàn)證。重要的是,這些數(shù)字孿生是由深度學(xué)習(xí)而不是通過仿真生成的。
這是一個(gè)使用深度學(xué)習(xí)作為生成其他DL所需數(shù)據(jù)的工具的示例,它展示了投資深度學(xué)習(xí)的復(fù)合收益。
上圖由SEM數(shù)字孿生生成的掩模SEM圖像和真實(shí)SEM圖像的兩個(gè)示例。還顯示了在同一位置的水平切割線上的圖像強(qiáng)度。不僅圖像看起來非常相似,而且邊緣的信號(hào)響應(yīng)也相似。
深度學(xué)習(xí)成功的路線圖
所有這些聽起來都像是有很多工作要做。為什么不使用咨詢公司為您做深度學(xué)習(xí)?因?yàn)椋涀?,?shù)據(jù)為王!保護(hù)數(shù)據(jù)并自己執(zhí)行深度學(xué)習(xí)。值得慶幸的是,我們可以遵循一條成功的既定道路。
首先,您需要確定將對(duì)深度學(xué)習(xí)產(chǎn)生影響的項(xiàng)目。您確實(shí)需要謹(jǐn)慎選擇,深度學(xué)習(xí)是模式匹配,因此您需要選擇屬于該領(lǐng)域的內(nèi)容?;趫D像的應(yīng)用,例如缺陷分類是比較匹配的。晶圓廠中的所有設(shè)備都會(huì)創(chuàng)建大量的運(yùn)行數(shù)據(jù),除非出現(xiàn)問題,否則很少引用這些數(shù)據(jù)。
您不僅可以事后將這些寶貴的數(shù)據(jù)僅用作診斷工具,還可以持續(xù)監(jiān)控整個(gè)Fab上的數(shù)據(jù),并訓(xùn)練深度學(xué)習(xí)應(yīng)用程序以標(biāo)記出問題之前的模式,這樣您就可以在問題產(chǎn)生影響之前識(shí)別和糾正問題,節(jié)省停機(jī)時(shí)間。
例如,Mycronic在2020 SPIE Advanced Lithography Conference上的eBeam Initiative午餐時(shí)間演講中披露,該公司如何利用其機(jī)器日志文件中的數(shù)據(jù)來使深度學(xué)習(xí)正常工作,以預(yù)測像“mura”之類的異常(不均勻的亮度影響,使人煩惱),但是眾所周知,這對(duì)于圖像處理算法來說很難在平板顯示器(FPD)掩模上檢測到。
通常,操作員執(zhí)行的是非常乏味且容易出錯(cuò)的過程,但是很難使用傳統(tǒng)算法實(shí)現(xiàn)自動(dòng)化,因此這是深度學(xué)習(xí)的不錯(cuò)選擇。無論是通過目視檢查還是其他方式,檢查特定情況的專業(yè)人員都會(huì)非常有可能正確執(zhí)行任務(wù)。但是面對(duì)許多類似情況的例子,人類會(huì)犯錯(cuò)并變得越來越不可靠。
在特定情況下,深度學(xué)習(xí)可能不如人類所能做的那樣好。但是它在一些情況下卻做得比人類要好。隨著執(zhí)行任務(wù)時(shí)間的增加,人類會(huì)犯更多的錯(cuò)誤;而深度學(xué)習(xí)的成功概率不會(huì)隨著數(shù)量或時(shí)間的增加而降低。
幫助縮小與深度學(xué)習(xí)成功之間的差距
一旦確定了深度學(xué)習(xí)項(xiàng)目,就會(huì)有多種可用資源,可帶您邁向成功之路,同時(shí)仍然使您能夠嚴(yán)格控制自己的數(shù)據(jù)。如果您是深度學(xué)習(xí)的新手,并希望為深度學(xué)習(xí)試點(diǎn)項(xiàng)目提供全面支持,則可以加入電子制造深度學(xué)習(xí)中心(CDLe,www.cdle.ai),這是一個(gè)旨在聯(lián)合起來的行業(yè)領(lǐng)導(dǎo)者聯(lián)盟人才和資源來提升深度學(xué)習(xí)在我們獨(dú)特的問題空間中的先進(jìn)水平,并加快深度學(xué)習(xí)在我們企業(yè)的每種產(chǎn)品中的采用,從而改善我們?yōu)榭蛻籼峁┑漠a(chǎn)品。
如果您已經(jīng)開始進(jìn)行深度學(xué)習(xí)項(xiàng)目,但是由于深度學(xué)習(xí)數(shù)據(jù)缺口而遇到了問題,那么D2S可以幫助您構(gòu)建數(shù)字雙胞胎,您需要對(duì)它們進(jìn)行擴(kuò)充和調(diào)整才能使DL成功。
















 
 
 













 
 
 
 