中國(guó)研發(fā)首個(gè)神經(jīng)網(wǎng)絡(luò)處理器
近日,中科院計(jì)算技術(shù)研究所發(fā)布全球首個(gè)“神經(jīng)網(wǎng)絡(luò)”處理器科研成果。由陳云霽、陳天石課題組提出的深度學(xué)習(xí)處理器指令集DianNaoYu被計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域頂級(jí)國(guó)際會(huì)議ISCA2016所接收,其評(píng)分排名總共近300篇投稿的第一名。
該成果的模擬實(shí)驗(yàn)表明,采用DianNaoYu指令集的寒武紀(jì)深度學(xué)習(xí)處理器相對(duì)于x86指令集的CPU有兩個(gè)數(shù)量級(jí)的性能提升。這項(xiàng)成果今年年內(nèi)將正式投入產(chǎn)業(yè)化,未來將實(shí)現(xiàn)刷臉支付、手機(jī)圖片搜索等應(yīng)用。
這項(xiàng)成果因最近AlphaGo對(duì)決李世石的熱點(diǎn)而受到人們的關(guān)注。但據(jù)界面新聞?dòng)浾吡私猓浼o(jì)處理器是長(zhǎng)期技術(shù)積累的成果。早在2014年5月刊發(fā)的《中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊》上陳天石和陳云霽就曾提到相關(guān)的內(nèi)容。
“從2008年到現(xiàn)在,我們已經(jīng)在體系結(jié)構(gòu)和人工智能的交叉研究方向上工作了六年。作為國(guó)際上為數(shù)不多的幾個(gè)長(zhǎng)期開展此方向研究的團(tuán)隊(duì)之一,我們?cè)诓槐徽J(rèn)可中堅(jiān)持了下來,并嘗試通過自己的努力來改善這個(gè)領(lǐng)域的環(huán)境(當(dāng)然近年來環(huán)境的改善也得益于深度學(xué)習(xí)的興起),最終得到了學(xué)術(shù)界一定程度的肯定。”文章中說道。
截至目前,陳天石博士和陳云霽研究員就光寒武紀(jì)系列的技術(shù)成果,已經(jīng)在計(jì)算機(jī)體系結(jié)構(gòu)方面國(guó)際四大頂級(jí)會(huì)議中斬獲兩篇ASPLOS,兩篇ISCA,一篇MICRO,一篇HPCA,引起科研圈子極大的關(guān)注。
據(jù)了解,DianNao是寒武紀(jì)系列的第一個(gè)原型處理器結(jié)構(gòu),包含一個(gè)處理器核,主頻為0.98GHz,峰值性能達(dá)每秒4520億次神經(jīng)網(wǎng)絡(luò)基本運(yùn)算,65nm工藝下功耗為0.485W,面積3.02mm2。
在若干代表性神經(jīng)網(wǎng)絡(luò)上的實(shí)驗(yàn)結(jié)果表明,DianNao的平均性能超過主流CPU核的100倍,但是面積和功耗僅為1/10,效能提升可達(dá)三個(gè)數(shù)量級(jí);DianNao的平均性能與主流GPGPU相當(dāng),但面積和功耗僅為主流GPGPU百分之一量級(jí)。
DaDianNao則在DianNao的基礎(chǔ)上進(jìn)一步擴(kuò)大了處理器的規(guī)模,包含16個(gè)處理器核和更大的片上存儲(chǔ),并支持多處理器芯片間直接高速互連,避免了高昂的內(nèi)存訪問開銷。
深度學(xué)習(xí)方法促進(jìn)了人工神經(jīng)網(wǎng)絡(luò)的發(fā)展,它在傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練中增加了一個(gè)預(yù)訓(xùn)練階段,即用無監(jiān)督學(xué)習(xí)對(duì)每一層網(wǎng)絡(luò)進(jìn)行一次專門的訓(xùn)練,然后才用有監(jiān)督學(xué)習(xí)對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行總體訓(xùn)練。
通過深度學(xué)習(xí)方法,人工神經(jīng)網(wǎng)絡(luò)的效果一舉趕上甚至顯著超過了支持向量機(jī)等其他機(jī)器學(xué)習(xí)方法。目前,包括IBM、谷歌、微軟、科大訊飛、百度等公司均將該技術(shù)應(yīng)用在工業(yè)級(jí)圖像和語音處理上,并取得了很好的效果。
因此人工神經(jīng)網(wǎng)絡(luò)也已經(jīng)成為最有效的認(rèn)知任務(wù)處理算法之一,未來隨著人工智能的健康發(fā)展,如DaDianNao這樣的專門的神經(jīng)網(wǎng)絡(luò)處理器也將跟隨產(chǎn)業(yè)不斷成長(zhǎng)。
此外,由于日常生活顯然需要進(jìn)行大量的認(rèn)知活動(dòng),計(jì)算機(jī)體系結(jié)構(gòu)研究者的目光也將從傳統(tǒng)的科學(xué)計(jì)算轉(zhuǎn)到認(rèn)知任務(wù)上。很多大公司已經(jīng)認(rèn)識(shí)到這一點(diǎn)。Intel和IBM等傳統(tǒng)硬件廠商都已經(jīng)成立了專門的部門進(jìn)行認(rèn)知任務(wù)處理的研究。在認(rèn)知任務(wù)已經(jīng)成了當(dāng)前計(jì)算機(jī)最主要的任務(wù)之一的情況下,用戶和市場(chǎng)會(huì)有加速人工神經(jīng)網(wǎng)絡(luò)的需求。
據(jù)陳天石介紹,目前課題組團(tuán)隊(duì)已開始著手進(jìn)行科研成果的產(chǎn)業(yè)化,未來應(yīng)用瞄準(zhǔn)企業(yè)、科研院所等高性能服務(wù)器、高效能終端芯片、機(jī)器人芯片三大領(lǐng)域。比如實(shí)現(xiàn)拍照即可獲取畫面中人物或物體的信息,對(duì)眾多視頻按類別或喜好進(jìn)行智能歸類,實(shí)現(xiàn)刷臉支付等等。陳天石說,未來的服務(wù)既包括民生,也包括國(guó)家重大需求。
當(dāng)然,未來寒武紀(jì)產(chǎn)業(yè)化成果是否順利,還需要時(shí)間來驗(yàn)證。