自學(xué)3天的阿法元完爆阿法狗,GitHub2017年度報(bào)告見證人工智能有多火!
Nature 今天上線的這篇重磅論文,詳細(xì)介紹了谷歌 DeepMind 團(tuán)隊(duì)最新的研究成果。人工智能的一項(xiàng)重要目標(biāo),是在沒有任何先驗(yàn)知識(shí)的前提下,通過完全的自學(xué),在極具挑戰(zhàn)的領(lǐng)域,達(dá)到超人的境地。
2017 人工智能到底有多火
01人工智能從 0 到 1, 無師自通完爆阿法狗 100-0
去年,有個(gè)小孩讀遍人世所有的棋譜,辛勤打譜,苦思冥想,棋藝精進(jìn),4-1 打敗世界冠軍李世石,從此人間無敵手。他的名字叫阿法狗。
今年,他的弟弟只靠一副棋盤和黑白兩子,沒看過一個(gè)棋譜,也沒有一個(gè)人指點(diǎn),從零開始,自?shī)首詷罚约簠⑽颍?00-0 打敗哥哥阿法狗。他的名字叫阿法元。
阿爾法元的最大亮點(diǎn),在于無需任何人類指導(dǎo),通過全新的強(qiáng)化學(xué)習(xí)方式自己成為自己的老師,在圍棋這一最具挑戰(zhàn)性的領(lǐng)域達(dá)到超過人類的精通程度。
自學(xué) 3 天,就打敗了舊版 AlphaGo
人類其實(shí)把阿法狗教壞了! 新一代的阿法元(AlphaGo Zero),完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗(yàn)知識(shí),完全靠自己一個(gè)人強(qiáng)化學(xué)習(xí)(reinforcement learning)和參悟,棋藝增長(zhǎng)遠(yuǎn)超阿法狗,百戰(zhàn)百勝,以 100-0 擊潰阿法狗。
達(dá)到這樣一個(gè)水準(zhǔn),阿法元只需要在 4 個(gè) TPU 上,花三天時(shí)間,自己左右互搏 490 萬棋局。而它的哥哥阿法狗,需要在 48 個(gè) TPU 上,花幾個(gè)月的時(shí)間,學(xué)習(xí)三千萬棋局,才打敗人類。
AlphaGo Zero 與此前版本有明顯差別:
AlphaGo-Zero 的訓(xùn)練時(shí)間軸
- AlphaGo Zero 僅用棋盤上的黑白子作為輸入,而前代則包括了小部分人工設(shè)計(jì)的特征輸入。
- AlphaGo Zero 僅用了單一的神經(jīng)網(wǎng)絡(luò)。在此前的版本中,AlphaGo 用到了“策略網(wǎng)絡(luò)”來選擇下一步棋的走法,以及使用“價(jià)值網(wǎng)絡(luò)”來預(yù)測(cè)每一步棋后的贏家。而在新的版本中,這兩個(gè)神經(jīng)網(wǎng)絡(luò)合二為一,從而讓它能得到更高效的訓(xùn)練和評(píng)估。
- AlphaGo Zero 并不使用快速、隨機(jī)的走子方法。在此前的版本中,AlphaGo 用的是快速走子方法,來預(yù)測(cè)哪個(gè)玩家會(huì)從當(dāng)前的局面中贏得比賽。相反,新版本它依靠高質(zhì)量的神經(jīng)網(wǎng)絡(luò)來評(píng)估下棋的局勢(shì)。
人工智能的一項(xiàng)重要目標(biāo),是在沒有任何先驗(yàn)知識(shí)的前提下,通過完全的自學(xué),在極具挑戰(zhàn)的領(lǐng)域,達(dá)到超人的境地。零基礎(chǔ)之上,進(jìn)而自我訓(xùn)練,實(shí)現(xiàn)超越。
通過數(shù)百萬次自我對(duì)弈,AlphaGo Zero 從零開始掌握了圍棋,在短短幾天內(nèi)就積累起了人類幾千年才有的知識(shí)。但它也發(fā)現(xiàn)了新的知識(shí),發(fā)展出打破常規(guī)的策略和新招,與 AlphaGo 在對(duì)戰(zhàn)李世石和柯潔時(shí)創(chuàng)造的那些交相輝映,卻又更勝一籌。
這些創(chuàng)造性的時(shí)刻給了我們信心:人工智能會(huì)成為人類智慧的增強(qiáng)器,幫助我們解決人類正在面臨的一些嚴(yán)峻挑戰(zhàn) 。
盡管才剛剛發(fā)展起來,AlphaGo Zero 已經(jīng)走出了通向上述目標(biāo)的關(guān)鍵一步。對(duì)于希望利用人工智能推動(dòng)人類社會(huì)進(jìn)步為使命的 DeepMind 來說,圍棋并不是 AlphaGo 的終極奧義,他們的目標(biāo)始終是要利用 AlphaGo 打造通用的、探索宇宙的終極工具。
AlphaGo Zero 的提升,讓人們看到了利用人工智能技術(shù)改變?nèi)祟惷\(yùn)的突破性機(jī)會(huì)。人工智能未來的發(fā)展,碼農(nóng)或?qū)⒋笈I(yè),程序員將成為"馴獸師"。
02人工智能系統(tǒng)完爆程序員實(shí)現(xiàn)真正自主編程
讓 AI 自動(dòng)編程是人工智能領(lǐng)域長(zhǎng)久以來的夢(mèng)想之一。不久前,來自彭博和英特爾實(shí)驗(yàn)室的兩位研究人員,號(hào)稱實(shí)現(xiàn)了首個(gè)能夠自動(dòng)生成完整軟件程序的 AI 系統(tǒng)“AI Programmer”。
這個(gè)“AI 程序員”利用遺傳算法和圖靈完備語(yǔ)言,開發(fā)的程序理論上能夠完成任何類型的任務(wù),AI 自動(dòng)編程的時(shí)代,大幕已開。
這個(gè)首個(gè)能夠自動(dòng)生成完整軟件程序的機(jī)器學(xué)習(xí)(ML)系統(tǒng),全程只需最低限度的人類參與。以遺傳算法(GA)為核心,加上緊密約束的編程語(yǔ)言,將其 ML 搜索空間的開銷降到最低。
AI Programmer 的軟件架構(gòu)
從圖中可見,由人類驅(qū)動(dòng)的部分非常少,只需要在開始輸入指令,最后接收適用于某項(xiàng)任務(wù)的函數(shù)即可,剩下部分全部由機(jī)器完成。
AI Programmer 的新穎部分源于:
- 獨(dú)特的系統(tǒng)設(shè)計(jì),包括用于效率和安全性的嵌入式手工解釋器(hand-crafted interpreter)。
- 對(duì)遺傳算法的增強(qiáng),納入了指令基因(instruction-gene)隨機(jī)化綁定,以及編程語(yǔ)言特定的基因組構(gòu)建及消除技術(shù)。
目前這個(gè)方面的成果還非常有限,比如讓 AI 自動(dòng)補(bǔ)完編程語(yǔ)言,或者執(zhí)行簡(jiǎn)單的加法程序。
研究人員表示,他們用這個(gè)系統(tǒng)證明了長(zhǎng)久以來的假設(shè),那就是功能完備的程序確實(shí)能夠被自動(dòng)生成。
具體到這項(xiàng)工作,AI Programmer 利用機(jī)器學(xué)習(xí)中的遺傳算法,模擬復(fù)雜的指令。雖然現(xiàn)在 AI Programmer 生成的程序,復(fù)雜程度與人類新手程序員編寫的結(jié)果相當(dāng)。但研究人員認(rèn)為,AI Programmer 編寫的程序完全可以超越傳統(tǒng)范疇,不受人類時(shí)間和智慧的局限。
AI 編寫的程序只是在測(cè)試復(fù)雜度和計(jì)算資源之間找到了最適合的點(diǎn)。換句話說,可能性無限。
研究人員還表示,我們需要重新思考,設(shè)計(jì)新的、面向機(jī)器的編程語(yǔ)言,因?yàn)楫?dāng)前的編程語(yǔ)言是面向人類的,不適用于基于 ML 的編程。“在考慮ML驅(qū)動(dòng)程序生成的未來時(shí),我們需要放棄和重新考慮典型程序語(yǔ)言創(chuàng)建的方法。”
研究人員表示,只有這樣做,我們才能開始設(shè)想一個(gè)由 AI 系統(tǒng)驅(qū)動(dòng),以人類創(chuàng)造力和設(shè)計(jì)為指導(dǎo)的計(jì)算機(jī)軟件開發(fā)的新未來。
GitHub 2017 年度報(bào)告見證人工智能有多火
GitHub Universe 是 GitHub 的年度盛會(huì),今年 10 月10-12 日,GitHub Universe 大會(huì)在舊金山召開。同時(shí),GitHub 也在其官網(wǎng)發(fā)布了 2017 年年度數(shù)據(jù)報(bào)告 —— GitHub Octoverse 報(bào)告。
報(bào)告顯示,2017 年 GitHub 社區(qū)共匯集了 2400 萬開發(fā)人員,150 萬個(gè)組織和企業(yè),6700 萬個(gè)存儲(chǔ)庫(kù),其中有 2500 萬個(gè)公共存儲(chǔ)庫(kù),用戶遍布世界 200 多個(gè)國(guó)家,“全球最大的同性交友網(wǎng)站”實(shí)至名歸啊!
GitHub 每年都會(huì)在年度盛會(huì)中推出數(shù)據(jù)報(bào)告,其中列出了一些年度的數(shù)據(jù),包括其網(wǎng)站中最受歡迎的編程語(yǔ)言、開源項(xiàng)目等。今年的數(shù)據(jù)更是讓人眼前一亮,Python 這匹編程語(yǔ)言中的黑馬,勢(shì)不可擋!
01.終結(jié)語(yǔ)言之爭(zhēng),GitHub 得分最高的語(yǔ)言
編程語(yǔ)言之間的戰(zhàn)爭(zhēng)是一場(chǎng)持久戰(zhàn),程序員們雖然對(duì)于這樣的內(nèi)容有些審美疲勞了,但是每次看到還是瘋狂的為自己的應(yīng)用打 Call。而 GitHub 作為一個(gè)豐富的資源庫(kù),其中包含有337種獨(dú)特的編程語(yǔ)言開發(fā)的開源項(xiàng)目。
那么,在 GitHub 中哪種語(yǔ)言可以封王呢?JavaScript,你想到了嗎?JavaScript 這一年在 GitHub 中共獲得 230 萬 pull request,比第二名 Python 多了兩倍還不止。
Python 今年的請(qǐng)求比去年增加了 40%,成功擠掉 Java 上升為第二位。Typescript 也是今年的黑馬語(yǔ)言,它在 GitHub 上的 pull request 比去年多了四倍。
2017 GitHub 上最受歡迎的前 15 門語(yǔ)言
排名前十五的語(yǔ)言(按先后順序):
- JavaScript
- Python
- Java
- Ruby
- PHP
- C++
- CSS
- C#
- Go
- C
- TypeScript
- Shell
- Swift
- Scala
- Objective-C
從 2017 GitHub 上最受歡迎的前 15 門語(yǔ)言可以看出:JavaScript 穩(wěn)居第一, 遙遙領(lǐng)先于第二名 Python,這可能和 GitHub 上關(guān)于 Web 前端的項(xiàng)目、開發(fā)者的數(shù)量龐大有一定關(guān)系。
值得注意的是:Python 已代替 Java 從去年的第三突進(jìn)了第二,相比去年它新增了 40% 的 PR 數(shù)。
近幾年 Python 的增長(zhǎng)勢(shì)頭一直非常迅猛,Python 雖然是腳本語(yǔ)言,但容易學(xué),同時(shí),Python 有非常多優(yōu)秀的深度學(xué)習(xí)庫(kù)可用,現(xiàn)在大部分深度學(xué)習(xí)框架都支持 Python。所以,Python 作為 AI 時(shí)代頭牌語(yǔ)言的位置基本確立。
再來看看 Java,Java 則被擠到第三位,不過 Java 9 剛發(fā)布不久,而且它的模塊化特性深受開發(fā)者喜愛,霸主地位還是很難撼動(dòng)的。
同時(shí),我們注意到 Objective-C 排行下降,從中可以看出移動(dòng)開發(fā)的熱度在減退。今年提交的 PR 甚至比去年還少不少,而 OC 是 iOS 開發(fā)的最主要語(yǔ)言,再聯(lián)想到 Java 排名的下降,可以看出,移動(dòng)開發(fā)的火熱度在下降,而且今年可能是首次下降。
究其本質(zhì)原因是,智能手機(jī)已經(jīng)越來越普及,當(dāng)你身邊的爺爺奶奶都擁有一部智能手機(jī)的時(shí)候,那只能說明,智能手機(jī)的市場(chǎng)份額已基本到頭了。
再加上現(xiàn)在流量基本被一些頭部的大廠占領(lǐng),移動(dòng)時(shí)代的流量獲取越來越難,移動(dòng)創(chuàng)業(yè)也就越來越難,自然移動(dòng)開發(fā)的市場(chǎng)需求沒法再持續(xù)增長(zhǎng)了。
不過,移動(dòng)開發(fā)市場(chǎng)沒那么火熱是事實(shí),但并不意味著移動(dòng)開發(fā)找不到工作,現(xiàn)在穩(wěn)定發(fā)展的公司移動(dòng)開發(fā)崗位是不可或缺的,缺的是真正有能力的人才。
所以,如果你已經(jīng)在從事移動(dòng)開發(fā),不必過多焦慮,專注提升自身技術(shù)才是王道,而如果你是想學(xué)習(xí)編程轉(zhuǎn)行的,那么現(xiàn)如今不建議再?gòu)?0 學(xué)習(xí)移動(dòng)開發(fā)了。
02.2017年誰(shuí)是最贊的開源者?誰(shuí)是最棒的開源項(xiàng)目?
GitHub 自 2007 年成立,如今已經(jīng)十年了,如今已經(jīng)是全球影響力最大、最權(quán)威的開源社區(qū)了,每年都有大量的企業(yè)和個(gè)人將自己的項(xiàng)目開源到這里進(jìn)行交流學(xué)習(xí)。
那么今年哪些項(xiàng)目最具價(jià)值?哪些項(xiàng)目獲得了程序員的廣泛討論?哪些項(xiàng)目又收集到了最全的資料呢?
被 fork 最多的前十個(gè)項(xiàng)目
TensorFlow 當(dāng)選第一,TensorFlow 是谷歌的第二代機(jī)器學(xué)習(xí)系統(tǒng),這也反映了越來越多的人對(duì)人工智能感興趣,并且正在學(xué)習(xí)準(zhǔn)備投入到機(jī)器學(xué)習(xí)當(dāng)中。
也側(cè)面說明了,現(xiàn)如今,很多開發(fā)者還是積極擁抱未來的,因?yàn)殚_源社區(qū),讓我們的心態(tài)更加開放,也讓我們接受、了解、學(xué)習(xí)新事物的成本低了太多。經(jīng)歷了被稱為“人工智能元年”的 2016 年,人工智能在 2017 年也迎來了更大的發(fā)展。
貢獻(xiàn)者最多的前十個(gè)項(xiàng)目
review 最多的前十個(gè)項(xiàng)目
discuss 最多的前十個(gè)項(xiàng)目
上面四個(gè)排行榜,TensorFlow 在其中三個(gè)都留下了自己的名字,再一次證明人工智能火熱的同時(shí),也從側(cè)面反映了越來越多的開發(fā)者對(duì)未來人工智能的發(fā)展充滿信心。
03.2017 年,GitHub 的參與人群出現(xiàn)了新變化
與 2016 年相比,2017 年 GitHub 有了更多的參與者。這些貢獻(xiàn)者中接近半數(shù)是學(xué)生,28% 是專業(yè)人士,22% 是編程愛好者。在經(jīng)驗(yàn)方面,只有 10% 的程序員是有經(jīng)驗(yàn)的,其中有 45% 的程序員是完全新手。
GitHub 參與人群變化
毫無疑問,開發(fā)人員永遠(yuǎn)都是 GitHub 的核心。2017 年 4 月,GitHub 擴(kuò)展了其開發(fā)者計(jì)劃,其中 GitHub 的開發(fā)人員以及付費(fèi)用戶的開發(fā)人員都包括在內(nèi)。這個(gè)計(jì)劃也使得 GitHub 上的開發(fā)人員大漲。
03.2017年 machine-learning 是最被廣泛使用的標(biāo)簽
2017 年 GitHub 增加了一個(gè)新功能"主題-存儲(chǔ)庫(kù)標(biāo)簽",支持用戶通過技術(shù)、行業(yè)等等搜索項(xiàng)目,那么經(jīng)過一年的運(yùn)營(yíng),哪些標(biāo)簽成為了 2017 年的主旋律標(biāo)簽?zāi)?
毫無疑問,游戲是 2017 年的大熱門,從全民王者榮耀就可見一斑,但"游戲"并不是天下無敵的,至少機(jī)器學(xué)習(xí)就可以和它平分秋色。
被使用最廣的標(biāo)簽
以下為標(biāo)簽詳情:
● machine-learning:https://github.com/topics/machine-learning
● game:https://github.com/topics/game
● iOS:https://github.com/topics/ios
● API:https://github.com/topics/api
● blog:https://github.com/topics/blog
● website:https://github.com/topics/website
● deep-learning:https://github.com/topics/deep-learning
● library:https://github.com/topics/library
● arduino:https://github.com/topics/arduino
● plugin:https://github.com/topics/plugin
● database:https://github.com/topics/database
● bot:https://github.com/topics/bot
整體數(shù)據(jù)概述:
- 2400 萬用戶
- 150 萬組織
- 6700 萬 Repostitories
- 130 萬學(xué)生開發(fā)者
- 用戶橫跨 200 個(gè)國(guó)家
- 四分之一的 GitHub 企業(yè)賬戶來自美國(guó)以外的國(guó)家
- 自 2016 年 9 月,公開發(fā)表 10 億 Commit
- 自 2016 年 9 月,2530 萬活躍項(xiàng)目
- 自 2016 年 9 月,1250 萬活躍 Issue
- 自 2016 年 9 月,新增 670 萬開發(fā)者
- 自 2016 年 9 月,新增 45.1 萬個(gè)組織入駐 GitHub
- 自 2016 年 9 月,120 萬人提交了他們的第一個(gè) Pull Request
- 自 2016 年 9 月,410 萬人創(chuàng)建了他們的第一個(gè) Repo
- 自 2016 年 9 月,130 萬新 Pull Request ,包括 Linus Torvald 的第一個(gè) GitHub Pull Request:https://github.com/Subsurface-divelog/subsurface/pull/155
- 合并了 100,000,000 次 Pull Request
- 關(guān)閉了 68,800,000 個(gè) Issue
- 62.4 萬 Pull Request 被 review
- 140 萬人在他人的 Issue 下討論
- Emoji 表情在 GitHub 上被用得很多
- 19.1 萬人 star 或 fork 了項(xiàng)目但沒有提交代碼
- 不包括框架和語(yǔ)言,下面的標(biāo)簽被使用得最多
- machine-learning
- game
- iOS
- API
- blog
- website
- deep-learning
- library
- arduino
- plugin
- database
- bot
最后點(diǎn)有趣的,emoji 表情排行榜,妥妥的排行第一,看來程序員很喜歡相互點(diǎn)贊的呢。
隨著社區(qū)的不斷發(fā)展,開源項(xiàng)目的不斷增長(zhǎng),GitHub 的報(bào)告對(duì)于我們對(duì)未來的技術(shù)趨勢(shì)判斷有很大的參考意義。
互聯(lián)網(wǎng)行業(yè)最怕的是固步自封,不與時(shí)俱進(jìn),做技術(shù)的一樣,我們要時(shí)刻更新自己,不人云亦云,但是要擁抱變化,只有這樣,我們才能在時(shí)代的潮流中立于不敗。
最后,感謝 GitHub,感謝開源精神,讓我們做技術(shù)的可以與全世界接軌,更改變了我們學(xué)習(xí)新事物的方式。感興趣的不妨點(diǎn)擊“閱讀原文”查看完整報(bào)告。