機(jī)器學(xué)習(xí)開(kāi)源項(xiàng)目TOP 5,別就天天只知道TensorFlow!
雖然人類(lèi)社會(huì)到今天經(jīng)歷過(guò)大大小小很多次技術(shù)變遷和革命,但很明顯,機(jī)器學(xué)習(xí)是目前技術(shù)領(lǐng)域最熱門(mén)的技術(shù)之一。今年早些時(shí)候,Stack Overflow發(fā)布了一項(xiàng)大規(guī)模開(kāi)發(fā)人員調(diào)查的結(jié)果,機(jī)器學(xué)習(xí)專(zhuān)家在薪酬方面僅次于DevOps專(zhuān)家。機(jī)器學(xué)習(xí)正在經(jīng)歷一段繁榮時(shí)期,但對(duì)于新手而言,開(kāi)源項(xiàng)目經(jīng)常會(huì)讓人困惑。
作為程序員,你也想擁抱機(jī)器學(xué)習(xí)的春天嗎?希望提高機(jī)器學(xué)習(xí)技能嗎?為什么不看一下GitHub上***的開(kāi)源機(jī)器學(xué)習(xí)項(xiàng)目?本文綜合評(píng)比了Github上幾乎所有的開(kāi)源機(jī)器學(xué)習(xí)項(xiàng)目,最終找出了前五大貢獻(xiàn)度、活躍度、文檔完善情況和Star數(shù)量最多的項(xiàng)目。
讓我們開(kāi)始吧!
1. TensorFlow – ★ 76.2K
TensorFlow位于這個(gè)列表的頂部并不奇怪,這是迄今為止GitHub上***的機(jī)器學(xué)習(xí)項(xiàng)目,甚至有傳言表示,Google正準(zhǔn)備借助此項(xiàng)目重新踏入中國(guó)。
谷歌機(jī)器智能研究機(jī)構(gòu)Google Brain團(tuán)隊(duì)的一員表示,TensorFlow是一個(gè)使用數(shù)據(jù)流圖進(jìn)行數(shù)值計(jì)算的開(kāi)源軟件庫(kù)。它配備了易于使用的Python界面和其他語(yǔ)言的界面來(lái)構(gòu)建和執(zhí)行計(jì)算圖。
Jeff Dean在今年早些時(shí)候表示,當(dāng)開(kāi)源TensorFlow時(shí),谷歌希望全世界的每個(gè)人都可以建立一個(gè)機(jī)器學(xué)習(xí)平臺(tái)。 TensorFlow 1.0是一個(gè)快速、靈活,可用于超出其最初設(shè)計(jì)的廣泛應(yīng)用的生產(chǎn)型產(chǎn)品。它還包括用于Java和Go的實(shí)驗(yàn)性API以及用于對(duì)象檢測(cè)和本地化以及基于相機(jī)的圖像程式化的新Android演示。(Github開(kāi)源地址:https://github.com/tensorflow/tensorflow)
2. scikit-learn –★ 22.7K
第二名是scikit-learn,一個(gè)用于機(jī)器學(xué)習(xí)的Python模塊。scikit擁有許多簡(jiǎn)單高效的數(shù)據(jù)挖掘和數(shù)據(jù)分析工具。scikit背后的基本動(dòng)機(jī)是For Science!因此,它在各種情況下都是高度可訪問(wèn)和可重用的。另外,它建立了像NumPy,SciPy和matplotlib等知名的數(shù)據(jù)科學(xué)工具。
今年早些時(shí)候,Groupon軟件工程總監(jiān)Adam Geitgey談了開(kāi)發(fā)人員應(yīng)該如何進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域。他表示,程序員肯定應(yīng)該從學(xué)習(xí)Python開(kāi)始。 這是迄今為止機(jī)器學(xué)習(xí)***的編程語(yǔ)言,為了解決大多數(shù)機(jī)器學(xué)習(xí)問(wèn)題(不需要深入學(xué)習(xí)),答案很簡(jiǎn)單,你只需要安裝幾個(gè)python庫(kù):scikit-learn,NumPy和pandas。這些工具是免費(fèi)的,旨在協(xié)同工作。(Github開(kāi)源地址:https://github.com/scikit-learn/scikit-learn)
3. PredictionIO –★ 10.6K
PredictionIO是這個(gè)名單里的新手,這使得它的高排名和受歡迎程度更加令人印象深刻。上個(gè)月,Apache軟件基金會(huì)發(fā)布了PredictionIO,之后就大受程序員歡迎。PredictionIO建立在***進(jìn)的開(kāi)源堆棧之上,該機(jī)器學(xué)習(xí)服務(wù)器專(zhuān)為開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家設(shè)計(jì),可為任何機(jī)器學(xué)習(xí)任務(wù)創(chuàng)建預(yù)測(cè)引擎。
開(kāi)發(fā)人員可以創(chuàng)建可部署的應(yīng)用程序,而無(wú)需將底層技術(shù)拼湊在一起,并提供完整的堆棧和模板。PredictionIO直接構(gòu)建在Spark和Hadoop上,允許開(kāi)發(fā)人員使用可定制的模板快速構(gòu)建和部署引擎,作為生產(chǎn)中的Web服務(wù),它是用Scala寫(xiě)的。
PredictionIO的主要目的是簡(jiǎn)化數(shù)據(jù)基礎(chǔ)架構(gòu)管理,程序員通過(guò)實(shí)現(xiàn)自己的機(jī)器學(xué)習(xí)模型,可以將它們無(wú)縫地整合到引擎中,它還通過(guò)系統(tǒng)化的流程和預(yù)先構(gòu)建的評(píng)估措施來(lái)加速機(jī)器學(xué)習(xí)建模。(Github開(kāi)源地址:https://github.com/apache/incubator-predictionio)
4. Swift AI – ★5K
雖然Swift可能正在經(jīng)歷一些逆轉(zhuǎn),但Swift AI繼續(xù)在GitHub上獲得贊譽(yù)。Swift AI是一個(gè)完全用Swift編寫(xiě)的高性能深度學(xué)習(xí)庫(kù),支持所有的Apple平臺(tái),Macbook用戶(hù)應(yīng)該特別興奮!
Swift AI是為那些有興趣用Swift編寫(xiě)神經(jīng)網(wǎng)絡(luò)的人提供的一個(gè)有趣的工具。NeuralNet類(lèi)包含一個(gè)完全連接的前饋人工神經(jīng)網(wǎng)絡(luò)。 通過(guò)對(duì)深度學(xué)習(xí)的支持,NeuralNet的設(shè)計(jì)具有靈活性,可用于性能至關(guān)重要的應(yīng)用。(Github開(kāi)源地址:https://github.com/Swift-AI/Swift-AI)
5. GoLearn – ★4.7K
名單的***一名是GoLearn,一個(gè)用于GO語(yǔ)言的“batteries included”機(jī)器學(xué)習(xí)庫(kù)。目前仍在積極開(kāi)發(fā)中,這個(gè)項(xiàng)目正在尋找有興趣從用戶(hù)那里接受反饋的開(kāi)發(fā)者。如果使用了SciPy,WEKA或R,GoLearn的機(jī)器學(xué)習(xí)問(wèn)題模型將會(huì)很熟悉。數(shù)據(jù)被表示為類(lèi)似于電子表格的平板表格,并用于訓(xùn)練和預(yù)測(cè)。
作為一個(gè)相對(duì)較新的項(xiàng)目,愿望清單比實(shí)際的現(xiàn)有工具要長(zhǎng)。所以,如果你正在尋找一個(gè)真正有所作為的項(xiàng)目,GoLearn可能是你需要的。(Github開(kāi)源地址:https://github.com/sjwhitworth/golearn)
結(jié)論
無(wú)論是想加入一個(gè)知名項(xiàng)目,還是想用新手項(xiàng)目工作,GitHub上都有非常不錯(cuò)的開(kāi)源機(jī)器學(xué)習(xí)項(xiàng)目。這些項(xiàng)目也需要程序員的不斷貢獻(xiàn),還不快去Github上看一看?