流行的十四個(gè)機(jī)器學(xué)習(xí)編程語(yǔ)言框架和工具
譯文【51CTO.com快譯】如果你想知道哪些不斷壯大的編程語(yǔ)言庫(kù)和工具是實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型的不錯(cuò)選擇,那么隨時(shí)可以獲得幫助。
O'Reilly的一項(xiàng)新調(diào)查發(fā)現(xiàn),主要從事技術(shù)、金融和醫(yī)療保健行業(yè)的1300多人透露了他們?cè)诠臼褂玫臋C(jī)器學(xué)習(xí)技術(shù)。
本文介紹了面向數(shù)據(jù)科學(xué)界寵兒Python的軟件框架和庫(kù)、大數(shù)據(jù)平臺(tái)以及處理機(jī)器學(xué)習(xí)管道每個(gè)階段的基于云的服務(wù)。
說(shuō)到使用機(jī)器學(xué)習(xí)或報(bào)告所稱的AI,大多數(shù)公司仍處于評(píng)估階段,實(shí)施的最常用工具是用于“模型可視化”和“自動(dòng)模型搜索和超參數(shù)調(diào)整”的工具。
不出所料,一種最常見(jiàn)的機(jī)器學(xué)習(xí)是監(jiān)督學(xué)習(xí),即使用大量的標(biāo)記數(shù)據(jù)來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型。比如說(shuō),負(fù)責(zé)找出視頻中人員的計(jì)算機(jī)視覺(jué)模型可以拿注釋的圖像加以訓(xùn)練,以表明圖像中有沒(méi)有人。
圖片來(lái)源:O'Reilly
以下是公司企業(yè)聲稱用于機(jī)器學(xué)習(xí)的庫(kù)、框架、大數(shù)據(jù)平臺(tái)和云服務(wù)。
軟件庫(kù)和框架
1.TensorFlow
谷歌廣泛使用的機(jī)器學(xué)習(xí)框架,旨在處理訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí)所需要的數(shù)值計(jì)算,能夠在CPU、GPU和專用芯片(比如谷歌的張量處理單元即TPU)之間劃分計(jì)算任務(wù)。
2.scikit-learn
用于數(shù)據(jù)挖掘和數(shù)據(jù)分析的一種流行Python庫(kù),使用了眾多機(jī)器學(xué)習(xí)算法。
3.Pytorch
一種開(kāi)源深度學(xué)習(xí)框架,學(xué)起來(lái)比TensorFlow等與之競(jìng)爭(zhēng)的框架更容易,旨在用于機(jī)器學(xué)習(xí)管道的每個(gè)階段。
4.Keras
這種深度學(xué)習(xí)框架用于處理神經(jīng)網(wǎng)絡(luò)(支持深度學(xué)習(xí)的受大腦啟發(fā)的數(shù)學(xué)模型),旨在比與之競(jìng)爭(zhēng)的框架更易于使用。
Keras用Python編寫(xiě),它能夠在TensorFlow、微軟認(rèn)知工具包(CNTK)和Python庫(kù)Theano上運(yùn)行。
云套件
5.微軟Azure ML Studio
這套服務(wù)旨在幫助公司在微軟的Azure云上以及靠近網(wǎng)絡(luò)邊緣的計(jì)算設(shè)備上構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。工具有助于使識(shí)別和調(diào)整適當(dāng)?shù)臋C(jī)器學(xué)習(xí)模型這個(gè)過(guò)程實(shí)現(xiàn)自動(dòng)化,并有助于擴(kuò)展底層計(jì)算以滿足需求。
6.谷歌云機(jī)器學(xué)習(xí)引擎
與Azure ML Studio相似,谷歌云機(jī)器學(xué)習(xí)引擎也提供了用于訓(xùn)練、評(píng)估、調(diào)整和部署機(jī)器學(xué)習(xí)模型的工具。
7.亞馬遜SageMaker
亞馬遜SageMaker同樣提供了用于構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型的服務(wù),以便能夠以更低的成本更快地將模型部署到生產(chǎn)環(huán)境。
大數(shù)據(jù)平臺(tái)工具
8.H20
這是一種開(kāi)源內(nèi)存中平臺(tái),可以跨分布式系統(tǒng)擴(kuò)展機(jī)器學(xué)習(xí)工作負(fù)載。
該平臺(tái)旨在支持使用最廣泛的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)算法,并提供一定程度的自動(dòng)化,以幫助數(shù)據(jù)科學(xué)家識(shí)別和調(diào)整適當(dāng)?shù)臋C(jī)器學(xué)習(xí)模型。
9.Prodigy
Prodigy旨在簡(jiǎn)化訓(xùn)練和評(píng)估機(jī)器學(xué)習(xí)模型的過(guò)程,這種工具可幫助數(shù)據(jù)科學(xué)家適當(dāng)?shù)貥?biāo)注訓(xùn)練數(shù)據(jù)集。
10.Spark NLP
Spark NLP提供了一個(gè)自然語(yǔ)言處理(NLP)庫(kù),旨在處理運(yùn)行內(nèi)存中大數(shù)據(jù)平臺(tái)Apache Spark的分布式系統(tǒng)。
11.OpenAI Gym
這種工具包用于開(kāi)發(fā)和比較強(qiáng)化學(xué)習(xí)算法,強(qiáng)化學(xué)習(xí)是一種機(jī)器學(xué)習(xí),其中軟件代理通過(guò)因?qū)е缕谕Y(jié)果的動(dòng)作而受到獎(jiǎng)勵(lì)來(lái)學(xué)習(xí)如何執(zhí)行任務(wù)。
12.Analytics Zoo
Analytics Zoo將一系列大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)整合到它所說(shuō)的統(tǒng)一分析和AI平臺(tái)中。
該平臺(tái)整合了Spark、TensorFlow、Keras和深度學(xué)習(xí)庫(kù)BigDL,可以跨分布式Hadoop和Spark集群擴(kuò)展機(jī)器學(xué)習(xí)模型,用于訓(xùn)練和推理。
13.AllenNLP
旨在簡(jiǎn)化設(shè)計(jì)和評(píng)估解決自然語(yǔ)言處理問(wèn)題的新深度學(xué)習(xí)模型這個(gè)過(guò)程。
該庫(kù)包括面向核心NLP問(wèn)題和NLP應(yīng)用的高質(zhì)量模型的參考實(shí)現(xiàn)。
14.Rise Lab Ray
這種框架用于跨分布式系統(tǒng)運(yùn)行機(jī)器學(xué)習(xí)模型,提供高性能和容錯(cuò)性,同時(shí)仍具有可擴(kuò)展性。
原文標(biāo)題:Most popular programming language frameworks and tools for machine learning,作者:Nick Heath
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】