如何使機(jī)器學(xué)習(xí)訓(xùn)練更便宜,更有效
隨著越來(lái)越多的企業(yè)將大量任務(wù)轉(zhuǎn)向人工智能,企業(yè)很快發(fā)現(xiàn),培訓(xùn)人工智能模型是昂貴、困難和耗時(shí)的一項(xiàng)工作。
新公司MosaicML的目標(biāo)是找到一種新的方法來(lái)應(yīng)對(duì)這些挑戰(zhàn),現(xiàn)在正準(zhǔn)備推出一種基于云的神經(jīng)網(wǎng)絡(luò)訓(xùn)練系統(tǒng),旨在從算法和系統(tǒng)層面解決問(wèn)題。
1該公司創(chuàng)始人宣稱(chēng)該想法是通過(guò)一種組合——“馬賽克(Mosaic)“方法來(lái)提高機(jī)器學(xué)習(xí)的效率,這些方法可以一起加速和改善培訓(xùn)。核心思路是,由于機(jī)器學(xué)習(xí)模型在云上、數(shù)據(jù)中心或本地是昂貴的,關(guān)鍵問(wèn)題在于消除學(xué)習(xí)過(guò)程中的低效。
目前公司已經(jīng)構(gòu)建了兩個(gè)組件,將成為其未來(lái)產(chǎn)品的一部分。Composer是一個(gè)用于高效機(jī)器學(xué)習(xí)(ML)訓(xùn)練的開(kāi)源方法庫(kù),可以將這些方法組合成“食譜”,從大約20種不同的方法開(kāi)始,并對(duì)它們的性能好處進(jìn)行嚴(yán)格的基準(zhǔn)測(cè)試。隨著產(chǎn)品的成熟,還會(huì)添加其他方法。
另一個(gè)MosaicML組件是Explorer,這是一個(gè)可視化工具和界面,企業(yè)開(kāi)發(fā)人員可以通過(guò)比較成本、質(zhì)量和運(yùn)行實(shí)驗(yàn)所需的時(shí)間來(lái)模擬、繪制和選擇運(yùn)行模型的最佳路徑。Explorer旨在為用戶(hù)提供在標(biāo)準(zhǔn)基準(zhǔn)上進(jìn)行的數(shù)千次訓(xùn)練運(yùn)行中所衡量的成本、時(shí)間和質(zhì)量權(quán)衡的可視化結(jié)果。用戶(hù)可以通過(guò)方法、云和硬件類(lèi)型進(jìn)行篩選,以達(dá)到最佳的運(yùn)行測(cè)試協(xié)議。
關(guān)鍵是這些技術(shù)要讓傳統(tǒng)訓(xùn)練過(guò)程更高效。
這種想法和需求來(lái)自人工智能、機(jī)器學(xué)習(xí)和最初創(chuàng)建及測(cè)試模型的步驟。傳統(tǒng)方法中,人工智能開(kāi)發(fā)人員想出了一些基本可行但效率相當(dāng)?shù)偷姆椒āI疃葘W(xué)習(xí)的世界一直在證明,東西可以工作,但不是高效的,但這無(wú)關(guān)緊要,因?yàn)橛?jì)算(算力)相對(duì)便宜。問(wèn)題是,這只在模型很小的時(shí)候是正確的。
一旦模型變得非常大,它的計(jì)算方面實(shí)際上變得非常昂貴,如今正處于人工智能行業(yè)的一個(gè)拐點(diǎn),模型變得非常大,數(shù)據(jù)集也非常大,所以現(xiàn)在的費(fèi)用非常大。在GPT-3(延展閱讀:DaaS企業(yè)級(jí)GPT語(yǔ)言建模問(wèn)世)的訓(xùn)練花費(fèi)500萬(wàn)美元——這可能只是一個(gè)花費(fèi)500萬(wàn)美元的實(shí)驗(yàn)。
這就是MosaicML開(kāi)始在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域看到機(jī)遇的地方。
MosaicML首席執(zhí)行官表示:“我們關(guān)注的是那些核心競(jìng)爭(zhēng)力不是人工智能的企業(yè),但它們需要能夠以成本效益高的方式使用這些技術(shù),從數(shù)據(jù)中提取價(jià)值。如果你是Meta(原Facebook)或谷歌,你有一個(gè)龐大的團(tuán)隊(duì)可以做到這一點(diǎn),他們可以節(jié)省昂貴的計(jì)算,自己管理。他們最終可能也會(huì)使用這些工具,但他們并不真的需要我們。商用企業(yè)是我們的首要目標(biāo)。”
MosaicML發(fā)布了它的開(kāi)源庫(kù),以便潛在的客戶(hù)和開(kāi)發(fā)人員可以使用它,并了解它的功能和特性。但目前產(chǎn)品尚未正式命名,預(yù)計(jì)將于2022年初推出免費(fèi)版本和付費(fèi)支持版本。
“當(dāng)你訓(xùn)練一個(gè)模型時(shí),你真正關(guān)心的是成本。”他說(shuō)。但之后你會(huì)開(kāi)始考慮其他因素,包括事情需要多長(zhǎng)時(shí)間以及它的效果表現(xiàn)如何。
這個(gè)Explorer可視化工具可以讓你看到不同。如果不想花那么多錢(qián),只是做一些廉價(jià)的實(shí)驗(yàn),就可以試試它。這個(gè)想法是給用戶(hù)提供工具,讓他們了解東西的成本。但如果他們沒(méi)有任何想法,就真的無(wú)法計(jì)劃,進(jìn)行這些實(shí)驗(yàn)就會(huì)變得非常困難。最初,MosaicML將在云計(jì)算中的模型上工作,因?yàn)檫@些變量更容易根據(jù)每個(gè)供應(yīng)商的費(fèi)率成本來(lái)衡量。
人工智能的流行將更多的組織帶到了高性能計(jì)算(HPC)領(lǐng)域,不管他們是否愿意。對(duì)于任何進(jìn)軍高性能計(jì)算領(lǐng)域的組織來(lái)說(shuō),模型創(chuàng)建和優(yōu)化都是最大的挑戰(zhàn)之一,這當(dāng)然比簡(jiǎn)單地獲取硬件還要困難。
行業(yè)分析專(zhuān)家稱(chēng),這是一種可行的方法來(lái)幫助更多的人工智能用戶(hù)。MosaicML正在解決模型優(yōu)化問(wèn)題,有一些優(yōu)化,如Nvidia TensorRT,針對(duì)特定硬件進(jìn)行優(yōu)化,但MosaicML則追求算法優(yōu)化。用于訓(xùn)練的人工智能硬件非常昂貴,而且是非常高端前沿的技術(shù)。如果你能將培訓(xùn)時(shí)間減少50%,就能相應(yīng)地降低成本。而且客戶(hù)也不需要以超高的價(jià)格聘請(qǐng)高端人才。


























