云計算是人工智能民主化的關(guān)鍵嗎?
在日本豐收的季節(jié),一些農(nóng)民每天花大量時間將農(nóng)場的黃瓜分成不同的類別,而這是一些人決定采用自動化實施這種沉悶而耗時的工作原因之一。盡管他們不是機器學習專家,但他開始使用谷歌公司熱門的開源機器學習框架Tensor Flow,并開發(fā)了一種深度學習模型,可根據(jù)大小、形狀和其他屬性對黃瓜進行分類。這個系統(tǒng)并不完美(其準確率約為75%)。但這是人工智能在規(guī)模較小的家族企業(yè)也能很快轉(zhuǎn)型的一個標志。
像谷歌、亞馬遜、微軟、蘋果和Facebook這樣的行業(yè)巨頭當然非常了解這種變革力量。深度學習支撐著亞馬遜的推薦系統(tǒng)、谷歌公司的搜索和翻譯工具、微軟公司的Cortana個人助理,以及許多其他廣泛使用的應(yīng)用程序和服務(wù)。大多數(shù)財富500強公司也有專門的人工智能團隊。但是這些廠商對人工智能的興趣已經(jīng)網(wǎng)羅了大量的數(shù)據(jù)科學家的陣營,這使得大多數(shù)中小型企業(yè)渴望探索人工智能如何改善其業(yè)務(wù),但缺乏專業(yè)知識。
即使那些有能力聘請頂級人工智能專家的企業(yè)仍然需要準備大量的數(shù)據(jù)集,并花費大量的計算能力來分析它們,并教他們的神經(jīng)網(wǎng)絡(luò)識別某些模式或?qū)ο蟆5?,大型云計算提供商意識到這些問題,他們相信已經(jīng)找到了幫助人們克服這些問題的方法。
機器學習即服務(wù)或云計算人工智能現(xiàn)在是AmazonWebServices(AWS)、MicrosoftAzure、GoogleCloud和IBMCloud等云計算平臺的主要組件。從本質(zhì)上來說,這些企業(yè)提供的工作是通過為其客戶提供預(yù)訓(xùn)練的深度學習模型(用于圖像識別)以及簡化構(gòu)建、培訓(xùn)和部署過程的工具云上的模型。
“有些數(shù)據(jù)科學家知道如何采用編碼的工具,有些軟件開發(fā)人員可能不知道如何正確調(diào)整算法,但是如果向他們提供API以進行編碼,誰都可以構(gòu)建應(yīng)用程序,最后還有點擊者的工具,這些工具基本上通過圖形用戶界面(GUI)相互關(guān)聯(lián),涵蓋了世界上絕大多數(shù)人,SkyCype公司的首席執(zhí)行官ChrisNicholson說。該公司為企業(yè)提供深度學習工具。
微軟Azure MLStudio,AmazonSage Maker,Google Cloud ML Engine都是類似的平臺,它們更接近數(shù)據(jù)科學家的終端,幫助深度學習專家大規(guī)模地培訓(xùn)、優(yōu)化和部署他們的模型。而Amazon Rekognition和谷歌翻譯等API則是以預(yù)訓(xùn)練模型為基礎(chǔ)構(gòu)建的API:用戶只需輸入想要分析的公用對象或需要翻譯的文本的數(shù)據(jù)圖像或視頻,然后等待API提供結(jié)果即可。
后一種方法的問題在于,深度學習通常用于解決特定的業(yè)務(wù)問題,而預(yù)訓(xùn)練模型可能無法解決。換句話說,如果想讓它識別不同類型的黃瓜,那么采用可以識別不同品種的小貓的API是沒有用的。
“他們說:‘嘿,我們發(fā)現(xiàn)了一堆數(shù)據(jù),我們訓(xùn)練了一個模型,現(xiàn)在可以用它來預(yù)測圖像。'”Nicholson說,“但這是一個錯誤的解決方案在這個意義上,如果用戶想定制這個解決方案,在其自己的數(shù)據(jù)上訓(xùn)練一個模型仍然是非常困難和必要的。”
為了彌合高度定制的神經(jīng)網(wǎng)絡(luò)與基本的“一勞永逸”預(yù)訓(xùn)練模型之間的差距,谷歌公司最近推出了CloudAutoML,該系統(tǒng)使用客戶數(shù)據(jù)自動構(gòu)建自定義深度學習模型。CloudAutoMLVision是新服務(wù)的第一個版本,它允許用戶通過拖放界面創(chuàng)建用于圖像識別的定制機器學習模型。
過去幾個月,幾家公司一直在測試Cloud Auto ML。例如,迪斯尼公司已經(jīng)使用該工具開發(fā)了一種方法,讓顧客可以在其商品中搜索特定的迪士尼角色,即使產(chǎn)品未貼上角色名稱標簽。而企業(yè)仍然需要為Auto ML服務(wù)準備自己的數(shù)據(jù),但是,這對于一些企業(yè)可能會造成問題。
“有很多特定于組織的數(shù)據(jù),比如他們?nèi)绾翁幚戆l(fā)票或他們?nèi)绾芜M行客戶檢查等。”Nicholson說,“對于收集這些數(shù)據(jù)的組織來說,這仍然是一個挑戰(zhàn),因為很多組織首先并沒有真正掌握他們的數(shù)據(jù)。”
谷歌公司的云計算業(yè)務(wù)位居AWS和微軟Azure之后,名列第三位,因此谷歌公司試圖利用其人工智能專業(yè)知識贏得更多客戶并不奇怪。但考慮到培訓(xùn)和部署深度學習模型所需的計算資源,所有主要云計算供應(yīng)商都愿意為此目的租用芯片。
隨著企業(yè)對人工智能的興趣增加,機器學習工具無疑將被視為任何云計算服務(wù)的重要組成部分。事實上,IDC預(yù)測,到2021年,75%的商業(yè)企業(yè)應(yīng)用程序?qū)⑹褂萌斯ぶ悄堋?ldquo;因此,企業(yè)需要提供這些類型的功能,就像他們需要提供容器功能或監(jiān)控服務(wù)一樣。”IDC公司認知/人工智能系統(tǒng)和內(nèi)容分析研究的研究總監(jiān)Dave Schubmehl說。
但在企業(yè)急于部署深度學習工具之前,他們應(yīng)該停下來考慮是否存在使用它們的明確商業(yè)案例。“人們正在以一種非常具體的方式使用深度學習來解決一個非常具體的問題。”Nicholson說,“那些不能確定他們想要解決的具體問題的企業(yè)不太可能成功。”