微軟認(rèn)知服務(wù)為企業(yè)帶來(lái)云AI
與其他基于云的產(chǎn)品一樣,Azure中的認(rèn)知服務(wù)讓企業(yè)用戶能夠更容易地使用AI服務(wù)。但是,其價(jià)格和整合仍然是一大挑戰(zhàn)。
在企業(yè)用戶中,云服務(wù)是AI應(yīng)用的一個(gè)關(guān)鍵推手。對(duì)于Azure用戶來(lái)說(shuō),一套被稱為微軟認(rèn)知服務(wù)的產(chǎn)品正是發(fā)揮著這樣的作用。
對(duì)于企業(yè)用戶而言,人工智能即服務(wù)讓他們能夠較容易地使用上執(zhí)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等算法的應(yīng)用,且無(wú)需購(gòu)買和建設(shè)用于執(zhí)行算法的昂貴定制基礎(chǔ)設(shè)施。它還允許開(kāi)發(fā)人員使用相同的后端代碼為Windows、iOS、Android和瀏覽器客戶端提供AI功能。
大多數(shù)的主流云供應(yīng)商們都提供了一套基于AI的功能集(并在不斷完善之),而微軟認(rèn)知服務(wù)則是目前最大的功能集之一。以下簡(jiǎn)單列舉了其主要功能以及與其他Azure服務(wù)和應(yīng)用場(chǎng)景的集成選項(xiàng)。
微軟認(rèn)知服務(wù)組合有哪些內(nèi)容?
與大多數(shù)AI產(chǎn)品類似,微軟認(rèn)知服務(wù)主要關(guān)注圖像、語(yǔ)音、語(yǔ)言和非結(jié)構(gòu)化數(shù)據(jù)分析。其產(chǎn)品組合擁有著超過(guò)二十個(gè)以上的服務(wù),相關(guān)API和軟件開(kāi)發(fā)者工具包(SDK)可分為六類:
- 視覺(jué):圖像分析、對(duì)象識(shí)別和面部識(shí)別等功能;
- 語(yǔ)音:轉(zhuǎn)錄口語(yǔ)和不同語(yǔ)種的文本翻譯;
- 語(yǔ)言:分析自然語(yǔ)言的服務(wù),具體包括拼寫(xiě)檢查、情緒分析以及對(duì)元數(shù)據(jù)和邏輯部分或斷句的解析文本;
- 知識(shí):分析和映射數(shù)據(jù)的功能,以求發(fā)現(xiàn)諸如推薦或查詢自動(dòng)完成等任務(wù)的關(guān)系與模式;
- 搜索:與Bing搜索引擎集成的服務(wù),包括圖像與新聞搜索API;以及
- 實(shí)驗(yàn)室:仍處于開(kāi)發(fā)階段的各種實(shí)驗(yàn)性服務(wù),具體包括基于手勢(shì)的控制、地圖路線規(guī)劃與物流、路線與距離優(yōu)化以及基于位置的分析。
企業(yè)應(yīng)用與應(yīng)用程序
與那些模擬企業(yè)用戶現(xiàn)有IT功能的眾多云服務(wù)(例如計(jì)算實(shí)例、對(duì)象存儲(chǔ)與數(shù)據(jù)庫(kù))不同,微軟認(rèn)知服務(wù)旨在實(shí)現(xiàn)全新的應(yīng)用類型,而不是使用現(xiàn)有的。其中大多數(shù)的服務(wù)涉及了對(duì)之前難以處理的數(shù)據(jù)類型的分析,例如照片、視頻、語(yǔ)音、位置和非結(jié)構(gòu)化文本等。因此,人工智能和機(jī)器學(xué)習(xí)的應(yīng)用場(chǎng)景高度依賴于企業(yè)用戶的經(jīng)營(yíng)業(yè)務(wù)、其可用數(shù)據(jù)源以及其員工的創(chuàng)造性。
微軟認(rèn)知服務(wù)的一些企業(yè)應(yīng)用示例包括:
- 一家荷蘭家具企業(yè)使用建議API來(lái)為客戶提供建議,例如經(jīng)常一起購(gòu)買的商品或基于過(guò)去訂單歷史的建議。
- 一家企業(yè)使用微軟的計(jì)算機(jī)視覺(jué)、人臉與表情API在各種不同的非結(jié)構(gòu)化內(nèi)容(包括文本、圖像和視頻等)中自動(dòng)提取元數(shù)據(jù)。這家企業(yè)可以通過(guò)掃描視頻來(lái)識(shí)別出每個(gè)人臉?biāo)憩F(xiàn)出的情緒,然后為其打上標(biāo)簽,如幸福、悲傷或驚訝等。
- Uber使用人臉API來(lái)驗(yàn)證駕車司機(jī)與帳戶登記的注冊(cè)司機(jī)是否是同一人。
正如這些應(yīng)用示例所示,銷售支持、客戶關(guān)系管理、安全、對(duì)話UI和圖像/視頻分析是微軟認(rèn)知服務(wù)的主要應(yīng)用領(lǐng)域。
學(xué)習(xí)曲線與潛在挑戰(zhàn)
對(duì)于已經(jīng)非常熟悉云應(yīng)用開(kāi)發(fā)的開(kāi)發(fā)人員來(lái)說(shuō),微軟認(rèn)知服務(wù)的學(xué)習(xí)曲線是很短的;而那些不了解云應(yīng)用開(kāi)發(fā)的員工也只需很少的編碼就可以實(shí)現(xiàn)認(rèn)知服務(wù)與Azure Logic Apps的集成。
但是,這些服務(wù)不是沒(méi)有其挑戰(zhàn)的。例如,很難將基于云的應(yīng)用與內(nèi)部數(shù)據(jù)源相連,無(wú)論這些數(shù)據(jù)源是駐留在中心數(shù)據(jù)庫(kù)內(nèi)還是分布在遠(yuǎn)程系統(tǒng)和末端傳感器上。在部署生產(chǎn)AI應(yīng)用之前,應(yīng)實(shí)施混合網(wǎng)絡(luò)和數(shù)據(jù)集成策略。開(kāi)發(fā)人員還應(yīng)當(dāng)使用微軟的免費(fèi)服務(wù)層來(lái)進(jìn)一步熟悉AI服務(wù)、API和SDK,從而開(kāi)發(fā)和測(cè)試應(yīng)用程序。
定價(jià)與可用性
微軟公司通常會(huì)根據(jù)每月每個(gè)服務(wù)的API調(diào)用次數(shù)來(lái)為其認(rèn)知服務(wù)定價(jià)。但是,鑒于服務(wù)的多樣性以及企業(yè)用戶的使用方式,其定價(jià)可能會(huì)令人困惑,特別是因?yàn)橛袔追N定價(jià)模式都在并行使用:
- 表情、人臉、語(yǔ)言智能服務(wù)、Bing“語(yǔ)音-文本”和Bing“文本-語(yǔ)音”API 的定價(jià)都是按照每千次生產(chǎn)API事務(wù)調(diào)用來(lái)計(jì)算的,與開(kāi)發(fā)/測(cè)試定價(jià)層不同,有限次的(通常為1千次)API事務(wù)調(diào)用是免費(fèi)使用的。
- Bing Long Form Speech API服務(wù)則是按照語(yǔ)音分析的單位時(shí)間(按分鐘分?jǐn)?來(lái)計(jì)算的。
- 建議和文本分析API是根據(jù)四個(gè)層次設(shè)定API事務(wù)調(diào)用數(shù)量的固定價(jià)格來(lái)收費(fèi),超出配額部分需超額收費(fèi)。
企業(yè)用戶可以通過(guò)免費(fèi)層來(lái)測(cè)俄式這些服務(wù),免費(fèi)層為用戶每月都提供了一定有限數(shù)量的API事務(wù)調(diào)用次數(shù),其中超出限量將限制使用,不收取超額費(fèi)用。使用Azure的在線定價(jià)計(jì)算器可根據(jù)特定應(yīng)用程序需求來(lái)估算費(fèi)用。
目前,微軟認(rèn)知服務(wù)僅在Azur眾多區(qū)域中的一小部分中可用。大部分服務(wù)站美國(guó)西部或者在不依賴數(shù)據(jù)中心的區(qū)域可用。在西中部和東二美國(guó)區(qū)域以及西歐和東南亞,其中部分服務(wù)可用。