混合AI是企業(yè)挖掘數(shù)據(jù)價(jià)值的優(yōu)選方式
譯文說(shuō)到人工智能想必大家都耳熟能詳,其實(shí)它包含了廣泛的知識(shí),分為不同的類(lèi)型,各有優(yōu)劣:
- 混合人工智能(Hybrid AI)能夠克服單一技術(shù)方法的局限性
- 符號(hào)人工智能(Symbolic AI)能夠理解實(shí)際知識(shí),而不僅僅是數(shù)據(jù)
- 混合解決方案打開(kāi)了人工智能的“黑匣子”,幫助人工智能技術(shù)在現(xiàn)實(shí)場(chǎng)景中普遍地應(yīng)用
符號(hào)人工智能和機(jī)器學(xué)習(xí)/深度學(xué)習(xí)都有自己的一套優(yōu)勢(shì),當(dāng)以混合方式一起使用時(shí),將會(huì)是強(qiáng)強(qiáng)聯(lián)合。將為許多關(guān)鍵的企業(yè)應(yīng)用程序的發(fā)展鋪平道路。下來(lái),我們先來(lái)看看它們各自的能力。
符號(hào)人工智能
Symbolic AI 的設(shè)計(jì)初衷是利用實(shí)際知識(shí),更好地理解現(xiàn)實(shí)世界的想法和概念。這類(lèi)似于人類(lèi)使用特定的、面向領(lǐng)域的、符號(hào)/語(yǔ)義的知識(shí)來(lái)解釋我們周?chē)沫h(huán)境。符號(hào)人工智能最重要的貢獻(xiàn)是在自然語(yǔ)言處理(NLP)和自然語(yǔ)言理解(NLU)領(lǐng)域。
機(jī)器學(xué)習(xí)/深度學(xué)習(xí)
機(jī)器學(xué)習(xí)(ML)是目前企業(yè)發(fā)展過(guò)程中采用最多的人工智能形式。由于它能夠自主處理不同的數(shù)據(jù)集,并不斷的迭代和自適應(yīng),因此它本質(zhì)上“學(xué)習(xí)”了環(huán)境的模式并做出相應(yīng)的響應(yīng)。在自動(dòng)化和自主計(jì)算環(huán)境下,它成為了最靈活和有價(jià)值的工具。
深度學(xué)習(xí)(DL)是基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)。相對(duì)而言,DL可以返回更好的結(jié)果,但計(jì)算/能量成本可能比普通的ML技術(shù)高許多數(shù)量級(jí)。
非結(jié)構(gòu)化數(shù)據(jù)挖掘
人工智能有望大幅提高生產(chǎn)率和利潤(rùn)率這兩大企業(yè)目標(biāo)。當(dāng)然,這需要高效地挖掘非結(jié)構(gòu)化數(shù)據(jù)的隱藏價(jià)值,從而實(shí)現(xiàn)更高級(jí)別的自動(dòng)化。不僅要實(shí)現(xiàn)結(jié)構(gòu)化的數(shù)據(jù)驅(qū)動(dòng)工作流——絕大多數(shù)都是機(jī)械的、重復(fù)的功能,還要實(shí)現(xiàn)信息密集型或非結(jié)構(gòu)化數(shù)據(jù)驅(qū)動(dòng)的流程。
與此同時(shí),企業(yè)更傾向以非破壞性和完全透明的方式引入新的技術(shù)方法,因?yàn)檫@樣它所帶來(lái)的任何變化都便于人們理解,所產(chǎn)生的好處是明確和直接的。
純機(jī)器學(xué)習(xí)方法很難滿(mǎn)足所有這些要求。從本質(zhì)上講,他們是一個(gè)“黑盒子”場(chǎng)景——他們的內(nèi)部計(jì)算和決策過(guò)程仍然是隱藏的,不好解釋。例如,當(dāng)ML單獨(dú)用于自然語(yǔ)言處理時(shí),對(duì)輸入數(shù)據(jù)的任何更改都可能導(dǎo)致模型漂移,就不得不重新訓(xùn)練和測(cè)試數(shù)據(jù)。
符號(hào)AI學(xué)習(xí)方法和機(jī)器學(xué)習(xí)方法并不是相互排斥的:通過(guò)有效的融合,可以達(dá)到企業(yè)預(yù)期的最佳效果。這包括對(duì)核心流程和應(yīng)用程序的高效支持,對(duì)給定AI模型的行為的完全透明,以及如果誤差較大時(shí),它又如何及時(shí)地修正。
事實(shí)上,在大多數(shù)企業(yè)中,最大的信息寶庫(kù)是語(yǔ)言形式的非結(jié)構(gòu)化數(shù)據(jù)。從電子郵件到錄音,從法律合同到規(guī)章制度,口頭和書(shū)面文字才是最主要的數(shù)據(jù)源。傳統(tǒng)的計(jì)算平臺(tái)在處理結(jié)構(gòu)化數(shù)據(jù)(如客戶(hù)列表、財(cái)務(wù)記錄和性能指標(biāo))方面表現(xiàn)出色,但直到最近人工智能的發(fā)展和應(yīng)用,才使得以經(jīng)濟(jì)有效的方式處理非結(jié)構(gòu)化內(nèi)容成為可能。
符號(hào)AI
在整個(gè)AI的生態(tài)系統(tǒng)中,符號(hào)推理和語(yǔ)義理解可以產(chǎn)生更精確的結(jié)果,同時(shí)減少了訓(xùn)練新模型的時(shí)間和費(fèi)用。首先是提高輸入數(shù)據(jù)的質(zhì)量,然后簡(jiǎn)化支持這些海量數(shù)據(jù)所需的繁瑣和資源密集型基礎(chǔ)設(shè)施。
從操作上講,混合AI方法可以推動(dòng)人工智能超越機(jī)械式、重復(fù)的簡(jiǎn)單自動(dòng)化任務(wù),從事需要知識(shí)和專(zhuān)業(yè)技能的更高級(jí)別的工作——但仍未達(dá)到需要人工操作的戰(zhàn)略級(jí)別的任務(wù)。
舉一個(gè)最典型的例子標(biāo)注,即對(duì)信息進(jìn)行標(biāo)記以便機(jī)器使用的過(guò)程。這是一項(xiàng)艱巨而乏味的工作,費(fèi)時(shí)又費(fèi)力。但是,通過(guò)在符號(hào)學(xué)習(xí)環(huán)境中利用適當(dāng)?shù)闹R(shí)庫(kù)和圖表,能夠有效的簡(jiǎn)化訓(xùn)練過(guò)程。
可信度
如上所述,當(dāng)前AI部署的另一個(gè)關(guān)鍵問(wèn)題是可信度。ML/DL存在黑盒問(wèn)題,其輸出既不透明也無(wú)法解釋。
這個(gè)問(wèn)題通常表現(xiàn)在人工智能訓(xùn)練模型出現(xiàn)偏差的領(lǐng)域。關(guān)于人工智能產(chǎn)生的種族主義、歧視女性和其他偏見(jiàn)的故事比比皆是,大多是因?yàn)樗妮斎霐?shù)據(jù)向這個(gè)方向傾斜。如果不能直接觀察這些行為,看不到算法對(duì)此做何反應(yīng),整個(gè)系統(tǒng)最終都會(huì)面臨癱瘓,只能重新訓(xùn)練模型再重新投產(chǎn)。可信度問(wèn)題還會(huì)帶來(lái)其他影響,比如錯(cuò)誤地預(yù)測(cè)重點(diǎn)細(xì)分市場(chǎng)的購(gòu)買(mǎi)趨勢(shì),或者大學(xué)招生中未能考慮到的文化因素等。
可解釋的人工智能
通過(guò)引入符號(hào)AI,黑盒被打開(kāi),這樣用戶(hù)就可以理解機(jī)器為什么會(huì)以特定方式行事,如果結(jié)果不理想,還可以做什么進(jìn)行優(yōu)化。此外,這種可見(jiàn)性使操作人員能夠持續(xù)監(jiān)視自己的流程,從而做出適當(dāng)?shù)恼{(diào)整。
人工智能是一個(gè)強(qiáng)大的工具,可以為企業(yè)數(shù)據(jù)運(yùn)營(yíng)帶來(lái)奇跡,但它仍處于起步階段。對(duì)于有遠(yuǎn)見(jiàn)的組織來(lái)說(shuō),標(biāo)準(zhǔn)的、單一模式的人工智能迭代的局限性已經(jīng)越來(lái)越明顯。我們需要的是一種方法,能讓這項(xiàng)技術(shù)更具適應(yīng)性,更能深入挖掘數(shù)據(jù)的潛在價(jià)值,同時(shí)讓人工智能變得更容易使用,成本更低。
混合人工智能——基于理解實(shí)際知識(shí)而不是簡(jiǎn)單學(xué)習(xí)模式的符號(hào)人工智能——是企業(yè)挖掘多年來(lái)收集的所有數(shù)據(jù)價(jià)值的優(yōu)選方式。
譯者介紹
張怡,51CTO社區(qū)編輯,中級(jí)工程師。主要研究人工智能算法實(shí)現(xiàn)以及場(chǎng)景應(yīng)用,對(duì)機(jī)器學(xué)習(xí)算法和自動(dòng)控制算法有所了解和掌握,并將持續(xù)關(guān)注國(guó)內(nèi)外人工智能技術(shù)的發(fā)展動(dòng)態(tài),特別是人工智能技術(shù)在智能網(wǎng)聯(lián)汽車(chē)、智能家居等領(lǐng)域的具體實(shí)現(xiàn)及其應(yīng)用。
原文標(biāo)題:??The Hybrid to Give Your AI the Gift of Knowledge??,作者:Marco Varone