感知人工智能操作系統(tǒng)
AI即人工智能的又一波浪潮來了。機(jī)器學(xué)習(xí),深度學(xué)習(xí),神經(jīng)網(wǎng)絡(luò),語音識別,圖像識別...... 常常充斥我們的耳目。不論是AI賦能產(chǎn)業(yè),還是AI改變生活,有的人停留于想象,有的人卻在付諸實踐。
人工智能如何應(yīng)用落地呢?
回憶過往,我們是如何在PC或者智能手機(jī)上開發(fā)應(yīng)用的呢?其中很重要的一點就是我們擁有了計算機(jī)操作系統(tǒng),從DOS到Windows,從各種Unix到各種Linux,從Symbian到安卓以及iOS,是各式的操作系統(tǒng)使我們可以開發(fā)多樣的應(yīng)用。
那么,如果有了人工智能操作系統(tǒng),是否就可以讓我們賦能產(chǎn)業(yè),改變生活了呢?
答案應(yīng)該是肯定的。但是,理解人工智能操作系統(tǒng),可能還要從什么是操作系統(tǒng)開始。
什么是操作系統(tǒng)?
在工科大學(xué)的課程中,即便是非計算機(jī)專業(yè),也會有一門關(guān)于《操作系統(tǒng)》的課。
An operating system (OS) is system software that manages computer hardware and software resources and provides common services for computer programs. ------來自 Wikipedia.org
簡單的說,操作系統(tǒng)(Operating System,簡稱OS)是管理和控制計算機(jī)硬件與軟件資源的計算機(jī)程序,是直接運行在“裸機(jī)”上最基本的系統(tǒng)軟件。操作系統(tǒng)位于底層硬件與用戶之間,是兩者溝通的橋梁。主要功能是資源管理,程序控制和人機(jī)交互等。
操作系統(tǒng)可以從多種維度進(jìn)行分類,例如單任務(wù)/多任務(wù),但用戶/多用戶等等。從設(shè)備復(fù)雜性的維度來看,大體可以分為可分為智能卡操作系統(tǒng)、實時操作系統(tǒng)、傳感器操作系統(tǒng)、嵌入式操作系統(tǒng)、個人微機(jī)操作系統(tǒng)、多處理器操作系統(tǒng)、網(wǎng)絡(luò)操作系統(tǒng)和大型操作系統(tǒng)等等。
以現(xiàn)代標(biāo)準(zhǔn)而言,一個標(biāo)準(zhǔn)PC的操作系統(tǒng)大約具備以下的功能:
- 進(jìn)程管理(Processing management)
- 內(nèi)存管理(Memory management)
- 文件系統(tǒng)(File system)
- 網(wǎng)絡(luò)通信(Networking)
- 安全機(jī)制(Security)
- 用戶界面(User interface)
- 驅(qū)動程序(Device drivers)
什么是人工智能?
人工智能可能是一個聽著簡單,實際又很復(fù)雜的概念,外延比較寬泛,《人工智能簡史》一書可能會給出一些歷史上的脈絡(luò)。
AI,來自于維基百科的解釋是這樣的:
Artificial intelligence is intelligence exhibited by machines, rather than humans or other animals . In computer science, the field of AI research defines itself as the study of "intelligent agents": any device that perceives its environment and takes actions that maximize its chance of success at some goal. Colloquially, the term "artificial intelligence" is applied when a machine mimics "cognitive" functions that humans associate with other human minds, such as "learning" and "problem solving". ---- 來自wikipedia.org
人工智能中的智能如何定義呢?如何解釋智能呢?或許, 用圖靈測試來理解人工智能更加方便。1950年, 阿蘭圖靈提出了圖靈測試:如果一臺機(jī)器能夠與人類展開對話(通過電傳設(shè)備)而不能被辨別出其機(jī)器身份,那么稱這臺機(jī)器具有智能。具體地,指測試者與被測試者(一個人和一臺機(jī)器)隔開的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。進(jìn)行多次測試后,如果有超過30%的測試者不能確定出被測試者是人還是機(jī)器,那么這臺機(jī)器就通過了測試,并被認(rèn)為具有人類智能。
關(guān)于對人工智能的粗淺認(rèn)識,可以參見《老碼農(nóng)眼中的簡明AI》一文。
什么是人工智能操作系統(tǒng)?
回到主題,什么是人工智能操作系統(tǒng)呢?首先,它是一個操作系統(tǒng),應(yīng)該具有操作系統(tǒng)的相關(guān)功能。那人工智能操作系統(tǒng)是具備了人工智能能力還是提供了人工智能能力的操作系統(tǒng)呢?個人覺得,大概是提供并具備人工智能能力的操作系統(tǒng)。
人工智能操作系統(tǒng)應(yīng)具有通用操作系統(tǒng)所具備的功能,并且包括語音識別、機(jī)器視覺、執(zhí)行系統(tǒng)和認(rèn)知行為系統(tǒng)。具體的來說大概包含以下子系統(tǒng):文件系統(tǒng)、進(jìn)程管理、進(jìn)程間通訊、內(nèi)存管理、網(wǎng)絡(luò)通訊、安全機(jī)制、驅(qū)動程序、用戶界面、語音識別子系統(tǒng)、機(jī)器視覺子系統(tǒng)、執(zhí)行子系統(tǒng)、認(rèn)知子系統(tǒng)等等。
不同維度的操作系統(tǒng),如果具備并提供了人工智能的能力,大概都可以被認(rèn)為人工智能操作系統(tǒng),而不僅僅局限在機(jī)器人的領(lǐng)域。
現(xiàn)如今,有沒有人工智能操作系統(tǒng)供我們使用呢? 一般意義上的人工智能操作系統(tǒng)可能還在期待中,但是在垂直領(lǐng)域的人工智能操作系統(tǒng)已經(jīng)開始進(jìn)入我們的生活了,例如DuerOS。
什么是DuerOS?
DuerOS是百度度秘事業(yè)部研發(fā)的對話式人工智能操作系統(tǒng)。作為一款開放式的操作系統(tǒng), DuerOS能夠時時進(jìn)行自動學(xué)習(xí),讓機(jī)器具備人類的語言能力。簡單的說,目前的DuerOS是面向語音交互的AI系統(tǒng)。
DuerOS 的整體架構(gòu)包括三層:中間層為核心層,即對話服務(wù)系統(tǒng);最上層為應(yīng)用層,即智能設(shè)備開放平臺;***層為能力層,即技能開放平臺。
圖片來自百度百科
核心層,包括了從語音識別到語音播報再到屏幕顯示的一個完整交互流程(可以理解為操作系統(tǒng)的輸入/輸出),以及背后支撐交互的自然語言理解、對話狀態(tài)控制、自然語言生成、搜索等等核心技術(shù),這些技術(shù)支撐著上下兩層的實現(xiàn)。
應(yīng)用層,提供了核心接入組件、芯片模組、麥克風(fēng)陣列等的開發(fā)套件,包括工業(yè)設(shè)計、結(jié)構(gòu)設(shè)計、音腔設(shè)計在內(nèi)的參考設(shè)計方案,以及具體的智能硬件,例如小度音箱系列產(chǎn)品。
能力層,是面向開發(fā)者,提供了包括了原生技能和第三方技能在內(nèi)的技能開放平臺,開發(fā)者可以通過技能工具,來創(chuàng)建并發(fā)布基于 DuerOS 的技能。
搭載DuerOS的設(shè)備可讓用戶以自然語言進(jìn)行對話交互,實現(xiàn)影音娛樂、信息查詢、生活服務(wù)、出行路況等多項功能的操作,同時支持第三方開發(fā)者的能力接入。
AI賦能,開發(fā)基于DuerOS的應(yīng)用
作為程序員,開發(fā)基于DuerOS的應(yīng)用和開發(fā)一般的web應(yīng)用是類似的,只是輸入變成了語音,輸出也是語音或者圖像顯示。所謂技能,可以理解成通過http/https實現(xiàn)的業(yè)務(wù)邏輯所形成的服務(wù)。
開發(fā)者一般在技能開放平臺(DBP,DuerOS Bot Platfrom)上完成應(yīng)用的開發(fā),測試和發(fā)布??梢园袲BP看出Android 或iOS,應(yīng)用的發(fā)布與在安卓商店或AppStore上類似。DBP為開發(fā)者提供了一整套技能開發(fā)、測試、部署工具。
圖片來自百度百科
通過DBP 所提供Java/Javascript/PHP/Python/Go的SDK,開發(fā)變得相對簡單。同時,開發(fā)者可以在DBP平臺上,通過可視化界面,簡單且高效地開發(fā)各類個性化技能,為用戶提供個性化的服務(wù)。
有意思的是,DBP(https://dueros.baidu.com/dbp) 通過高度集成的應(yīng)用模版可以提供小技能的服務(wù),無需編程,只需要上傳資源就可以實現(xiàn)小技能即微特性的開發(fā)和部署,非常簡單有趣地在智能音箱上使用。
所有這些,大概就是人工智能操作系統(tǒng)給開發(fā)者帶來的福音吧。
參考資料
[美] 亞伯拉罕·西爾伯沙茨,《操作系統(tǒng)概念精要》,機(jī)械工業(yè)出版社,2018
尼克,《人工智能簡史》,人民郵電出版社,2017
https://dueros.baidu.com
https://dueros.baidu.com/dbp
https://baike.baidu.com/item/DuerOS
【本文來自51CTO專欄作者“老曹”的原創(chuàng)文章,作者微信公眾號:喔家ArchiSelf,id:wrieless-com】