深度剖析Amazon AI技術(shù)應(yīng)用和戰(zhàn)略布局: Alexa篇
Amazon超過微軟成為全球市值最高的公司,市值7900萬美元。Jeff Bezos一直有個非常著名的“Day 1”哲學,就是讓公司永遠保持在一個"Day 1"的狀態(tài),他認為一旦到了“Day 2”,就意味著進入停滯期。那如何保持“Day 1”?Jeff在2017年給股東的公開信中提到了4個策略:用戶至上(Amazon內(nèi)部神一般的教條),抵制形式主義,關(guān)注外部趨勢和快速決策。
Jeff早在1997年Amazon還剛起步的時候提到”Day1”,當時的vision:But this is Day 1 for the Internet and,if we execute well for Amazon.com. Today, online commerce saves customers moneyand precious time. Tomorrow,through personalization online commerce well accelerate the very process ofdiscovery。從網(wǎng)上書店起步的Amazon,Jeff已經(jīng)很早預(yù)測到技術(shù)對驅(qū)動業(yè)務(wù)發(fā)展的重要性——1998年推出的協(xié)同過濾推薦引擎充分體驗了這一點。
這就是Amazon為什么在“Day1”就對機器學習和人工智能非常的重視,從面向消費者的語音助手Alexa,showcase的無人商店Amazon Go,到藏在電商王國背后的AI技術(shù),從inside到outside,從topdown到bottomup,AI滲透進Amazon內(nèi)部每一個細胞。
相對其他巨頭,Amazon在AI領(lǐng)域的收購稍顯保守,但Amazon Alexa基金就非常aggressive,后面會作介紹。2013年,收購英國公司Evi Technology,該公司當時開發(fā)了一款跟Siri類似的語音助手Evi。據(jù)了解,Amazon Echo的語音技術(shù)來自于Evi。2016年,收購做圖像識別的華人初創(chuàng)公司Orbeus,這是目前AWS上提供計算視覺服務(wù)Rekognition的前身。同年9月,收購聊天機器人平臺Angel.ai,顯然是為Alexa布局。2017年,收購AI云服務(wù)安全公司Harvest.ai,就是目前AWS推出的支持ML技術(shù)的安全服務(wù)Macie。
Amazon的AI應(yīng)用可分為三大類,一類是能“看得見、摸得著”的前沿技術(shù)moonshot產(chǎn)品,像Alexa, Amazon Go和無人機Prime Air;一類是“不可見、藏在后臺”的AI技術(shù),如推薦引擎、倉庫機器人和fulfillment中心的“最后一公里”;另外就是企業(yè)級應(yīng)用AWS云平臺,提供AI工具和服務(wù),讓企業(yè)構(gòu)建自己的AI應(yīng)用。
下面會分為3篇文章,全面、深入地剖析Amazon的AI技術(shù)應(yīng)用和戰(zhàn)略布局。
Amazon在2004年成立Lab126, 專注于硬件產(chǎn)品的研發(fā)。實驗室曾有4個神秘的項目,代號為”ABCD”。擁有3000多名研發(fā)人員的Lab126以2007年發(fā)布的Kindle一戰(zhàn)成名。但后來卻因重壓賭注的智能手機Fire Phone的失敗而大規(guī)模重組,項目C(據(jù)說是AR產(chǎn)品)也隨之流產(chǎn)。但萬萬想不到,一直不受重視的項目D,竟然打了一場漂亮的翻身仗,成為Amazon歷史上第二個成功的硬件產(chǎn)品。
2014年Echo從Lab126孵化出來,先定位Prime會員做市場試水,直到2015年在美國地區(qū)開放給全部用戶,接著就一發(fā)不可收拾,高歌猛進。憑著快速的語音響應(yīng),多場景的語音交互能力,親民的價格,瞬間秒殺市場上的音箱產(chǎn)品。Echo從“點”到“面”的鋪開戰(zhàn)略,從音箱到家電,從家庭到汽車,全面占據(jù)消費者的生活場景。Amazon最新對外公布,Alexa的設(shè)備超過1億。雖然一直處于虧損狀態(tài),但這并不阻擋“Alexa Everywhere”的戰(zhàn)略??坑布⒉皇茿mazon的目的,布局才是大棋。這跟當年AWS“低價切進,閃電式占領(lǐng)市場”的策略如出一轍。AWS開始target中小型企業(yè),財務(wù)上一直虧損,但市場滲透極深,等競爭對手開始醒覺的時候,已被AWS拋離到很遠。另外,Alexa最殺手的大招是開放,允許第三方的技能集成,吸引了大量的開發(fā)者進入生態(tài)。2018年,Alexa技能個數(shù)已超7萬。
這是一個典型的Alexa驅(qū)動開燈的場景。當用戶發(fā)起語音指令,傳給云端的Alexa解析和處理。Alexa如果發(fā)現(xiàn)使用的不是它內(nèi)帶技能,就會去調(diào)用外部第三方開發(fā)者的技能,最后發(fā)出“開燈”的指令。
Alexa主要通過2個核心服務(wù)連接開發(fā)者和消費者構(gòu)建生態(tài): AVS (Alexa Voice Service) 和 ASK (Alexa Skill Kit)。AVS讓設(shè)備廠商把Alexa的“智能大腦”內(nèi)嵌進自己開發(fā)的設(shè)備里,讓Alexa“無處不在”。而ASK提供工具和接口給第三方開發(fā)者添加定制化的Alexa技能,讓Alexa“無所不能”。另外,Amazon近期還推出連接工具箱 ACK (Alexa Connect Kit) ,允許設(shè)備制造商不聯(lián)網(wǎng)、不走云端、不需開發(fā)技能,通過本地連接就可實現(xiàn)設(shè)備“智能化”。很明顯,Amazon這些布局極具前瞻性,不但籠絡(luò)了消費者和開發(fā)者,還降低技術(shù)門檻讓傳統(tǒng)的硬件制造商進入生態(tài)。它的最終目標是讓Alexa無處不在,無所不能,統(tǒng)治從家居家電,消費級可穿戴設(shè)備到汽車的一切平臺。
我們從技術(shù)層面drill down,對Alexa的處理流程進行拆解。AVS主要負責兩個轉(zhuǎn)化:語音轉(zhuǎn)文字(Speech-to-Text)和文字轉(zhuǎn)語音(Text-to-Speech)。這兩個轉(zhuǎn)化的背后是由兩個深度學習引擎所支撐:Amazon Lex和Amazon Polly。
1. Amazon Lex:語音轉(zhuǎn)文字服務(wù),包含自動語音識別ASR和自然語言理解NLU的功能,可以獨立于Alexa使用,是Amazon AWS對外提供的chatbot服務(wù)
2. Amazon Polly:文字轉(zhuǎn)語音服務(wù),利用的是語音合成技術(shù)(speech synthesis)
首先,AVS解析用戶發(fā)起的語音請求,識別技能的名稱,轉(zhuǎn)成結(jié)構(gòu)化的信息。如果技能已經(jīng)部署在AWS,ASK就直接運行AWS Lambda服務(wù)。AWS Lambda是云計算Serverless的計算架構(gòu),函數(shù)即服務(wù)(Function-as-a-Service, FaaS)。簡單的來說,就是開發(fā)人員直接編寫運行在云端上的函數(shù),后面AWS章節(jié)會詳細描述。如果技能不在AWS,ASK就通過REST API調(diào)用外部服務(wù)。返回的結(jié)果通過AVS轉(zhuǎn)成語音信息傳給Echo,或者圖像形式發(fā)送到手機App。
Alexa的成功主要在產(chǎn)品、市場先機和開放策略。先從Echo單點爆發(fā),迅速占領(lǐng)市場,形成第一道“護城河”。然后,利用開放的策略,吸引更多的開發(fā)者研發(fā)第三方的Alexa設(shè)備,滿足消費者各種場景需求,用戶體驗不斷提升,然后帶來更多的流量,吸引更多的開發(fā)者進入,打造一個自給自足的生態(tài)循環(huán),形成第二道“護城河”。另外,生態(tài)的增長,持續(xù)產(chǎn)生大量有價值的用戶偏好數(shù)據(jù),數(shù)據(jù)的反哺幫助ML算法優(yōu)化,分析更加精確,個性化程度更高,客戶的體驗更好,形成第三道“護城河”。從用戶流量,到開發(fā)生態(tài),到數(shù)據(jù)反哺,持續(xù)優(yōu)化模型,層層遞進,形成一個讓競爭對手難以復制的巨大壁壘,最終壟斷市場。
Amazon在2015年成立1億美元的Alexa Fund,2017年再加注1億美元,target全球更多地區(qū)(美國、加拿大、澳新、印度等)?;鹉康闹饕菄@Alexa打造智能助手的生態(tài),讓Alexa植入到更多的外部第三方產(chǎn)品,開發(fā)更多技能,引入先進的語音交互,NLP等AI技術(shù)。基金除了關(guān)注ToC應(yīng)用,還會進入ToB領(lǐng)域,這跟逐漸從消費級轉(zhuǎn)型到企業(yè)級的微軟Cortana正面交鋒。
除了基金,Alexa跟知名加速器Techstars合作,孵化以語音技術(shù)驅(qū)動的創(chuàng)業(yè)公司。據(jù)了解,Amazon與Techstars向每家加速器創(chuàng)業(yè)公司投資12萬美元,換取6%的普通股。另外,基金還與大學,如卡內(nèi)基梅隆CMU,Johns Hopkins,南加州大學,以及加拿大的Waterloo等,合作創(chuàng)辦fellowship項目,爭取從更早期階段孵化語音AI技術(shù)。
基金的portfolio有3家來自加拿大,7家來自歐洲,1家來自以色列和1家來自印度,其他均是美國地區(qū)。領(lǐng)域覆蓋了智能家居,汽車出行、教育、醫(yī)療護理、企業(yè)應(yīng)用等領(lǐng)域。很明顯,智能家居仍然是Alexa的重心,從智能冰箱貼,寵物喂食器到安防攝像頭,共投了14家。其中智能門鎖Garageio,智能門鈴Ring,安全路由器Luma,智能灑水系統(tǒng)Rachio均被收購。兒童教育也是Alexa的關(guān)注領(lǐng)域,結(jié)合語音技術(shù)和IoT,賦能兒童STEM教育。核心技術(shù)和平臺方面,KiTT.ai 專注語音喚醒和自然語音交互技術(shù),尤其定制化的熱詞檢測和支持多回合、多平臺的語音會話技術(shù),2017年被百度收購。DefinedCrowd針對的是語音識別,NLP和計算視覺方面的數(shù)據(jù)打標簽和訓練服務(wù)。還有明星公司Ctrl-Labs,同時獲得GV,Matrix Partners,Peter Thiel的Founders Fund等知名風投的投資,結(jié)合計算神經(jīng)科學,機器學習,生物物理,人機交互等技術(shù),打造新一代的“腦機接口”。另外,Alexa也進入ToB領(lǐng)域,包括銷售場景的Tact.ai、零售場景的Blutag、餐飲場景的SeverRooms。
80到90年代,微軟的Windows一直穩(wěn)坐PC操作系統(tǒng)的王者地位。從2000年開始,移動互聯(lián)網(wǎng)開始崛起。2007年是一個關(guān)鍵里程碑,Google推出免費操作系統(tǒng)Android和Apple發(fā)布iPhone,標志著正式進入移動互聯(lián)網(wǎng)時代。雖然兩家走的路線不一樣,一個開放操作系統(tǒng)以應(yīng)用生態(tài)為主,一個封閉走中高端路線,提供極致的用戶體驗,但并不阻擋iOS和Android的發(fā)展勢頭,完全占據(jù)了用戶手機使用的半壁江山。2015年,Echo橫空出世,以極快地進入智能家居市場,從點到面地爆發(fā)。通過精準的產(chǎn)品定位,
閃電式的市場策略,開放的生態(tài),以及投資布局,建立極高的競爭壁壘。得用戶者得天下,Amazon目標只有一個,就是打造下一代基于語音交互的操作系統(tǒng)。
根據(jù)“The Alchemy of Growth”理論(中文: 增長的煉金術(shù)),企業(yè)有三個層次的增長。第一個層次是Operator,維持當前業(yè)務(wù)的核心競爭力。第二個層次是Business Builder,開拓新的業(yè)務(wù)增長模式和解決方案,擴展核心競爭力。第三層次是最高級別Visionary,也是離公司的comfort zone最遠的區(qū)域,創(chuàng)造獨有的解決方案,開拓全新市場,實現(xiàn)業(yè)務(wù)爆炸性的增長。我們可以看出,Echo一系列智能產(chǎn)品利用語音技術(shù),讓Amazon從電商業(yè)務(wù)拓展到智能家居,實現(xiàn)了新的業(yè)務(wù)模式,進入到Horizon II。盈利不是首要目標,速度才是關(guān)鍵。這讓我想到了“The Lean Startup”里面的原則: learning and iterating as quickly as you can to build a viable business。而Alexa最大的潛力在于開放API給第三方的開發(fā)者,打造生態(tài)系統(tǒng),讓Alexa的設(shè)備達到1億多臺,一年之內(nèi)翻了5倍,把Amazon帶進了Horizon III,實現(xiàn)transformative的增長。是否能實現(xiàn)Amazon最終的目標?我們拭目以待。