七位IT專家暢談:如何啟動和擴(kuò)展成功的AI試點項目
位于美國弗吉尼亞州亞歷山大市的美國專利商標(biāo)局,正在利用人工智能(AI)項目加快專利分類過程,幫助檢測欺詐行為,擴(kuò)大審查員對類似專利的搜索范圍,使他們能夠在相同的時間內(nèi)搜索更多文件,而且他們的每個項目都從試點開始的。美國專利商標(biāo)局首席信息官Jamie Holcombe表示:“概念證明(PoC)是我們用來了解新技術(shù)、測試業(yè)務(wù)價值假設(shè)、降低規(guī)模項目交付風(fēng)險、為全面生產(chǎn)實施決策提供信息的一個關(guān)鍵方法。”他說,一旦試點項目被證明是成功的,那么下一步就是確定是否擴(kuò)大這些試點項目。然后,就是在實際環(huán)境中擴(kuò)展,以及全面投入生產(chǎn)。
印度電子商務(wù)供應(yīng)商Flipkart也在部署一個項目之前遵循了類似的流程,該項目幫助客戶用11種不同語言對數(shù)百萬件商品進(jìn)行文本搜索和視覺搜索?,F(xiàn)在,F(xiàn)lipkart正在測試對話式機(jī)器人,使用深度學(xué)習(xí)來構(gòu)建模型,模型中包含了用戶意圖檢測、語言翻譯、語音到文本和文本到語音的功能。Flipkart和美國專利商標(biāo)局都在快速地把計算機(jī)視覺、自然語言處理、機(jī)器學(xué)習(xí)和其他人工智能技術(shù)擴(kuò)展運用于業(yè)務(wù)的其他方面。
盡管人工智能和機(jī)器學(xué)習(xí)令人興奮,但有很多最初的試點項目和PoC項目未能全面投入生產(chǎn)。那些已經(jīng)取得成功的項目,需要成為戰(zhàn)略計劃的一部分,獲得高管的支持,能夠使用合適的數(shù)據(jù),有所需的團(tuán)隊,有合適的技術(shù)和業(yè)務(wù)指標(biāo),以及項目里程碑,經(jīng)歷多次迭代,快速試錯?!斑@個過程可能需要一兩年的時間才能達(dá)到高質(zhì)量的水平,期間需要你的耐心,”Flipkart公司工程副總裁Ganapathy Krishnan這樣說道。
為成功奠定基礎(chǔ)
企業(yè)正在快速采取行動,開展成功的AI試點項目,投入生產(chǎn)并帶來成果。Forrester人工智能、機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)分析師Rowan Curran表示:“我們已經(jīng)看到AI項目正在步入主流,有57%的企業(yè)正在實施或者正在擴(kuò)展他們的AI項目,有70%到75%的企業(yè)正在從這些項目中看到明顯價值?!贝送猓鶕?jù)安永最近的一項調(diào)查顯示,有53%的CIO和IT領(lǐng)導(dǎo)者稱,AI范疇內(nèi)的數(shù)據(jù)和分析將成為未來兩年的首要投資領(lǐng)域。
但其中很多試點項目在開始之前就注定要失敗,原因有很多,首先就是缺乏自上而下的支持。美國專利商標(biāo)局的Holcombe說:“你需要來自高管的認(rèn)可,還必須有所需的資金?!?/p>
有IT主管認(rèn)為,從組織中層或者自下而上的方式啟動項目會降低項目成功的機(jī)會。最成功的項目,應(yīng)該獲得來自CIO的支持以及高管承諾為項目提供資金,并把AI融合到企業(yè)組織整體數(shù)字化轉(zhuǎn)型的戰(zhàn)略當(dāng)中。
Flipkart公司的Krishnan表示,設(shè)定明確的期望值也很重要。“你不應(yīng)該期望你部署的項目會從根本上改變業(yè)務(wù),這是一個漫長的過程,需要時間?!?/p>
PoC也可以是在企業(yè)內(nèi)部磨煉能力的一種練習(xí),也是這是制造公司禮來(Eli Lilly)采取的一種方法。禮來公司信息和數(shù)字解決方案副總裁、首席信息官Tim Coleman說:“通過PoC,我們試驗并了解了技術(shù)和項目交付的規(guī)模維度?!边@支團(tuán)隊正在將自然語言處理功能應(yīng)用于業(yè)務(wù)領(lǐng)域的自然語言發(fā)現(xiàn)、生成和翻譯,范圍覆蓋很廣,從臨床和科學(xué)內(nèi)容創(chuàng)作到產(chǎn)品開發(fā)、高級搜索和一般管理功能。
但是不要把這種能力建設(shè)練習(xí)與需要產(chǎn)生廣泛轉(zhuǎn)型價值的試點項目混為一談,安永全球人工智能咨詢負(fù)責(zé)人Dan Diasio警告說,“你想培養(yǎng)自己的能力來實現(xiàn)目標(biāo),但是未來當(dāng)你需要與顛覆者展開競爭、對投資者產(chǎn)生有意義的影響力時,你就必須采取自上而下的方法?!?/p>
這就是醫(yī)療企業(yè)Atlantic Health System對待人工智能和機(jī)器學(xué)習(xí)項目的方式。Atlantic Health System已經(jīng)在圖像評估方面成功地進(jìn)行了試點,以協(xié)助放射科醫(yī)師,并在預(yù)授權(quán)自動化方面進(jìn)行了試點,這種自動化技術(shù)可以接收成像訂單并將其通過幾個流程步驟進(jìn)行調(diào)度。該公司高級副總裁、首席信息官Sunil Dadlani說:“人工智能應(yīng)該是數(shù)字化轉(zhuǎn)型的一部分,而不是一項孤立的舉措。我們正式制定了一個關(guān)于人工智能和機(jī)器學(xué)習(xí)的治理結(jié)構(gòu)和投資計劃?!痹诙Y來公司,項目提案在推進(jìn)之前應(yīng)該要通過三個標(biāo)準(zhǔn):在投資回報率方面提供商業(yè)價值,具有可接受的成功率,并且項目結(jié)果必須與業(yè)務(wù)戰(zhàn)略和優(yōu)先事項保持一致,Coleman介紹說。例如,Mosaic PV是禮來公司首批專注于藥物不良反應(yīng)報告的人工智能項目之一,主要驅(qū)動力是“提高生產(chǎn)力并降低處理不良事件的成本,同時保持高標(biāo)準(zhǔn)的質(zhì)量和合規(guī)性”。
問題是什么?
成功的試點應(yīng)該從定義業(yè)務(wù)問題開始?!安灰兂闪送ㄟ^答案去尋找問題,”全球?qū)I(yè)服務(wù)公司Genpact的首席數(shù)字策略師Sanjay Srivastava這樣表示。Genpact主要面向大型企業(yè)提供關(guān)于AI項目的咨詢服務(wù)?!澳切W⒂跇I(yè)務(wù)成功,并且是從問題著手、而不是從答案著手的項目,往往會做得很好?!?/p>
然后要決定AI是否是最佳的答案。Krishnan表示:“這個項目是否適合復(fù)雜到值得使用AI的標(biāo)準(zhǔn)?如果你可以通過簡單的、基于規(guī)則的方法來做到這一點,那就去做吧。但是,如果你有數(shù)十萬甚至數(shù)百萬條規(guī)則的時候,使用基于軟件的方法是不可行的。”
你有恰當(dāng)?shù)闹笜?biāo)和數(shù)據(jù)嗎?
說回到美國專利商標(biāo)局,AI項目需要兩組指標(biāo):如何執(zhí)行模型的技術(shù)指標(biāo),以及如何量化AI項目商業(yè)價值的指標(biāo)。
Atlantic Health System則是通過為一小部分業(yè)務(wù)實施具有明確業(yè)務(wù)KPI的試點項目來確保取得成功。例如,Atlantic Health System的影像評估系統(tǒng)就從在神經(jīng)內(nèi)科進(jìn)行小型試點開始部署,隨后快速擴(kuò)展到心臟病學(xué)和其他領(lǐng)域。這個團(tuán)隊在八周的時間內(nèi)創(chuàng)建了一個成功的神經(jīng)病學(xué)試點,展示了項目成果,獲得了心臟病學(xué)和所有其他服務(wù)線的支持。
Flipkart和美國專利商標(biāo)局一樣,首先把目光集中在技術(shù)模型指標(biāo)上,然后運行A/B測試,看看對業(yè)務(wù)會產(chǎn)生怎樣的影響。目前,該團(tuán)隊正在開發(fā)和測試一個AI輔助的對話式機(jī)器人。他們從“可回答性”這一指標(biāo)開始,也就是機(jī)器人在回答問題方面的能力?,F(xiàn)在他們正在運行A/B測試,確定這是否會對業(yè)務(wù)產(chǎn)生可衡量的影響。
AI項目嚴(yán)重依賴大數(shù)據(jù),你需要所需的速度、數(shù)量和種類,Dadlani說?!叭绻愕臄?shù)據(jù)質(zhì)量不佳,你就不會看到預(yù)期的結(jié)果?!?/p>
Genpact公司的Srivastava對此表示認(rèn)同?!皹?gòu)建AI系統(tǒng)的工作,有90%是圍繞數(shù)據(jù)攝取、協(xié)調(diào)、工程和治理的。如果你專注于10%而放棄這90%,從一開始就失敗了,所以你要構(gòu)建數(shù)據(jù)的基礎(chǔ)?!?/p>
你還要能夠在不同的A/B測試之間提供持續(xù)的反饋——實時獲取數(shù)據(jù),以便調(diào)整模型。但是你所在的企業(yè)組織可能無法自動地快速提供數(shù)據(jù)。例如,如果你正在研究預(yù)測模型,而團(tuán)隊沒有自動獲取有關(guān)客戶購買商品的信息,那么你就無法完成這個循環(huán)。在完全部署后繼續(xù)反饋循環(huán)也很重要,因為客戶的偏好會隨著時間推移而改變。如果你的模型沒有考慮到這一點,你就不會得到你期望的結(jié)果,這種結(jié)果被稱為“模型漂移”。
試點項目要擴(kuò)展嗎?
雖然在你的初步預(yù)期中,試點項目可能是可以全面部署的,但能否擴(kuò)展取決于這些試點項目。那么,你是否擁有適當(dāng)?shù)馁Y源可以把試點項目擴(kuò)展到全面部署。安永的Diasio說:“要進(jìn)行擴(kuò)展,你可能需要簡化代碼、引入新技術(shù)、將人工智能和機(jī)器學(xué)習(xí)推向邊緣,而不是擁有一個數(shù)據(jù)存儲庫、雇用新的團(tuán)隊、建立數(shù)據(jù)標(biāo)簽工廠。你需要的,是一整套工程技能?!?/p>
執(zhí)行試點項目
Flipkart在試點項目中采用了云和MLOps相關(guān)功能?!皬囊婚_始,試點項目就需要大量的工程支持,必須經(jīng)常迭代,快速試錯,而要做到這一點,你就需要大型云服務(wù)提供商提供的MLOps基礎(chǔ)設(shè)施?!彼ㄗh說,試點團(tuán)隊?wèi)?yīng)該定期報告他們距離目標(biāo)達(dá)成還有多遠(yuǎn),并且要確保在試點期間正確設(shè)定預(yù)期值。
他說:“如果你在試點初期設(shè)定了3%,那么你做得很好。”不要期望立即能看到收益。復(fù)雜的試點項目往往很難在三個月內(nèi)看到影響。你要做的,就是部署,找到差距,再次部署,逐步改進(jìn)提升。
試點項目期間出現(xiàn)了失敗,并不一定意味著試點項目的終結(jié)。美國專利商標(biāo)局的增強分類系統(tǒng)最初就失敗了。Holcombe說:“從一開始,我們就遇到了數(shù)據(jù)集管理不當(dāng)?shù)膯栴}?!钡菆F(tuán)隊重新調(diào)整,繼續(xù)進(jìn)行試點,直到系統(tǒng)性能大大優(yōu)于手動過程?!叭绻闶×耍灰艞?,找出失敗的原因?!?/p>
最終評估
以上幾位CIO、IT主管和顧問,會使用各種方法來評估他們的試點項目。在Atlantic Health System,一旦初步試點完成,就到了評估結(jié)果的時候,這決定了是否要延長試點、推進(jìn)生產(chǎn)、還是減少損失。Dadlani說:“試點項目必須提供可感知的成功衡量標(biāo)準(zhǔn),只有當(dāng)我們看到有希望的結(jié)果時,我們才會說,擴(kuò)大規(guī)模需要什么,需要多少時間,實現(xiàn)價值需要多長時間,技術(shù)基礎(chǔ)設(shè)施資源需要哪些投資,以及我們?nèi)绾胃吨T實施?!?/p>
禮來公司的Coleman表示,試點項目失敗的原因有很多:AI技能不足、標(biāo)記數(shù)據(jù)不足、項目愿景或價值主張不明、缺乏敏捷性、缺乏快速試錯的心態(tài)、缺乏來自高管的支持、以及缺乏組織變革管理來推動業(yè)務(wù)采用。
你要向上匯報了對財報至關(guān)重要的指標(biāo)。例如,如果定價算法預(yù)計可以節(jié)省5000萬美元,那么迄今為止已經(jīng)實現(xiàn)的目標(biāo)與預(yù)期的目標(biāo)之間可能存在差距,Diasio:“當(dāng)你談?wù)摯笮秃馁Y項目的時候,試點項目往往缺乏創(chuàng)造如此大價值的可信度,所以要盡可能努力記錄那些已經(jīng)實現(xiàn)的價值。”
這也是重新評估試點是否需要擴(kuò)大規(guī)模的一個機(jī)會。Genpact公司的Srivastava說:“很多PoC在技術(shù)上非常成功,但在擴(kuò)展時并不具有經(jīng)濟(jì)效益,”其他考慮因素還包括擴(kuò)展項目需要多長時間,以及需要哪些資源。
但是,當(dāng)你放眼長遠(yuǎn)時,情況可能會發(fā)生變化。Coleman說:“即使在短期內(nèi)可能無法實現(xiàn)規(guī)?;那闆r下,具有高交付成功概率的較小項目范圍仍可能帶來短期業(yè)務(wù)價值,與此同時,技術(shù)能力和技能也會發(fā)展成熟到可以克服規(guī)?;系K的程度?!?/p>
然后是基礎(chǔ)設(shè)施。你應(yīng)該確保在擴(kuò)展的時候檢查了所有假設(shè)條件,包括配置、網(wǎng)絡(luò)帶寬、存儲和計算。Krishnan表示:“你需要大量的工程支持來擴(kuò)展試點項目,而這時候基于云的MLOps基礎(chǔ)設(shè)施可以提供幫助?!?/p>
最后,你應(yīng)該確??梢园袮I集成到上游和下游工作流程中。例如,如果你沒有把故障預(yù)測整合到上游供應(yīng)鏈系統(tǒng)中,確保你在所需的時間和地點有所需的備件,那么預(yù)測故障功能就無法派上用場。同樣地,這些信息也可以用于下游調(diào)整維護(hù)計劃。
慢慢著手、快速失敗、耐心等待
成功的人工智能/機(jī)器學(xué)習(xí)試點項目,關(guān)鍵在于初始規(guī)劃,你要在繼續(xù)推進(jìn)之前就獲得高管的支持和財務(wù)上的支持。Holcombe說:“你必須要有高管支持,”從一開始就讓所有利益相關(guān)者參與進(jìn)來。
人工智能/機(jī)器學(xué)習(xí)試點項目應(yīng)該作為整體數(shù)字化轉(zhuǎn)型戰(zhàn)略的一部分進(jìn)行,并具有令人信服的業(yè)務(wù)場景,Dadlani說,達(dá)到預(yù)期結(jié)果是需要耐心的。制定技術(shù)和業(yè)務(wù)影響力指標(biāo),并且這些指標(biāo)可以定義成功與否。確保你擁有所需的資源,組建團(tuán)隊并且做好快速試錯的準(zhǔn)備。因此,在團(tuán)隊中擁有具備所需的技能和領(lǐng)域?qū)I(yè)知識組合,是AI試點項目成功的關(guān)鍵。他說:“即使是在試點階段,你也需要一個跨職能的團(tuán)隊。我們要確保每個人都參與到試點項目中,因為這將成為實際工作流程的一部分,他們必須從一開始就參與進(jìn)來?!?/p>
那些不具備所有所需人才的組織,應(yīng)該考慮與外部合作伙伴建立一個混合團(tuán)隊,而中小型公司則可能需要把更多的職責(zé)角色進(jìn)行外包——如果他們能找到合適人才的話。Srivastava說:“如果你沒有合適的人工智能/機(jī)器學(xué)習(xí)工程師和數(shù)據(jù)工程師的話,外包是非常困難的?!备匾氖?,你的團(tuán)隊中既需要有了解機(jī)器學(xué)習(xí)又了解所在行業(yè)(例如制造業(yè))的人員。這不是一個容易找到的技能組合,因此交叉培訓(xùn)是至關(guān)重要的。
最后,你要考慮到一個可以產(chǎn)生實際業(yè)務(wù)成果的目標(biāo)項目,然后擴(kuò)展到業(yè)務(wù)的其他領(lǐng)域,就像Atlantic Health System做的基于機(jī)器學(xué)習(xí)的成像評估系統(tǒng)項目一樣。
一旦試點進(jìn)入全面生產(chǎn)階段,就在你已經(jīng)完成的工作基礎(chǔ)上再接再厲。讓業(yè)務(wù)部門及時了解試點進(jìn)展,展示項目在完全部署后具備哪些功能,并開發(fā)出一個平臺讓其他業(yè)務(wù)部門可在該平臺上使用他們自己的應(yīng)用。Srivastava說:“如今,變化速度是有史以來最慢的,那些想要實現(xiàn)顛覆和發(fā)展的企業(yè),必須改變他們推動價值的方式,如果沒有人工智能,你就無法做到這一點。如果你不投資人工智能的話,你就會顯得束手束腳?!?/p>