用AI解鎖制造業(yè):企業(yè)如何發(fā)現(xiàn)應用場景和應對挑戰(zhàn)
摘要
當前,各行各業(yè)正在構(gòu)建機器學習能力,以實施或增強其數(shù)字業(yè)務場景。我們認為,現(xiàn)實中企業(yè)所實施的機器學習項目存在較高的失敗率,主要的失敗模式可以歸納為以下十類:設立了錯誤的目標、忽視業(yè)務原則、資金和資源投入不當、急于求成、項目路線圖有較大缺陷、項目缺乏治理、采用了錯誤的技術(shù)平臺和路線、對場景所需的數(shù)據(jù)缺乏了解、數(shù)據(jù)質(zhì)量不高、人才培養(yǎng)計劃與實際的需求偏離。
本文分析了這些失敗因素如何對機器學習項目產(chǎn)生了較大的影響,以及如何通過一套最佳實踐來規(guī)避這些問題。
在本文中,我們以PAM公司為例,采用端到端的方法,從業(yè)務能力矩陣出發(fā),逐步確定業(yè)務、應用、數(shù)據(jù)和技術(shù)解決方案,通過這個例子,我們闡述了如何規(guī)避以上問題的有效方法,以及如何通過架構(gòu)的演進方法來持續(xù)關(guān)注和采用最新的AI技術(shù)。
這個分析過程和解決方案適用于多個行業(yè),尤其是制造業(yè),包括B2C 和 B2B 業(yè)務模式,它涵蓋了基于深度學習、聯(lián)邦學習、大規(guī)模以及相關(guān)的行業(yè)問題。
問題陳述
企業(yè)不斷尋找機器學習相關(guān)的解決方案的目的是來帶來價值,很多是現(xiàn)有ML服務的用例,例如產(chǎn)品推薦、MFA人臉識別和停車服務的車牌識別、使用ChatGPT提供客服等等。
然而,現(xiàn)實當中,企業(yè)往往會步入失敗模式而導致一系列挑戰(zhàn),以下對此做出歸納:
一:設立了錯誤的目標:某些技術(shù)在某些任務中可以替代人類工作,但實際上,由于AI需要大量數(shù)據(jù)進行訓練,需要許多人力進行數(shù)據(jù)收集和預處理,并且一旦有疑問,需要更多的人來調(diào)整和診斷系統(tǒng),因此節(jié)省人力成本的目標難以實現(xiàn)。
二:忽視架構(gòu)原則:加快生產(chǎn),節(jié)約成本,導致質(zhì)量損失或者產(chǎn)生安全隱患,以及對當?shù)丨h(huán)境的破壞;濫用機器學習技術(shù),出現(xiàn)客戶等敏感數(shù)據(jù)外泄;出現(xiàn)違反道德風俗甚至法律問題的行為,例如不當利用隱私數(shù)據(jù)進行欺詐、引起社會偏見或歧視等問題,降低客戶的信任度,降低企業(yè)品牌價值。
三:資金和資源投入不當:投入的資金過少,能力的培養(yǎng)沒有長期的目標,不能滿足開發(fā)和二部署AI平臺和能力建設的需求,導致能力的缺陷,長期不能看到期望的產(chǎn)出。
四:急于求成,缺乏系統(tǒng)性規(guī)劃:企業(yè)將機器學習模型設置為短期投資,過快地追求投資成果,而無法有效地了解和利用機器學習模型潛在的知識和技能,影響投資結(jié)果。
五:錯誤的項目路線圖:企業(yè)在沒有有效地對目標需求進行分析和規(guī)劃的情況下,啟動了一些項目舉措,例如,將時間和資源花費在數(shù)據(jù)收集和框架建立等可能無效的任務上。
六:項目缺乏治理:無法及時發(fā)現(xiàn)原則及合規(guī)性的偏離,沒有用有效的度量手段檢查項目是否能夠?qū)崿F(xiàn)既定的目標和需求,沒有動態(tài)跟蹤最新趨勢并實施相關(guān)的技術(shù)。
七:人才培養(yǎng)計劃與實際的需求偏離:企業(yè)在能力規(guī)劃不明確的情況下盲目開啟人才培養(yǎng)計劃,從而導致培養(yǎng)出的能力結(jié)構(gòu)不能滿足和適應業(yè)務的要求,使項目受到較大的影響。
八:采用了錯誤的技術(shù)平臺和路線。采用的技術(shù)平臺不符合技術(shù)趨勢和發(fā)展情況,沒有根據(jù)自身的需求對機器學習模型有深入的研究和理解,尤其在B2B集成等復雜的情況下,所選技術(shù)不符合整體的IT環(huán)境,從而導致投資效果不佳、甚至項目失敗,或者被迫更改技術(shù)路線,帶來時間和投入的損失、并且付出機會成本。
九:對場景所需的數(shù)據(jù)缺乏了解:缺乏足夠的有價值的數(shù)據(jù),不能支撐人工智能系統(tǒng)運算,從而導致系統(tǒng)不能達到設想的效果。
十:數(shù)據(jù)質(zhì)量不高:企業(yè)缺乏有效的數(shù)據(jù)治理,數(shù)據(jù)的質(zhì)量不高,無法滿足通過機器學習實現(xiàn)業(yè)務場景的需求。
我們認為,采用一套成熟的架構(gòu)方法可以有效地規(guī)避以上問題。
我們從分析企業(yè)的業(yè)務戰(zhàn)略、價值流及架構(gòu)原則出發(fā),著重解決以下問題:要解決的業(yè)務問題是什么?如何創(chuàng)造端到端的價值?業(yè)務和IT能力的差距在哪里?成本和收益是什么?路線圖是什么?什么是正確的技術(shù)解決方案?
解決這些問題涉及企業(yè)架構(gòu)方法和應用技術(shù)能力做出一系列決策。我們想通過一個例子闡述這個過程。
機器學習能力建設示例
這是一個制造業(yè)案例。
場景:棱鏡合金機械(Prism Alloy Machinery – PAM)公司是一家制造合金材料設備的公司??蛻魜碜允澜绺鞯兀渲写蟛糠挚蛻糁苯邮褂肞AM的維修服務。
三年前,PAM公司逐步更新了業(yè)務戰(zhàn)略,其中包括:使用機器學習技術(shù)為客戶帶來更多價值并降低運營成本。
在經(jīng)歷了多次的失敗之后,PAM公司在業(yè)界最佳實踐的啟發(fā)下,采用了以下措施,確保了能力建設沿著正確的方向前進。以下是CIO和企業(yè)架構(gòu)師團隊采取的步驟:
CIO授權(quán)架構(gòu)師團隊啟動該計劃,并且制定一個完備的計劃來轉(zhuǎn)變企業(yè)架構(gòu)。該項目的代號是“Smart Work”。
第一、回顧和更新架構(gòu)原則
這些原則涉及了業(yè)務及IT層面,其中包括:遵守法規(guī)及道德風俗;嚴格保護隱私數(shù)據(jù);質(zhì)量第一;安全生產(chǎn);保護企業(yè)商譽。隨后的價值流分析、需求分析、架構(gòu)設計等工作都必須遵守這些原則。
其中一個原則要求技術(shù)解決方案必須確保可靠和高效的生產(chǎn)。根據(jù)這項原則,架構(gòu)師團隊把 MLOps 列為首選的技術(shù)架構(gòu)。
此外,該原則還包括以下內(nèi)容:追蹤技術(shù)趨勢,在不違背目標的前提下采用合適的技術(shù)路線。為了保護客戶數(shù)據(jù),PAM公司采用了聯(lián)邦學習平臺來支撐其設備維修場景就是運用架構(gòu)原則來設計技術(shù)方案的一個具體的實例。
第二、進行價值流分析,確保資金和資源的投入能夠帶來最大的收益
通過檢查價值流,他們發(fā)現(xiàn),設備維護服務貢獻了 30% 的營收,其次是備件銷售,貢獻了16%的營收,兩者相加達到了46%的收入,超過了設備銷售。
架構(gòu)師團隊和運營團隊展開了一系列的研討后,逐步確定了一個需求目錄,他們把這一類服務歸類為“智能維護服務”,核心需求包括:使用人工智能技術(shù)和物聯(lián)網(wǎng)數(shù)據(jù)來降低維護成本和生產(chǎn)中斷。這種分析能夠有效規(guī)避資金和資源投入不當?shù)膯栴},并且有助于制定出相對準確的預算。同時,也對人員和平臺的能力設定了具體的需求。
以下是架構(gòu)師團隊倡議的需求目錄的一部分:
第三,運用從業(yè)務需求到數(shù)據(jù)架構(gòu)、應用架構(gòu)、技術(shù)架構(gòu)的架構(gòu)分析方法
接下來,通過差距分析,架構(gòu)師團隊更新了應用、數(shù)據(jù)架構(gòu),這時便得出了具體的技術(shù)要求:通過更準確的零件故障預測、更短的離線檢查時間、減少零件更換頻率、快速響應事件等優(yōu)化服務計劃。同時,要求在大規(guī)模和連續(xù)生產(chǎn)中確保零件壽命,以確保運營的經(jīng)濟性、并且具有較低風險。
緊接著,架構(gòu)師團隊提出了一個可行的技術(shù)架構(gòu)(參見圖1)。
圖 1 機器學習訓練架構(gòu)
圖中,IoT 數(shù)據(jù)來自傳感器。在算法應用層面的要求包括:故障模式是什么?磨損、壓力、振動、負載、頻率、電壓、溫度等如何導致故障?
它需要兩個關(guān)鍵能力:數(shù)據(jù)科學和持續(xù)優(yōu)化模型、算法和應用程序的機制。
這些問題是典型的IFD(Intelligent Fault Diagnosis)問題,數(shù)據(jù)科學家團隊選擇了基于深度學習模型,主要考慮的因素包括:運行的設備及IoT數(shù)據(jù)的規(guī)模;數(shù)據(jù)集的稀疏度;數(shù)據(jù)源的分布等等。
作為增強功能,數(shù)據(jù)科學家還嘗試建立了無監(jiān)督學習機制,以找出功能與故障模式之間的未知關(guān)聯(lián)。
在數(shù)據(jù)方面,架構(gòu)師團隊也規(guī)劃了數(shù)據(jù)治理的舉措,提高相關(guān)數(shù)據(jù)的質(zhì)量。
第四,運用確立的架構(gòu),建立實施路線圖
在這個步驟當中,最核心的當屬確立速贏場景的相關(guān)項目。
為了避免急于求成,PAM公司采用了企業(yè)架構(gòu)的規(guī)劃方法,但這并不代表對時間目標的忽視。通過規(guī)劃速贏場景,可以以最小的代價、以最快的時間對架構(gòu)的設計進行驗證,給用戶以及企業(yè)的決策者以信心、確保后續(xù)資源的投入,避免短期投資的誤區(qū)。
在實施工程化平臺之前,項目以MVP的形式交付階段性成果。
第五,實施包括工程化平臺、技術(shù)團隊建設等舉措
工程化的目標是利用一個成熟的AI平臺,建立數(shù)據(jù)標記(各種故障或風險情況)和模型訓練的機制,以及應用解決方案:服務規(guī)劃、報告和錯誤趨勢分析。
基于云的平臺是不錯的選擇,其中許多平臺為特定行業(yè)應用提供了現(xiàn)成的解決方案,例如百度的行業(yè)應用解決方案。但這些產(chǎn)品不符合 PAM的解決方案。 AI團隊需要一個具備物聯(lián)網(wǎng)、大數(shù)據(jù)計算、數(shù)據(jù)挖掘、AI模型開發(fā)、部署和維護等PaaS能力的平臺(見圖2:工程化機器學習平臺)。
圖2 工程化機器學習平臺
可選的有ai.baidu.com、Azure AI Platform、ai.tencent.com、華為HiAI等。
此外,還要根據(jù)EA方法論建立迭代的需求管理、解決方案、項目計劃、變更和執(zhí)行框架。
以上,從業(yè)務、應用、數(shù)據(jù)、技術(shù)及團隊等諸多方面,對機器學習的能力進行了規(guī)劃。這些規(guī)劃可以確保時間和資源花費在有效的任務活動中。
第六:運用架構(gòu)治理方法對項目進行監(jiān)控和治理
確立度量手段,定期檢查項目是否能夠?qū)崿F(xiàn)既定的目標和需求,有沒有動態(tài)跟蹤最新趨勢并實施相關(guān)的技術(shù),有沒有違背架構(gòu)原則、以及違背數(shù)據(jù)保護、遵守法律及道德規(guī)范等業(yè)務原則。
Smart Work項目關(guān)鍵技術(shù)選項的確立過程
在與關(guān)鍵利益相關(guān)者審查這些解決方案時,服務總監(jiān)提出了一個關(guān)鍵問題:解決方案的許多機制都要求客戶共享他們的數(shù)據(jù),因為涉及關(guān)鍵業(yè)務信息,這是不可能的。這是任何資本貨物商業(yè)模式的普遍問題,特別地,這也關(guān)系到可能違反數(shù)據(jù)隱私相關(guān)的架構(gòu)原則。
這個問題可以通過項目變更來解決,這個過程仍然可以通過架構(gòu)治理的方法來完成。架構(gòu)師團隊把最初的解決方案被歸類為“內(nèi)部解決方案”,并通過變更增加了新的解決方案,即,利用聯(lián)邦學習解決B2B業(yè)務場景下用戶數(shù)據(jù)保護方面的問題。
具體地,聯(lián)邦學習是一種沒有集中訓練數(shù)據(jù)的協(xié)作機器學習。它在保存本地數(shù)據(jù)樣本的服務器的多個分散邊緣設備上訓練算法,而不交換它們。它允許多個參與者在不共享數(shù)據(jù)的情況下構(gòu)建一個通用的、強大的機器學習模型。
圖 3 基于聯(lián)邦學習的解決方案
從行業(yè)的角度來看,該技術(shù)特別適用于機器學習依賴于難以提取的數(shù)據(jù)的情況,以及由于數(shù)據(jù)隱私、數(shù)據(jù)安全、數(shù)據(jù)訪問權(quán)限等關(guān)鍵問題以及數(shù)據(jù)傳輸帶寬等技術(shù)難題。此類情況包括:
- 醫(yī)療機構(gòu)需要從其他機構(gòu)拉取數(shù)據(jù)以收集他們需要的所有信息。
- 電梯制造商需要在不從客戶那里獲取數(shù)據(jù)的情況下,從電梯中找出各種子系統(tǒng)或組件的故障模式。
- 市政部門需要訓練模型來調(diào)整交通燈控制系統(tǒng)以實現(xiàn)更高的交通吞吐量,但傳輸汽車和乘客的視頻流消耗的帶寬超出了該部門的承受能力.
此外,企業(yè)可能會碰到一些除數(shù)據(jù)隱私之外的其他問題,這些都適合采用基于聯(lián)邦學習的解決方案:
- IT 方面的限制:需要昂貴的基礎(chǔ)設施改造費用,例如計算能力、大型數(shù)據(jù)集傳輸成本等。
- 技術(shù)債務:在傳送物聯(lián)網(wǎng)數(shù)據(jù)時,發(fā)現(xiàn)在現(xiàn)有物聯(lián)網(wǎng)環(huán)境中發(fā)送和接收大量訓練數(shù)據(jù)是一個巨大的挑戰(zhàn)。
聯(lián)邦學習的其他應用方向包括:
電梯維護服務:發(fā)掘服務管理中的風險模式;發(fā)掘故障與參數(shù)之間的關(guān)聯(lián)關(guān)系,例如:振動、負載、頻率、電壓、溫度等。
汽車導航服務:如何使軟件智能化,具有不同季節(jié)、節(jié)假日、星期幾、一個月中的哪一天、一天中的時間段規(guī)劃路線的能力,等等。在這種情況下,數(shù)據(jù)隱私問題也是一個主要關(guān)注點。
Smart Work項目其他技術(shù)選項的探索
為了追蹤最新的技術(shù)方向,PAM公司的架構(gòu)師團隊考察了包括ChatGPT在內(nèi)的大模型AI在制造業(yè)中的使用,他們認為大模型AI技術(shù)可能在以下的業(yè)務中得到運用。以下可能會引起架構(gòu)的變更:
1.故障診斷: 使用基于大語言模型的賦能系統(tǒng)可以幫助對復雜制造系統(tǒng)的故障進行診斷并擴展相關(guān)的知識。
2. 產(chǎn)品質(zhì)量問題診斷: 使用基于大語言模型的知識庫可以診斷出可能出現(xiàn)質(zhì)量問題的起因,并根據(jù)質(zhì)量問題提供建議和思考,從而有效地解決質(zhì)量問題。
3. 優(yōu)化制造過程: 使用大模型可以幫助在原有制造流程基礎(chǔ)上,改進和優(yōu)化每一步工作流程,有助于提升生產(chǎn)設備的運行效率和質(zhì)量。
4. 設備自動化: 使用大模型參數(shù)分析可以幫助快速識別設備的運行狀況,檢測出設備發(fā)出過的警告,便于有效地進行設備的自動化管理和控制。
此外,雖然ChatGPT技術(shù)剛剛得到了業(yè)界的認識,私有化部署大模型AI也可能是一個不可忽視的技術(shù)路線:通過改進深度學習模型,私有化預訓練大模型是一個可行的選項,用來處理特定業(yè)務需求,即,使用利用企業(yè)私有預料訓練、或者提示行業(yè)通用的大語言模型來對工程師進行技能培訓等等。
總結(jié)
對于各行各業(yè),機器學習形成了重要的數(shù)字化轉(zhuǎn)型能力。在許多情況下,企業(yè)會誤入一些失敗的模式當中。
本文結(jié)合印孚瑟斯的實際案例,介紹了采用企業(yè)架構(gòu)方法來規(guī)避常見失敗模式的一系列步驟:根據(jù)業(yè)務原則確立架構(gòu)原則;進行價值流分析,確保資金和資源的投入能夠帶來最大的收益;運用從業(yè)務需求到數(shù)據(jù)架構(gòu)、應用架構(gòu)、技術(shù)架構(gòu)的架構(gòu)分析方法;運用確立的架構(gòu),建立實施路線圖;實施包括工程化平臺、技術(shù)團隊建設等舉措;運用架構(gòu)治理方法對項目進行監(jiān)控和治理。
這個過程包括分析業(yè)務能力矩陣、創(chuàng)建需求和其他業(yè)務文檔、識別差距、設計數(shù)據(jù)、應用程序和技術(shù)架構(gòu)、選擇技術(shù)方案等等。通過這個過程,架構(gòu)師團隊將相關(guān)的價值流分解到流程、角色、需求、應用、數(shù)據(jù)及技術(shù)能力和方案級別。
隨著架構(gòu)設計的迭代,更多的業(yè)務或 IT 問題被識別出來,從而產(chǎn)生了一組最能解決問題的技術(shù)方案。其中,一個備選的技術(shù)路線是采用利用企業(yè)和行業(yè)預料訓練和提示的大模型AI技術(shù)。
作者介紹:
沙睿杰 (Rajnish Sharma)
印孚瑟斯(Infosys)全球副總裁兼中國區(qū)銷售與交付及運營負責人
沙睿杰負責Infosys在華整體業(yè)務運營,領(lǐng)導全球和本地客戶服務交付,提升客戶滿意度。此外,他還負責Infosys大中華區(qū)團隊的人才管理和能力建設。憑借對云、人工智能和自動化主導的數(shù)字服務的熱情,他領(lǐng)導的團隊致力于提供以數(shù)字化敏捷和自動化為主導的服務,幫助客戶完成轉(zhuǎn)型之旅。
王宣
印孚瑟斯(Infosys)首席技術(shù)架構(gòu)師, Infosys中國區(qū)戰(zhàn)略技術(shù)組負責人
王宣負責Infosys在中國的架構(gòu)師團隊。這個團隊的目標是在企業(yè)、解決方案和技術(shù)層面發(fā)展和優(yōu)化架構(gòu)能力。該團隊在不同階段支持我們的服務交付業(yè)務——包括IT規(guī)劃、應用程序、數(shù)據(jù)和技術(shù)解決方案、架構(gòu)治理等。該團隊專注于數(shù)字化轉(zhuǎn)型和企業(yè)現(xiàn)代化旅程、云遷移、數(shù)據(jù)分析、大規(guī)模、機器學習、Web3 和區(qū)塊鏈等尖端技術(shù)的應用。