把握數(shù)據(jù),在AI領(lǐng)域取勝的方法
幾年前,Uber的一輛自動駕駛汽車撞死了一名在人行橫道外過馬路的行人。哪里出了問題?當(dāng)技術(shù)人員訓(xùn)練汽車識別行人時,他們大多使用包含人行橫道的圖像,他們無意中教會了AI系統(tǒng),人行橫道是重要的部分。
雖然大多數(shù)將AI應(yīng)用到他們的運營中的公司都不會處理像人命這樣重要的事情,但這里有一個突出的教訓(xùn):向AI系統(tǒng)提供糟糕的數(shù)據(jù),你會得到糟糕的結(jié)果。AI無疑將成為下一個重要的業(yè)務(wù)差異化因素,但只有那些能夠控制數(shù)據(jù)的公司才會如此。
糟糕的數(shù)據(jù),糟糕的AI
負責(zé)任的AI如今是一個如此時髦的詞,因為許多公司都有一個嚴(yán)重的數(shù)據(jù)問題——他們不知道自己擁有什么數(shù)據(jù),這是不安全的。將未知、未管理的數(shù)據(jù)輸入AI系統(tǒng),只會導(dǎo)致數(shù)據(jù)泄露、違反監(jiān)管規(guī)定、錯誤的戰(zhàn)略決策、意外的偏見或聲譽損害。
問題是許多公司手頭都有一堆亂七八糟的數(shù)據(jù),他們要么有一個隨意的戰(zhàn)略,要么根本沒有關(guān)于數(shù)據(jù)治理的戰(zhàn)略,即收集、使用和存儲數(shù)據(jù)的規(guī)則和流程。
企業(yè)不會停下來搞清楚他們的數(shù)據(jù)戰(zhàn)略,一心想要追逐更華麗、更創(chuàng)收的項目。然而,當(dāng)公司想要將這些數(shù)據(jù)放在一起——比如說,應(yīng)用在AI工具中——他們沒有辦法這樣做,因為沒有任何關(guān)于如何處理數(shù)據(jù)的總體規(guī)則,他們留下了一個巨大的爛攤子,需要大量的時間和投資來解決。
換句話說,數(shù)據(jù)治理可能看起來并不令人興奮或華而不實,但它構(gòu)成了任何成功的AI項目的基礎(chǔ)。
修復(fù)數(shù)據(jù)的實用方法
通過數(shù)據(jù)治理,追溯應(yīng)用于企業(yè)中的所有數(shù)據(jù)是一項艱巨的任務(wù)。謝天謝地,沒有必要花那么大的錢來開始你的下一個AI項目。這里有一個務(wù)實、及時的方法來修復(fù)你的數(shù)據(jù),利用AI的力量,并在此過程中逐步創(chuàng)造價值:
選擇一個用例,從為AI挑選一個用例開始,AI可以提供幫助的主要商業(yè)任務(wù)是什么?你知道你在哪里擁有可以為AI挖掘的專有或第三方數(shù)據(jù)?你希望選擇一個既不太大也不太小的用例,最好是內(nèi)部的用例。你的第一個用例還應(yīng)該具有有限的數(shù)據(jù)域要求-換句話說,一個只需要來自一個源的數(shù)據(jù)的用例。
然后,計算出你要處理的數(shù)據(jù)的狀態(tài)。在將數(shù)據(jù)輸入AI系統(tǒng)之前,你需要更正哪些內(nèi)容?
修復(fù)該用例所需的數(shù)據(jù)。一旦你有了可行的用例并評估了前進所需的數(shù)據(jù)狀態(tài),就可以開始清理工作了。你的數(shù)據(jù)不一定要完美才能開始從AI工具中創(chuàng)造價值,但在利用它之前,你確實需要了解它的缺陷。
你將需要為該單個用例部署盡可能多的治理和策略,必要的數(shù)據(jù)治理組件包括:
- 數(shù)據(jù)獲取:你將如何從源系統(tǒng)獲取數(shù)據(jù),并將其存儲在哪里?
- 數(shù)據(jù)質(zhì)量:你的數(shù)據(jù)有多完整和準(zhǔn)確?這些數(shù)據(jù)是否帶有AI偏見的風(fēng)險?在將其輸入AI系統(tǒng)之前,你需要將其清理嗎?
- 數(shù)據(jù)隱私:你的數(shù)據(jù)是否包括私人或受保護的信息,如健康信息。AI系統(tǒng)會以一種會導(dǎo)致隱私問題的方式將數(shù)據(jù)整合在一起嗎?例如,如果AI向通用客戶記錄中添加信息,使個人可以以受保護的方式識別,這稱為編譯分類,需要加以防范。
這些要素共同構(gòu)成了數(shù)據(jù)治理、如何獲取數(shù)據(jù)、如何使用數(shù)據(jù)的計劃,以及防止濫用的適當(dāng)控制和策略。
創(chuàng)建你的總體數(shù)據(jù)戰(zhàn)略。在探索初始用例的同時,開始整合總體數(shù)據(jù)框架和策略,這將告訴你如何在整個企業(yè)中收集、維護和保護數(shù)據(jù)。
一旦你的第一個用例完成,選擇另一個要重點關(guān)注的領(lǐng)域。以第一個用例的成功和教訓(xùn)為基礎(chǔ)。你需要如何調(diào)整你的數(shù)據(jù)策略?不斷重復(fù),在此過程中清理數(shù)據(jù)。
這種方法的口頭禪是,從大處著想,從小處做起。通過在整理企業(yè)數(shù)據(jù)的同時一次處理一個用例,你將通過AI逐步創(chuàng)造價值,同時構(gòu)建堅實的數(shù)據(jù)治理基礎(chǔ),為未來的任何AI計劃提供動力。