GenAI聚焦數(shù)據(jù)治理和信任
GenAI為企業(yè)如何使用數(shù)據(jù)創(chuàng)造了新機(jī)會,但要建立對AI模型所用數(shù)據(jù)的信任,強(qiáng)有力的數(shù)據(jù)治理是必不可少的。

GenAI的出現(xiàn)標(biāo)志著技術(shù)進(jìn)步的新紀(jì)元,承諾將改變各個行業(yè)及我們消費(fèi)數(shù)據(jù)的方式。數(shù)據(jù)治理在確保為AI系統(tǒng)提供的燃料——數(shù)據(jù)的質(zhì)量和完整性方面起著關(guān)鍵作用。
根據(jù)TechTarget的企業(yè)戰(zhàn)略集團(tuán)在2024年6月進(jìn)行的《AI時代的數(shù)據(jù)治理》研究,70%的企業(yè)表示,他們在AI驅(qū)動的項目中優(yōu)先考慮數(shù)據(jù)的質(zhì)量和完整性,這種高度關(guān)注凸顯了強(qiáng)有力的數(shù)據(jù)治理與AI項目成功之間不可分割的聯(lián)系。
然而,只有46%的企業(yè)對用于決策的數(shù)據(jù)準(zhǔn)確性表現(xiàn)出適度的信心,這一數(shù)據(jù)表明,盡管企業(yè)理解數(shù)據(jù)質(zhì)量的重要性,但在將這種認(rèn)知轉(zhuǎn)化為確保數(shù)據(jù)信任的具體行動方面仍存在困難,這是企業(yè)在構(gòu)建內(nèi)部和面向客戶的GenAI工具時需要克服的障礙,包括數(shù)據(jù)庫、治理工具、機(jī)器學(xué)習(xí)和分析在內(nèi)的GenAI工具和基礎(chǔ)設(shè)施,都可以幫助建立對企業(yè)GenAI使用案例中所用數(shù)據(jù)的更大信任。
為什么在AI時代,數(shù)據(jù)治理的角色變得如此關(guān)鍵?答案在于AI系統(tǒng)的本質(zhì)。構(gòu)建由GenAI驅(qū)動的應(yīng)用程序的企業(yè)應(yīng)從定義用例開始,例如,一個由GenAI驅(qū)動的知識庫,員工和客戶可以快速獲得公司和產(chǎn)品的答案,這一過程始于數(shù)據(jù)基礎(chǔ)——即企業(yè)數(shù)據(jù),如產(chǎn)品目錄、培訓(xùn)文件和支持?jǐn)?shù)據(jù)。這些數(shù)據(jù)經(jīng)過向量化數(shù)據(jù)庫處理,使用檢索增強(qiáng)生成和嵌入等技術(shù),從大型語言模型或基礎(chǔ)模型(如OpenAI的GPT、Google的Gemini或前端聊天機(jī)器人)中提取數(shù)據(jù),使用戶能夠提出問題,并基于特定企業(yè)數(shù)據(jù)基礎(chǔ),以自然語言形式獲得回答。這個例子展示了數(shù)據(jù)質(zhì)量、準(zhǔn)確性、合規(guī)性和對用于GenAI應(yīng)用的企業(yè)數(shù)據(jù)控制的重要性。數(shù)據(jù)的質(zhì)量和代表性直接影響GenAI工具的準(zhǔn)確性、公平性和可靠性。
考慮到偏見或不準(zhǔn)確數(shù)據(jù)的影響:一個基于劣質(zhì)數(shù)據(jù)訓(xùn)練的AI系統(tǒng)可能會延續(xù)現(xiàn)有的偏見,導(dǎo)致歧視性的結(jié)果。例如,使用過時信息的AI算法可能會提供不準(zhǔn)確的定價、功能和特性信息,或者,如果未能從數(shù)據(jù)中清除機(jī)密信息,這些信息可能會被泄露。隨著企業(yè)從多樣化來源收集和處理越來越多的數(shù)據(jù),出現(xiàn)錯誤、不一致和隱私泄露的可能性呈指數(shù)增長。如果沒有強(qiáng)有力的數(shù)據(jù)治理,企業(yè)將面臨重大財務(wù)、聲譽(yù)和法律責(zé)任的風(fēng)險。
為了降低這些風(fēng)險并充分釋放AI的潛力,企業(yè)必須將數(shù)據(jù)治理作為其AI戰(zhàn)略的核心要素進(jìn)行優(yōu)先考慮,它們應(yīng)實施全面的框架,涵蓋數(shù)據(jù)質(zhì)量、安全性、隱私和可訪問性等方面。強(qiáng)有力的數(shù)據(jù)治理計劃的關(guān)鍵組成部分包括:
? 數(shù)據(jù)質(zhì)量管理:通過數(shù)據(jù)清洗、驗證和分析,確保數(shù)據(jù)的準(zhǔn)確性、完整性、一致性和及時性。
? 數(shù)據(jù)安全:保護(hù)敏感數(shù)據(jù)免受未經(jīng)授權(quán)的訪問、使用、泄露、干擾、修改或破壞。
? 數(shù)據(jù)隱私:通過數(shù)據(jù)最小化、匿名化和加密,確保遵守隱私法規(guī)并保護(hù)個人權(quán)利。
? 數(shù)據(jù)可訪問性:在保持適當(dāng)控制以防止濫用的同時,使授權(quán)用戶能夠方便地訪問數(shù)據(jù)。
? 數(shù)據(jù)治理框架:為數(shù)據(jù)管理建立明確的角色、責(zé)任和流程,包括數(shù)據(jù)所有權(quán)、管理和問責(zé)制。
通過投資數(shù)據(jù)治理,企業(yè)可以建立對其GenAI工具的信任,提升決策能力并降低風(fēng)險。GenAI有潛力改變我們獲取信息的方式,但每個企業(yè)都有責(zé)任建立可信的產(chǎn)品,而這一切都始于強(qiáng)有力的數(shù)據(jù)治理。















 
 
 














 
 
 
 