如何構(gòu)建AI原生應(yīng)用?從大模型到知識(shí)中臺(tái),從數(shù)據(jù)到規(guī)則邏輯。AI原生=模型原生+知識(shí)原生+價(jià)值原生
大家好,我是人月聊IT。今天繼續(xù)聊AI和大模型方面的話題。即什么是AI原生,如何構(gòu)建一個(gè)真正意義上的AI原生系統(tǒng)?
對(duì)于這個(gè)問題,我們先看下AI大模型自己給出的答案。
即AI原生是指從設(shè)計(jì)之初就將AI能力作為核心架構(gòu)和功能基礎(chǔ)來構(gòu)建的系統(tǒng)或應(yīng)用,而不是在傳統(tǒng)系統(tǒng)上后期添加AI功能。
一個(gè)個(gè)真正的AI原生系統(tǒng)通常具備以下特點(diǎn):
1. 架構(gòu)層面
- AI優(yōu)先設(shè)計(jì):架構(gòu)圍繞AI模型的訓(xùn)練、推理和持續(xù)學(xué)習(xí)來設(shè)計(jì)
- 數(shù)據(jù)驅(qū)動(dòng)核心:數(shù)據(jù)流和AI模型是系統(tǒng)的中樞,而非輔助組件
- 動(dòng)態(tài)適應(yīng)性:系統(tǒng)能夠根據(jù)AI模型的輸出自動(dòng)調(diào)整行為和決策
2. 功能層面
- 智能是主要價(jià)值:核心功能依賴AI實(shí)現(xiàn),去掉AI后價(jià)值大幅降低
- 持續(xù)學(xué)習(xí)能力:系統(tǒng)能夠從用戶交互和新數(shù)據(jù)中不斷學(xué)習(xí)優(yōu)化
- 個(gè)性化體驗(yàn):基于AI為每個(gè)用戶提供定制化的服務(wù)
3. 用戶體驗(yàn)層面
- 自然交互:支持對(duì)話式、語音、視覺等AI驅(qū)動(dòng)的交互方式
- 預(yù)測性服務(wù):主動(dòng)預(yù)測用戶需求而非被動(dòng)響應(yīng)
- 智能自動(dòng)化:自動(dòng)完成復(fù)雜任務(wù),減少人工干預(yù)
我們可以將類似ChatGPT,Claude,GitHub Copilot,Midjourney理解為AI原生應(yīng)用。但是對(duì)于傳統(tǒng)IT系統(tǒng)增加了AI知識(shí)庫,AI智能報(bào)表,AI智能排產(chǎn)或圖像識(shí)別等,只能叫AI賦能或AI集成,而非AI原生。
圖片
所以從上面的AI自己的回答也可以看到基本把AI原生的關(guān)鍵點(diǎn)都講到了。AI原生必須是土生土長的,系統(tǒng)一開始構(gòu)建就原生在系統(tǒng)里面的能力,而不是已有系統(tǒng)后簡單嫁接或集成AI大模型能力。那些把傳統(tǒng)IT系統(tǒng)改造集成AI大模型能力后叫AI原生是相當(dāng)錯(cuò)誤的說法。
AI原生-大模型原生+知識(shí)原生+價(jià)值原生
一個(gè)系統(tǒng)能夠稱之為叫AI原生系統(tǒng)呢?這里面核心的一個(gè)關(guān)鍵就是整個(gè)系統(tǒng)核心的能力是架構(gòu)在底層的AI大模型和底層的知識(shí)層上面的。你如果滿足這么一個(gè)條件,那你們做一個(gè)系統(tǒng)就可以叫做AI原生系統(tǒng)。
我原來談AI原生的時(shí)候談到過,AI原生核心是知識(shí)原生,為何你當(dāng)前企業(yè)有數(shù)據(jù)庫數(shù)據(jù),有資料文檔,不能快速的構(gòu)建AI原生應(yīng)用?里面的關(guān)鍵就是數(shù)據(jù)到智能的轉(zhuǎn)化,中間需要知識(shí)層。
所以你拿著我這個(gè)問題你可能就會(huì)思考,我現(xiàn)在基于AI大模型的能力,基于我已有的數(shù)據(jù),我去開發(fā)了上層很多AI Agent智能體應(yīng)用,這些AI智能體的應(yīng)用是不是一個(gè)AI原生應(yīng)用呢?
圖片
所以在這里再做一個(gè)說明:
當(dāng)前業(yè)界有另外一個(gè)說法,就是AI原生應(yīng)用就是基于AI大模型能力開發(fā)的應(yīng)用,即AI原生應(yīng)用的特征是其區(qū)別于傳統(tǒng)應(yīng)用的核心。AI原生應(yīng)用是基于大模型開發(fā)的。這里的大模型指的是具有強(qiáng)大計(jì)算能力和豐富數(shù)據(jù)訓(xùn)練的AI算法,如GPT-4、百度的文心一言等,它們構(gòu)成了應(yīng)用的核心驅(qū)動(dòng)力。大模型不僅僅是完成特定任務(wù)的工具,更是AI原生應(yīng)用創(chuàng)新的基石。
注意這個(gè)說法只解決了AI原生應(yīng)用的大模型原生問題,并沒有解決知識(shí)原生的問題。如果按這個(gè)說法所有的AI智能體應(yīng)用都是AI原生應(yīng)用,但是我的理解,AI原生應(yīng)用的核心重點(diǎn)應(yīng)該是在知識(shí)原生上面。
大家可以自己看一下,或者是復(fù)盤一下你開發(fā)的AI智能體,實(shí)際上你在AI智能體應(yīng)用里面仍然出現(xiàn)了大量的業(yè)務(wù)規(guī)則邏輯處理或者是相關(guān)的業(yè)務(wù)流的編排,這些內(nèi)容并沒有內(nèi)置到底層的大模型的里面。
也就是說我底層雖然說有相關(guān)的一些數(shù)據(jù)支持,但是涉及到相關(guān)的業(yè)務(wù)處理規(guī)則邏輯,涉及到我個(gè)人的一些處理經(jīng)驗(yàn)的內(nèi)容,仍然是在上層,沒有在我底層的大模型里面,所以對(duì)于AI智能體應(yīng)用,我個(gè)人的理解也很難稱之為一個(gè)AI原生應(yīng)用。
知識(shí)本體論-從數(shù)據(jù)到信息,從信息到知識(shí)
圖片
注意DIKW知識(shí)管理金字塔模型的都知識(shí),在整個(gè)模型里面從下到上為數(shù)據(jù)-信息-知識(shí)-智慧。大家一定要注意,數(shù)據(jù)不能直接產(chǎn)生智慧,知識(shí)才是產(chǎn)生智慧的基礎(chǔ)。
經(jīng)過加工清晰的有用數(shù)據(jù)可以變成信息,而經(jīng)過我們大量實(shí)踐驗(yàn)證的信息最終才能夠轉(zhuǎn)變?yōu)橹R(shí)和經(jīng)驗(yàn)。知識(shí)就是我們大量實(shí)踐經(jīng)驗(yàn)的高度顯性化表達(dá)。
我原來在講知識(shí)管理的時(shí)候舉過一個(gè)例子,知識(shí)不是最終你形成的這么一個(gè)文檔這個(gè)結(jié)果,而是你思考形成文檔的過程,這個(gè)過程才是核心的知識(shí)或者是經(jīng)驗(yàn)。才是我們構(gòu)建AI原生的關(guān)鍵基礎(chǔ)能力。
那么當(dāng)前企業(yè)在數(shù)字化轉(zhuǎn)型或構(gòu)建AI原生的時(shí)候面臨的實(shí)際情況是什么呢?其一就是連數(shù)據(jù)這個(gè)層次都沒搞明白,數(shù)據(jù)不標(biāo)準(zhǔn),不一致,重復(fù)等問題嚴(yán)重,連體現(xiàn)數(shù)據(jù)驅(qū)動(dòng)都難;其二就是我們應(yīng)用數(shù)據(jù)或應(yīng)用系統(tǒng)的經(jīng)驗(yàn)沒有濃縮為知識(shí)沉淀下來,或者簡單說缺少知識(shí)這個(gè)重要分層。
所以在前面我曾經(jīng)談到過Palantir這家公司,一開始我的理解僅僅是大模型賦能下的一個(gè)數(shù)據(jù)中臺(tái)和提供數(shù)據(jù)服務(wù)的公司,但是實(shí)際這家公司核心是基于是基于Ontology本體系統(tǒng)構(gòu)建了一個(gè)核心的知識(shí)中臺(tái)。
Palantir 的核心架構(gòu)是基于 Ontology(業(yè)務(wù)本體),它不僅整合數(shù)據(jù),更定義了企業(yè)中的“決策邏輯”。AI 模型被嵌入到這個(gè)本體中,成為可復(fù)用、可治理的“決策函數(shù)”,從而實(shí)現(xiàn):
- AI+規(guī)則混合決策:既可用 AI 預(yù)測需求,也可用業(yè)務(wù)規(guī)則設(shè)定庫存閾值,系統(tǒng)會(huì)自動(dòng)協(xié)調(diào)兩者
- 實(shí)時(shí)反饋閉環(huán):AI 的預(yù)測結(jié)果會(huì)寫回 Ontology,成為下一次決策的輸入,形成持續(xù)優(yōu)化的閉環(huán)。
本體=對(duì)象+屬性+關(guān)系
而知識(shí)本體類似我們經(jīng)常談到的知識(shí)圖譜,知識(shí)圖譜重要的不僅僅是實(shí)體,而是實(shí)體間的關(guān)系。有了關(guān)系才能夠形成完整的推理能力。類似我們?cè)谶M(jìn)行面向?qū)ο蠓治鼋R粯?,不僅僅有對(duì)象和對(duì)象熟悉,更加重要的是有方法和行為。而方法和行為形成了對(duì)象間的關(guān)系連接。在整個(gè)本體建模中真正重要的是行為建模,關(guān)系建模。有了關(guān)系才能夠形成相應(yīng)大模型推理的邏輯基礎(chǔ)。
類似我們拿醫(yī)療供應(yīng)鏈業(yè)務(wù)舉例,我們?cè)诮r(shí)講相關(guān)數(shù)據(jù)映射到 Ontology 的三類元素:
- 對(duì)象(Objects):口罩生產(chǎn)線、供應(yīng)商、倉庫、客戶訂單、運(yùn)輸路線……
- 屬性(Properties):每條產(chǎn)線的當(dāng)前產(chǎn)能、每個(gè)倉庫的庫存量、訂單的交付截止日期。
- 關(guān)系(Links):供應(yīng)商 A 為 生產(chǎn)線 B 提供 熔噴布;訂單 C 由 倉庫 D 履行。
傳統(tǒng)IT系統(tǒng)構(gòu)建方式的變革
圖片
在前面我也談到過AI軟件工程3.0,包括AI時(shí)代對(duì)軟件軟件構(gòu)建方式的影響,包括AI編程和VibeCoding。但是這些內(nèi)容更多的都是在從技術(shù)層面談AI時(shí)代對(duì)軟件開發(fā)構(gòu)建模式上的影響和變革。
基于前面談到的本體論的思想,實(shí)際在AI原生時(shí)代,更大的變革來自于AI應(yīng)用模型構(gòu)建上面的變更,來源于對(duì)數(shù)據(jù)和知識(shí)構(gòu)建模式的變革。
所以再回過頭來我們?cè)偃タ紤]一下我們?cè)瓉韎t系統(tǒng)的構(gòu)建模式,當(dāng)然很簡單,你有了相關(guān)的需求分析,你去做架構(gòu)設(shè)計(jì),然后再去做開發(fā)實(shí)現(xiàn),最后部署出一個(gè)完整的it系統(tǒng),一般的it系統(tǒng)它都有底層的數(shù)據(jù)庫和上層的應(yīng)用。包括到了微服務(wù)架構(gòu)階段,上層應(yīng)用出現(xiàn)了前后端進(jìn)一步分離。
知識(shí)=對(duì)象+屬性+行為關(guān)系
但是我們?nèi)匀豢梢钥吹接猩蠈拥膽?yīng)用和底層的數(shù)據(jù)庫兩層的一個(gè)劃分,底層的數(shù)據(jù)庫,數(shù)據(jù)架構(gòu)和數(shù)據(jù)模型,沉淀了相關(guān)的數(shù)據(jù),包括數(shù)據(jù)和數(shù)據(jù)之間的一些關(guān)系,但是這一些數(shù)據(jù)很難說叫一個(gè)完整的知識(shí),知識(shí)是什么東西呢?那么對(duì)于一個(gè)it系統(tǒng)這些知識(shí)在哪里呢?
這些知識(shí)實(shí)際上是沉淀在你上層的應(yīng)用里面,沉淀在你上層應(yīng)用實(shí)現(xiàn)的代碼里面,包括代碼里面,我們實(shí)現(xiàn)的數(shù)據(jù)應(yīng)該怎么樣去處理和流轉(zhuǎn),相關(guān)的業(yè)務(wù)規(guī)則應(yīng)該怎么樣去處理?這些東西都是在代碼里面,并沒有沉淀到下層的我們的數(shù)據(jù)庫里面。
包括前面我談到的,我們雖然在面向?qū)ο蠓治鼋5臅r(shí)候,構(gòu)建了完整的對(duì)象,屬性和行為關(guān)系。但是轉(zhuǎn)到IT系統(tǒng)構(gòu)建實(shí)現(xiàn)的時(shí)候?qū)嶋H這兩個(gè)部分內(nèi)容進(jìn)行了分離。對(duì)象和屬性落地到數(shù)據(jù)庫模型里面,而行為和關(guān)系邏輯實(shí)際體現(xiàn)在了上層應(yīng)用的代碼里面。
也就是當(dāng)前的傳統(tǒng)IT系統(tǒng),你僅僅是通過底層的數(shù)據(jù)庫和數(shù)據(jù),這個(gè)不是完整意義上的知識(shí),缺乏了數(shù)據(jù)形成的知識(shí),缺乏了數(shù)據(jù)之間的關(guān)系和行為邏輯。因?yàn)檫@個(gè)邏輯沒有進(jìn)行模型化沉淀,是在你上層應(yīng)用代碼里面。
圖片
所以你現(xiàn)在要構(gòu)建一個(gè)AI原生系統(tǒng),里面有相當(dāng)重要的兩個(gè)核心的內(nèi)容,第一個(gè)就是我原有的數(shù)據(jù)庫數(shù)據(jù),這些信息我怎么樣經(jīng)過進(jìn)一步的加工和興起,朝我的核心的知識(shí)庫轉(zhuǎn)移。第二個(gè)點(diǎn)就是我原來構(gòu)建在上層應(yīng)用里面的相關(guān)的處理規(guī)則和邏輯,怎么樣進(jìn)一步下成為相關(guān)的模型,沉淀到我的知識(shí)庫里面,只有這樣你才能夠逐漸形成一個(gè)關(guān)鍵的知識(shí)中臺(tái)。
只有這樣才能夠形成完整意義上的知識(shí)層,有了知識(shí)這一塊內(nèi)容,再加上AI大模型的能力,你才能夠真正的去構(gòu)建AI原生的應(yīng)用。
所以這個(gè)其實(shí)就是我一直強(qiáng)調(diào)的,我們真正的離AI原生應(yīng)用還有相當(dāng)長的一個(gè)距離。至于我個(gè)人的想法就是至少在3~5年的時(shí)間都很難真正達(dá)到一個(gè)AI原生應(yīng)用的這么一個(gè)理想的狀態(tài)。里面還有一個(gè)很核心的原因,就是我原來講過的,對(duì)于AI大模型,它的天生的能力是在處理模糊的東西,而不是處理精確的規(guī)則。很多精確的規(guī)則,你即使前期做了相關(guān)的規(guī)則化的定義,規(guī)則的定義,形成提示語,基于上下文的工程,你把它落地到了大模型里面,那么你在用這一些精確規(guī)則的時(shí)候,大模型往往也會(huì)出現(xiàn)相應(yīng)的處理的幻覺,這個(gè)問題短期其實(shí)是很難克服的。
最后,當(dāng)我們重新在思考AI原生應(yīng)用的時(shí)候,可以先問自己三個(gè)問題,或許你就有了這個(gè)應(yīng)用是否AI原生的正確答案,即:
- 去掉AI后,這個(gè)系統(tǒng)還能實(shí)現(xiàn)其核心價(jià)值嗎?
- AI是后期添加的功能,還是從第一天就是系統(tǒng)基礎(chǔ)?
- 系統(tǒng)的競爭力主要來自AI能力,還是傳統(tǒng)軟件工程?
AI原生代表了軟件開發(fā)的新范式,它改變了我們思考和構(gòu)建應(yīng)用的方式,讓智能成為軟件的基因而非附加功能。
今天的分享就到這里,希望對(duì)大家有所啟發(fā)。



























