推倒重來!Notion新版本底層地震級(jí)變化,架構(gòu)全變!AI建模負(fù)責(zé)人曝邏輯:單一工作流編排已經(jīng)不是主流!隔離幻覺,吃自己的狗糧
原創(chuàng) 精選出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
許多公司會(huì)對(duì)徹底重建自己的技術(shù)棧猶豫不決。但 Notion 就是那個(gè)例外。
據(jù)了解,為了推出今年9月發(fā)布的 Notion 3.0,這家公司幾乎沒有猶豫就決定——徹底重建底層架構(gòu)。
Notion 作為業(yè)界知名的AI應(yīng)用,開始舍棄原有底層架構(gòu),這一點(diǎn)特別不同尋常。
近日,Notion 的 AI 建模負(fù)責(zé)人 Sarah Sachs 在采訪中透露了背后的原因:
“我們不想在舊架構(gòu)上硬塞智能體。相反,我們希望發(fā)揮推理模型的優(yōu)勢(shì)。我們重建了整個(gè)系統(tǒng),因?yàn)橹悄荏w的工作方式和傳統(tǒng)工作流完全不同。”
言外之意,他們意識(shí)到,如果要在企業(yè)級(jí)別支持 Agentic AI(自主智能體),這是必要的一步。
這背后隱藏著一個(gè)重要信號(hào):新舊兩代AI應(yīng)用的技術(shù)構(gòu)建邏輯發(fā)生了變化。
與傳統(tǒng) AI 工作流通常依賴顯式的、一步步的指令和少量示例(few-shot learning)不同,新一代推理模型驅(qū)動(dòng)的 AI 智能體能自己理解可用的工具、規(guī)劃下一步行動(dòng),并具備更強(qiáng)的自主性。
所以,“我們重建了一個(gè)新架構(gòu),因?yàn)楣ぷ髁鞒膛c agent 不同?!?/p>
而重建過程中有哪些寶貴的規(guī)?;疉I應(yīng)用構(gòu)建的經(jīng)驗(yàn)?zāi)??小編這就為大家整理了下來。主要有以下這五點(diǎn)。
1.“僅僅讓AI完成單一任務(wù)已不夠”
如今,Notion 被 94% 的《福布斯 AI 50》公司采用,總用戶超過 1億,客戶包括 OpenAI、Cursor、Figma、Ramp、Vercel 等。
在快速變化的 AI 時(shí)代,Notion 意識(shí)到:僅僅讓 AI 完成單一任務(wù)已經(jīng)不夠。
企業(yè)真正需要的是 以目標(biāo)為導(dǎo)向的推理系統(tǒng),讓智能體能在多個(gè)互聯(lián)環(huán)境中 自主選擇、編排并執(zhí)行工具。
Sachs 指出,如今推理模型在學(xué)習(xí)工具使用和遵循 Chain-of-Thought(思維鏈)方面“已經(jīng)強(qiáng)太多了”。
“它們能更獨(dú)立地完成一個(gè)完整流程中的多次決策,所以我們必須重構(gòu)系統(tǒng)去匹配這種能力?!?/p>
從工程角度看,這意味著要 拋棄僵硬的 prompt 流程,轉(zhuǎn)而采用一個(gè)統(tǒng)一的“編排模型”。
2.模塊化子Agent
這個(gè)核心模型由一系列模塊化子智能體支撐,這些子智能體能搜索 Notion 與網(wǎng)頁、查詢或更新數(shù)據(jù)庫、編輯內(nèi)容等。
- 每個(gè)智能體會(huì)根據(jù)上下文決定使用什么工具,比如先判斷是要在 Notion 內(nèi)部查找,還是去 Slack 等外部平臺(tái)。
- 模型會(huì)連續(xù)檢索,直到找到最相關(guān)的信息,然后自動(dòng)執(zhí)行后續(xù)動(dòng)作:將筆記轉(zhuǎn)成提案、生成跟進(jìn)消息、追蹤任務(wù)、更新知識(shí)庫等。
在 Notion 2.0 時(shí),AI 還需要通過 prompt 精確指定每一步的操作。
但在 3.0 中,用戶可以直接把任務(wù)交給智能體——它會(huì)自主選擇工具,并能并行完成多項(xiàng)任務(wù)。
Sachs 總結(jié)道:
“我們讓它具備自選工具的能力,而不是靠 few-shot 提示一步步教它怎么做。目標(biāo)是:凡是你能做的事,Notion 的智能體也能做?!?/p>
3.分離架構(gòu),隔離幻覺
Notion 一直奉行“更好、更快、更省”的研發(fā)哲學(xué)。在技術(shù)上,他們通過 向量嵌入微調(diào) 與 彈性搜索優(yōu)化 平衡延遲與準(zhǔn)確性。
Sachs 團(tuán)隊(duì)建立了一套嚴(yán)謹(jǐn)?shù)脑u(píng)估體系:結(jié)合確定性測試、語言優(yōu)化、人類標(biāo)注數(shù)據(jù)和 LLM 審核機(jī)制,用模型評(píng)分定位偏差與錯(cuò)誤來源。
“通過把評(píng)估流程分層,我們能明確問題來源,從而隔離掉不必要的幻覺,”Sachs 解釋說。同時(shí),更簡潔的架構(gòu)也意味著——當(dāng)模型與技術(shù)快速演進(jìn)時(shí),更新會(huì)更輕松。
她補(bǔ)充道:
“我們盡可能優(yōu)化延遲和并行推理,這顯著提升了準(zhǔn)確率?!蹦P偷耐评砘诰W(wǎng)頁數(shù)據(jù)與 Notion 自身的知識(shí)空間。
最終,這次重構(gòu)讓 Notion 在功能與迭代速度上都得到了顯著回報(bào)。Sachs 表示:“如果下一個(gè)重大突破到來,我們也完全愿意再次推倒重來?!?/p>
4.“上下文延遲”是主觀的
在模型訓(xùn)練和調(diào)優(yōu)中,Sachs 提出一個(gè)關(guān)鍵觀點(diǎn)——延遲(latency)是主觀的:AI 不應(yīng)一味追求速度,而要在正確的時(shí)間提供最相關(guān)的信息。
“你會(huì)驚訝地發(fā)現(xiàn),不同客戶在‘等待’這件事上容忍度完全不同,” 她說。于是這成了一個(gè)實(shí)驗(yàn):到底多慢,用戶才會(huì)放棄等待?
比如在純導(dǎo)航式搜索中,用戶希望即時(shí)響應(yīng)。
“如果你問‘2+2等于幾’,沒人想等著看智能體在 Slack 或 JIRA 里搜索,” Sachs 打趣道。
但在更復(fù)雜的任務(wù)中,等待反而值得。
Notion 的智能體可以自主工作 長達(dá)20分鐘,在成百上千個(gè)網(wǎng)頁、文件和資料間檢索、綜合。此時(shí),用戶往往樂意讓它在后臺(tái)執(zhí)行,自己去處理其他任務(wù)。
“這其實(shí)是個(gè)產(chǎn)品問題,”她說,“我們需要在 UI 層明確設(shè)定用戶期望,并理解他們對(duì)延遲的心理預(yù)期?!?/p>
5.“吃自己的狗糧”
Notion 深知“吃自己做的狗糧”的重要性——事實(shí)上,公司員工本身就是最重度的 Notion 用戶。
團(tuán)隊(duì)每天在活躍沙盒中生成訓(xùn)練與評(píng)估數(shù)據(jù),同時(shí)還有一個(gè)非常活躍的 “點(diǎn)贊 / 點(diǎn)踩”反饋系統(tǒng)。用戶毫不客氣地提出想改進(jìn)的地方和希望增加的功能。
Sachs 解釋說,當(dāng)用戶點(diǎn)踩一次交互時(shí),就代表他們同意讓人工標(biāo)注員分析那次交互(即便這意味著部分去匿名化)。
“我們每天都在用自己的工具,這讓我們能獲得極快的反饋循環(huán)。”
當(dāng)然,她也承認(rèn),這種“自用視角”可能讓團(tuán)隊(duì)對(duì)產(chǎn)品質(zhì)量和功能有偏見。
為此,Notion 還邀請(qǐng)了一批 “AI 素養(yǎng)極高”的外部設(shè)計(jì)合作伙伴 提前試用新功能,并提供關(guān)鍵反饋。
“這和內(nèi)部原型測試同等重要,”Sachs 強(qiáng)調(diào)?!伴_放式實(shí)驗(yàn)?zāi)塬@得更豐富的反饋。如果我們只看 Notion 怎么用 Notion,就不可能真正做到用戶最佳體驗(yàn)?!?/p>
持續(xù)的內(nèi)部測試還能驗(yàn)證模型是否在退化(準(zhǔn)確率或性能下降)。
“這樣我們能確保一切都保持穩(wěn)定,延遲在可控范圍內(nèi),”她補(bǔ)充說。
她指出,許多公司在評(píng)估時(shí)過于關(guān)注歷史回顧,結(jié)果反而難以理解自己在哪些方面取得了進(jìn)步。而 Notion 把評(píng)估視為衡量“發(fā)展方向與可觀測性”的試金石。
“很多公司混淆了這兩種評(píng)估方式,”Sachs 說。“我們同時(shí)用兩者,但在邏輯上完全區(qū)分開?!?/p>
6.要敢于站在前沿,不要害怕重建
- 當(dāng)基礎(chǔ)能力發(fā)生根本變化時(shí),不要害怕重建。Notion 完全重構(gòu)了架構(gòu),以契合推理型模型。
- 將延遲視為“上下文相關(guān)”的問題。不是一味追求快,而是針對(duì)不同場景優(yōu)化體驗(yàn)。
- 讓所有輸出都基于可信、經(jīng)過整理的企業(yè)數(shù)據(jù)。這是保證準(zhǔn)確性與信任度的前提。
她最后總結(jié)道:
“要敢于做艱難的決定,敢于站在前沿。只有這樣,你才能為用戶打造真正最好的產(chǎn)品?!?/p>
7.總結(jié):Notion的架構(gòu)重建要點(diǎn)
最后,鑒于大家喜歡讓元寶總結(jié)下這篇文章,這里小編也給大家總結(jié)了一下Notion3這次重構(gòu)底層架構(gòu)的五個(gè)要點(diǎn):
- 讓模型能夠自主行動(dòng)(autonomously)
Notion 意識(shí)到市場中簡單、基于任務(wù)的工作流(task-based workflows)已經(jīng)不能滿足要求,需要向能夠自主選擇、組織、執(zhí)行工具的“目標(biāo)導(dǎo)向的推理系統(tǒng)”轉(zhuǎn)變。
在 3.0 版本中,用戶可以把任務(wù)交給 agent,而 agent 本身能并行執(zhí)行多個(gè)子任務(wù)。它們?cè)谂袛嘤檬裁垂ぞ叩臅r(shí)候是自我選擇的,不再依賴顯式提示(prompt)設(shè)定一系列 scenario。
- 模塊化子 agent 與統(tǒng)一調(diào)度模型
架構(gòu)中包含多個(gè)子 agent(sub-agents),這些子 agent 可以在 Notion 內(nèi)部搜索、在網(wǎng)絡(luò)上搜索、查數(shù)據(jù)庫、編輯內(nèi)容等。它們根據(jù)上下文決定要用哪個(gè)工具(比如在 Notion 內(nèi)搜索還是去 Slack 等其他平臺(tái)),直到找到相關(guān)信息。
然后,agent 可以把筆記轉(zhuǎn)換為提案、創(chuàng)建跟進(jìn)消息、跟蹤任務(wù)、更新知識(shí)庫等。
減少幻覺(“胡言亂語” / 輸出不準(zhǔn))
Notion 在追求“更好、更快、更便宜”(better, faster, cheaper)的過程中,持續(xù)迭代,平衡延遲和準(zhǔn)確性。他們用微調(diào)的向量嵌入(vector embeddings)、彈性搜索優(yōu)化 (elastic search optimization) 等方法來做到這一點(diǎn)。
評(píng)估框架非常嚴(yán)格,包含確定性測試、口語化優(yōu)化、人工標(biāo)注數(shù)據(jù)、還有把大語言模型當(dāng)作裁判(LLMs-as-a-judge)來做評(píng)分。模型還要檢測偏差、不一致或不準(zhǔn)之處,從而定位問題源頭。
理解“延遲”的情境性(Contextual Latency)
延遲并不總是壞事,要看用例。用戶在什么情況下能容忍稍微慢一點(diǎn),什么情況下不能容忍,差別很大。比如查“2+2”等簡單問題時(shí),用戶期望幾乎立刻得到結(jié)果;但如果是 agent 要在后臺(tái)跨多個(gè)網(wǎng)站、文件、資料自動(dòng)工作 20 分鐘,那用戶可能覺得可以接受。
界面(UI)上要設(shè)定好用戶的期待(user expectations),讓用戶知道這個(gè)操作可能要多久。
- 自家用產(chǎn)品 + 快速反饋循環(huán)
Notion 自己也是最重度的用戶 (“dogfooding”)。內(nèi)部團(tuán)隊(duì)有沙盒環(huán)境產(chǎn)生訓(xùn)練和評(píng)估數(shù)據(jù),還有很活躍的點(diǎn)贊/點(diǎn)踩反饋機(jī)制。用戶明確不滿意某次互動(dòng)后,可以授權(quán)人工審核那次交互,并盡可能去匿名化分析。
同時(shí),公司也與 “非常懂 AI 的設(shè)計(jì)合作伙伴”合作,讓他們提前試用新功能并反饋。這樣一方面能內(nèi)部快速試錯(cuò),另一方面能獲得外部真實(shí)場景的反饋。
好了,文章到這里結(jié)束了。Notion作為AI辦公類應(yīng)用的代表已經(jīng)向微軟Office發(fā)起了沖鋒,如今架構(gòu)底層已經(jīng)發(fā)生了徹底的變化,說明距離規(guī)?;钠髽I(yè)落地的AI應(yīng)用,黎明時(shí)分已至!
希望能幫助到正在使用AI開發(fā)的各位大佬們。歡迎評(píng)論區(qū)交流。
參考鏈接:https://venturebeat.com/ai/to-scale-agentic-ai-notion-tore-down-its-tech-stack-and-started-fresh






















