基于 LangChain 六步構(gòu)建企業(yè)級(jí) AI 智能體應(yīng)用 原創(chuàng)
AI 智能體應(yīng)用在企業(yè)場(chǎng)景中落地越來(lái)越多了,本文通過(guò)從挑選企業(yè)業(yè)務(wù)場(chǎng)景開(kāi)始,構(gòu)建最小可行性產(chǎn)品(MVP),再到測(cè)試 AI 智能體應(yīng)用的質(zhì)量和安全性,最后到生產(chǎn)中的部署運(yùn)維等全方位帶你基于 LangChain 6步構(gòu)建一個(gè) AI 智能體應(yīng)用。
下文我們?cè)敿?xì)剖析之。
AI 智能體應(yīng)用6步構(gòu)建法
今年很多公司都在談?wù)摌?gòu)建 AI 智能體,企業(yè)很容易想象 AI 智能體如何改變公司已有業(yè)務(wù),但許多團(tuán)隊(duì)不確定從哪里開(kāi)始、如何取得進(jìn)展以及如何設(shè)定期望。
本指南將帶你從想法到實(shí)施落地的全過(guò)程:以構(gòu)建電子郵件 AI 智能體的真實(shí)案例來(lái)說(shuō)明。
1、步驟一:定義 AI 智能體的功能和性能
1.1、落地設(shè)計(jì)
首先在企業(yè)中選擇一些現(xiàn)實(shí)的業(yè)務(wù)場(chǎng)景,并確定需要 AI 智能體才能更好完成的任務(wù)。
選擇一些你可以教一個(gè)聰明的實(shí)習(xí)生做的事情。如果最好的實(shí)習(xí)生即使有足夠的時(shí)間和資源也無(wú)法完成任務(wù),那么這個(gè)任務(wù)可能不現(xiàn)實(shí)或過(guò)于雄心勃勃。在激活專家模式之前,先證明你可以掌握基礎(chǔ)知識(shí)。
首先,想出5-10個(gè)具體的企業(yè)任務(wù)場(chǎng)景。這有兩個(gè)目的:
首先,它驗(yàn)證了你的想法是否定義得當(dāng):既不太瑣碎也不太模糊。 其次,為你以后衡量性能提供了基準(zhǔn)。
1.2、案例實(shí)施:構(gòu)建電子郵件 AI 智能體
在這一步,我們會(huì)定義 AI 智能體需要處理的任務(wù),可能包括:
- 優(yōu)先處理來(lái)自關(guān)鍵利益相關(guān)者的緊急郵件;
- 根據(jù)日歷可用性安排會(huì)議;
- 忽略垃圾郵件或不需要回復(fù)的郵件;
- 根據(jù)公司文檔回答產(chǎn)品問(wèn)題;
需要避免的事情:
- 如果你不能提出具體的業(yè)務(wù)場(chǎng)景,你的范圍可能太寬泛了;
- 當(dāng)邏輯簡(jiǎn)單、固定且已經(jīng)在其他公司以及實(shí)現(xiàn)的場(chǎng)景,使用 AI 智能體會(huì)比傳統(tǒng)軟件更好。但是,AI 智能體有時(shí)慢、昂貴且難以處理。如果傳統(tǒng)軟件可以很好地完成任務(wù),就沒(méi)必要再使用 AI 智能體;
- 期望不存在的魔法(比如:連接到尚不存在或無(wú)法構(gòu)建的 API 或數(shù)據(jù)集)。
2、步驟二:為 AI 智能體設(shè)計(jì)工作流程(Workflow)
2.1、落地設(shè)計(jì)
為 AI 智能體編寫一個(gè)詳細(xì)的標(biāo)準(zhǔn)操作程序(SOP),包括人類如何執(zhí)行任務(wù)或流程的逐步說(shuō)明。
這一步有助于確認(rèn)你選擇了一個(gè)有明確、合理范圍的業(yè)務(wù)場(chǎng)景。它還揭示了你的 AI 智能體可能需要處理的關(guān)鍵步驟、決策和工具:為 AI 智能體應(yīng)用編排構(gòu)建打下基礎(chǔ)。
2.2、案例實(shí)施:構(gòu)建電子郵件 AI 智能體
對(duì)于我們的電子郵件 AI 智能體,一個(gè)逐步的工作流程可能如下所示:
- 分析電子郵件內(nèi)容和發(fā)件人背景以分類響應(yīng)優(yōu)先級(jí);
- 檢查日歷可用性,安排視頻會(huì)議;
- 根據(jù)電子郵件、發(fā)件人和日程安排背景起草回復(fù);
- 在快速人工審查和批準(zhǔn)后發(fā)送電子郵件。
把工作流程寫出來(lái)有助于確保任務(wù)范圍適當(dāng),并揭示我們的 AI 智能體將需要處理的工具和邏輯。
3、步驟三:使用提示詞構(gòu)建 MVP
3.1、落地設(shè)計(jì)
選擇一個(gè)起點(diǎn)很重要。如果你的 AI 智能體很復(fù)雜,試圖一次性完成所有事情過(guò)于雄心勃勃。首先,根據(jù) SOP 進(jìn)行 AI 智能體的架構(gòu)設(shè)計(jì):它將如何流動(dòng),需要做出哪些決策,以及哪里需要 LLM 推理。
然后,通過(guò)專注于最關(guān)鍵的 LLM 推理任務(wù)(比如:分類、決策),并創(chuàng)建一個(gè)處理它們的提示詞來(lái)構(gòu)建 MVP。大多數(shù) AI 智能體失敗是因?yàn)?LLM 無(wú)法為任務(wù)進(jìn)行足夠的推理。在手工輸入數(shù)據(jù)讓一個(gè)提示詞工作后,將幫助你在繼續(xù)構(gòu)建完整 AI 智能體之前建立信心。像 LangSmith 這樣的提示詞工程工具可以幫助簡(jiǎn)化這個(gè)過(guò)程,從管理提示詞版本,到跨場(chǎng)景或數(shù)據(jù)集測(cè)試,以及伴隨迭代跟蹤性能。
保持簡(jiǎn)單:
- 從手動(dòng)輸入提示詞需要的任何數(shù)據(jù)或上下文開(kāi)始(現(xiàn)在先不要自動(dòng)化);
- 根據(jù)你在步驟一中概述的例子測(cè)試,以驗(yàn)證常見(jiàn)用例的性能;
- 專注于讓 LLM 推理正確。
3.2、案例實(shí)施:構(gòu)建電子郵件 AI 智能體
在這個(gè)階段,我們首先識(shí)別并確定一個(gè)高杠桿推理任務(wù)。
對(duì)于我們的電子郵件 AI 智能體,這可能意味著只專注于根據(jù)緊急程度和意圖對(duì)電子郵件進(jìn)行分類(比如:會(huì)議請(qǐng)求、支持問(wèn)題),因?yàn)檫@是 AI 智能體其余部分所依賴的基礎(chǔ)步驟。
首先編寫一個(gè)核心提示詞,只做這個(gè),并且手工輸入如下:
- 電子郵件內(nèi)容:“我們下周可以開(kāi)會(huì)討論 LangChain 的產(chǎn)品路線圖嗎?”
- 發(fā)件人:“杰夫·貝佐斯”,頭銜:“亞馬遜 CEO”
- 輸出:意圖 = “會(huì)議請(qǐng)求”,緊急程度 = “高” 。
一旦大模型在你的測(cè)試用例推理中始終正確,你將有信心核心邏輯是可靠的,并且有一個(gè)堅(jiān)實(shí)的基礎(chǔ)可以建立。
4、步驟四:AI 智能體構(gòu)建和編排
4.1、落地設(shè)計(jì)
現(xiàn)在我們有一個(gè)可用的提示詞,是時(shí)候?qū)⑻崾驹~連接到真實(shí)數(shù)據(jù)和用戶輸入了。
首先確定提示詞需要什么上下文或數(shù)據(jù):比如:電子郵件內(nèi)容、日歷可用性和產(chǎn)品文檔,并計(jì)劃如何以編程方式訪問(wèn)它(比如:通過(guò) API、數(shù)據(jù)庫(kù)或文件系統(tǒng))。
然后,編寫編排邏輯以將正確的數(shù)據(jù)連接到你的提示詞中。在簡(jiǎn)單的情況下,這可能只是直接傳遞輸入。對(duì)于更復(fù)雜的工作流程,你可能需要 AI 智能體業(yè)務(wù)邏輯層來(lái)決定查詢哪些數(shù)據(jù)源、何時(shí)調(diào)用它們以及如何在提示詞喂給 LLM 之前組合它們的輸出。
4.2、案例實(shí)施:構(gòu)建電子郵件 AI 智能體
對(duì)于我們的電子郵件 AI 智能體,這一步可能涉及與 Gmail API(讀取傳入電子郵件)、Google Calendar API(檢查可用性)和 CRM 或聯(lián)系人數(shù)據(jù)庫(kù)(豐富發(fā)件人背景)集成。
然后我們將構(gòu)建如下編排邏輯:
- 新電子郵件觸發(fā) AI 智能體;
- AI 智能體通過(guò) MCP 網(wǎng)關(guān)層從 CRM 或通過(guò)網(wǎng)絡(luò)搜索獲取發(fā)件人信息;
- 它將完整上下文傳遞到提示詞中以確定緊急程度以及是否需要回復(fù);
- 如果適合會(huì)議,它檢查日歷可用性并提出時(shí)間;
- AI 智能體起草回復(fù);
- 在人工審查后,它發(fā)送電子郵件。
5、步驟五:AI 智能體測(cè)試和迭代
5.1、落地設(shè)計(jì)
首先使用你在步驟一中定義的例子手動(dòng)測(cè)試你的 MVP。目標(biāo)是驗(yàn)證你的 AI 智能體是否為你的核心用例產(chǎn)生了合理、準(zhǔn)確的輸出。如果你的系統(tǒng)涉及多個(gè) LLM 調(diào)用或步驟,使用像 LangSmith 這樣的工具設(shè)置跟蹤以可視化流程并在每個(gè)階段調(diào)試決策是如何做出的,這很有幫助。
一旦手動(dòng)測(cè)試穩(wěn)定,擴(kuò)展到自動(dòng)化測(cè)試以確保一致性并捕獲邊緣情況。團(tuán)隊(duì)通常會(huì)將例子增加到幾十個(gè),以更好地了解 AI 智能體的優(yōu)勢(shì)和劣勢(shì)。這也有助于你在添加更多復(fù)雜性之前量化性能:
- 通過(guò)你的 AI 智能體以編程方式運(yùn)行所有例子(原始的 + 新的);
- 定義自動(dòng)化成功指標(biāo):這強(qiáng)制你明確 AI 智能體的預(yù)期行為;
- 有選擇地使用人工審查以捕捉指標(biāo)可能錯(cuò)過(guò)的問(wèn)題;
5.2、案例實(shí)施:構(gòu)建電子郵件 AI 智能體
對(duì)于電子郵件 AI 智能體,我們希望在幾個(gè)關(guān)鍵領(lǐng)域定義和測(cè)試成功:
- 語(yǔ)氣和安全性:回復(fù)應(yīng)專業(yè)、尊重且不含虛構(gòu)或不當(dāng)內(nèi)容;
- 意圖和優(yōu)先級(jí)檢測(cè):應(yīng)根據(jù)發(fā)件人和內(nèi)容正確分類和優(yōu)先處理電子郵件;
- 工具使用效率:AI 智能體應(yīng)僅觸發(fā)必要的工具(比如:如果不需要安排,則避免檢查日歷);
- 草稿質(zhì)量:建議的回復(fù)應(yīng)根據(jù)輸入上下文清晰、相關(guān)且準(zhǔn)確。
6、步驟六:AI 智能體部署、擴(kuò)展和完善
6.1、落地設(shè)計(jì)
一旦你的 MVP 可靠地運(yùn)行,開(kāi)始擴(kuò)展其范圍:添加新功能、更廣泛的場(chǎng)景,甚至多 AI 智能體工作流程。對(duì)于每個(gè)新功能或集成,重復(fù)步驟五中的測(cè)試過(guò)程,以確保沒(méi)有破壞現(xiàn)有功能。
準(zhǔn)備好后,將其部署到生產(chǎn)環(huán)境中供用戶使用。LangGraph 平臺(tái)允許你通過(guò)一鍵部署快速發(fā)布、擴(kuò)展和管理你的 AI 智能體。
可視化觀測(cè)用戶如何實(shí)際使用你的 AI 智能體。像 LangSmith 這樣的工具讓你可以實(shí)時(shí)跟蹤 AI 智能體的操作,更容易發(fā)現(xiàn)成本激增、準(zhǔn)確性問(wèn)題或延遲。實(shí)際使用情況通常與你的初始假設(shè)不同,這些洞察可以揭示差距、發(fā)現(xiàn)意外需求,并指導(dǎo)你在下一次迭代中的優(yōu)先級(jí)。
關(guān)鍵是將發(fā)布到生產(chǎn)環(huán)境中視為迭代的開(kāi)始,而不是開(kāi)發(fā)的結(jié)束。
6.2、案例實(shí)施:構(gòu)建電子郵件 AI 智能體
部署我們的電子郵件 AI 智能體后,我們可能會(huì)通過(guò)監(jiān)控流量和常見(jiàn)用例發(fā)現(xiàn)未解決的場(chǎng)景。
這些新興模式表明有機(jī)會(huì)擴(kuò)大范圍。我們可以迭代地添加新功能并更新我們的提示詞和編排邏輯:在進(jìn)一步擴(kuò)展之前始終通過(guò)測(cè)試和用戶反饋驗(yàn)證每個(gè)新添加的功能。
7、總結(jié)
這個(gè)過(guò)程旨在幫助你構(gòu)建基于明確用例、經(jīng)過(guò)真實(shí)例子測(cè)試并由真實(shí)世界反饋塑造的 AI 智能體。這不僅僅是讓 AI 智能體運(yùn)行,而是構(gòu)建有用、可靠并與人們實(shí)際工作方式一致的 AI 智能體。
無(wú)論你是自動(dòng)化電子郵件分類還是編排復(fù)雜工作流程,這六個(gè)步驟都提供了從想法到落地的實(shí)際路徑。但工作在部署后并沒(méi)有停止:最好的 AI 智能體是通過(guò)迭代構(gòu)建形成的。
所以,從小處開(kāi)始,始終保持以用戶需求為中心的態(tài)度,并不斷改進(jìn)和完善。
本文轉(zhuǎn)載自???玄姐聊AGI?? 作者:玄姐
