偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

構(gòu)建企業(yè)級(jí)多智能體系統(tǒng)：精通LangChain中間件框架與深度智能體架構(gòu)

作者：大模型之路 2025-11-04 01:55:00

搭建智能體的核心邏輯，本質(zhì)是寫一段循環(huán)代碼：LLM思考→調(diào)用工具→獲取結(jié)果→再次思考→重復(fù)?？此坪?jiǎn)單，但落地到生產(chǎn)環(huán)境，現(xiàn)實(shí)會(huì)完全不同。

做AI智能體開發(fā)久了，每個(gè)開發(fā)者都會(huì)遇到一個(gè)轉(zhuǎn)折點(diǎn)：一開始，你搭建的簡(jiǎn)單智能體能調(diào)用工具、處理響應(yīng)，循環(huán)往復(fù)，應(yīng)對(duì)幾個(gè)查詢時(shí)順風(fēng)順?biāo)??？梢坏┟嫦蛘鎸?shí)業(yè)務(wù)場(chǎng)景，問題就會(huì)集中爆發(fā)——要分析一整年的數(shù)據(jù)該怎么辦？合規(guī)要求嚴(yán)禁特定查詢通過該怎么攔截？每次請(qǐng)求都調(diào)用GPT，哪怕是 trivial 需求，導(dǎo)致成本飆升又該如何控制？

這時(shí)候你才會(huì)意識(shí)到：智能體根本不是簡(jiǎn)單的腳本，而是需要精心編排的復(fù)雜系統(tǒng)。而LangChain的最新版本，終于給出了根本性解決方案——不是臨時(shí)補(bǔ)丁或變通方案，而是兩個(gè)真正合理的核心概念：中間件（Middleware） 與 深度智能體（Deep Agents）。只要理解它們的協(xié)同邏輯，后續(xù)的復(fù)雜問題都會(huì)迎刃而解。接下來，我就結(jié)合實(shí)戰(zhàn)經(jīng)驗(yàn)，拆解這套架構(gòu)的核心邏輯。

一、企業(yè)級(jí)智能體的痛點(diǎn)：那些沒人提的“生產(chǎn)坑”

搭建智能體的核心邏輯，本質(zhì)是寫一段循環(huán)代碼：LLM思考→調(diào)用工具→獲取結(jié)果→再次思考→重復(fù)?？此坪?jiǎn)單，但落地到生產(chǎn)環(huán)境，現(xiàn)實(shí)會(huì)完全不同。

去年我服務(wù)過一個(gè)財(cái)務(wù)部門的客戶，他們需要一個(gè)能分析交易數(shù)據(jù)的智能體——看似簡(jiǎn)單，無非是查詢數(shù)據(jù)庫、跑分析、出報(bào)告?？蓛芍軆?nèi)，我被迫疊加了一堆需求：

合規(guī)檢查（不能泄露個(gè)人身份信息PII）
審計(jì)日志（監(jiān)管強(qiáng)制要求）
人工審批節(jié)點(diǎn)（高風(fēng)險(xiǎn)操作必須確認(rèn)）
成本優(yōu)化（LLM調(diào)用并非免費(fèi)）
長(zhǎng)任務(wù)支持（單次分析要3小時(shí)以上）

最終的代碼變成了“亂麻”：合規(guī)邏輯散在一處，日志代碼在另一處，成本優(yōu)化的判斷穿插在各個(gè)環(huán)節(jié)。改一個(gè)規(guī)則，就可能觸發(fā)連鎖故障——典型的軟件工程噩夢(mèng)。

深究根源，單一智能體無法承載企業(yè)級(jí)復(fù)雜度，主要卡在四個(gè)關(guān)鍵點(diǎn)：

上下文窗口有限：調(diào)用10次工具后，一半上下文都會(huì)被歷史記錄占用，后續(xù)分析無空間可用；
一刀切模式失效：做數(shù)據(jù)分析的智能體，需要的工具和寫報(bào)告的智能體完全不同，強(qiáng)行復(fù)用只會(huì)降低效率；
橫切關(guān)注點(diǎn)分散：合規(guī)、日志這類跨場(chǎng)景需求，本應(yīng)是系統(tǒng)級(jí)保障，卻不得不嵌入到每個(gè)智能體的邏輯里；
流程無法控制：一旦出問題就會(huì)“卡殼”——沒法中斷、沒法暫停、也沒法重定向流程。

而LangChain的解法，正是用中間件實(shí)現(xiàn)智能體的“可組合性”，再用深度智能體架構(gòu)賦予其“復(fù)雜任務(wù)處理能力”。

二、讀懂中間件：不是魔法，卻是系統(tǒng)的“骨架”

其實(shí)你可能早就用過中間件的邏輯——比如用Express或FastAPI搭Web API時(shí)，請(qǐng)求進(jìn)來后，認(rèn)證中間件先校驗(yàn)權(quán)限，日志中間件記錄行為，再交給業(yè)務(wù)處理器，最后返回響應(yīng)。每個(gè)中間件都能檢查、修改甚至攔截請(qǐng)求。而企業(yè)級(jí)智能體，恰恰需要這套邏輯。

LangChain給智能體的執(zhí)行流程，預(yù)留了三個(gè)核心“鉤子”（Hook），每個(gè)鉤子都能解決一類關(guān)鍵問題。

1. 三個(gè)核心鉤子：攔截、調(diào)整、清理

（1）before_model：攔截問題，先省錢再辦事

這個(gè)鉤子在LLM被調(diào)用前觸發(fā)，最適合做“前置攔截”——比如發(fā)現(xiàn)查詢違反合規(guī)規(guī)則，直接終止流程，避免浪費(fèi)token。

舉個(gè)實(shí)戰(zhàn)案例，我們可以寫一個(gè)合規(guī)中間件：

class ComplianceMiddleware(AgentMiddleware):
    def before_model(self, state: AgentState) -> dict[str, Any] | None:
        # 獲取最新用戶查詢
        latest_query = state["messages"][-1].content

        # 用正則快速檢查（僅需2-3毫秒）
        if self.is_compliance_violation(latest_query):
            # 直接跳轉(zhuǎn)至流程結(jié)束，返回違規(guī)提示
            return {"jump_to": "end", "violation": True}

        # 合規(guī)則放行
        return None

這個(gè)邏輯的價(jià)值很直觀：如果企業(yè)每天有1萬次請(qǐng)求，1%是違規(guī)查詢，每月能省5000美元——這不是理論值，我在生產(chǎn)環(huán)境中親眼見過它“回本”。

（2）modify_model_request：動(dòng)態(tài)調(diào)整，讓模型“做對(duì)的事”

這個(gè)鉤子在調(diào)用LLM前觸發(fā)，可用來調(diào)整模型參數(shù)（比如溫度值）、注入上下文，避免硬編碼參數(shù)的僵硬。

比如面對(duì)不同任務(wù)時(shí)，我們可以動(dòng)態(tài)調(diào)整溫度：

def modify_model_request(self, request: ModelRequest) -> ModelRequest:
    # 確定性任務(wù)（如數(shù)據(jù)計(jì)算）降低溫度，保證結(jié)果穩(wěn)定
    if self.is_deterministic_task(request.messages):
        request.temperature = 0.2

    # 創(chuàng)造性任務(wù)（如報(bào)告潤(rùn)色）提高溫度，保留靈活性
    if self.needs_creativity(request.messages):
        request.temperature = 1.0

    # 長(zhǎng)提示加緩存：重復(fù)的系統(tǒng)提示無需重新傳輸
    if len(request.messages) > 5000:
        request.metadata["cache_control"] = {"type": "ephemeral"}

    return request

核心思路是“讓任務(wù)適配模型”，而不是用一套參數(shù)應(yīng)對(duì)所有場(chǎng)景——比如用GPT-4處理數(shù)據(jù)計(jì)算時(shí)調(diào)低溫度，用Claude寫報(bào)告時(shí)調(diào)高溫度，效率和效果都會(huì)翻倍。

（3）after_model：清理響應(yīng)，避免“漏網(wǎng)之魚”

LLM返回結(jié)果后，這個(gè)鉤子會(huì)觸發(fā)，可用來驗(yàn)證、清洗或轉(zhuǎn)換響應(yīng)，確保輸出安全合規(guī)。

比如做語義級(jí)的合規(guī)二次檢查（比正則更精準(zhǔn)）：

def after_model(self, state: AgentState) -> dict[str, Any] | None:
    # 獲取LLM的原始響應(yīng)
    llm_response = state["messages"][-1].content

    # 調(diào)用LLM做語義級(jí)合規(guī)檢查（捕捉正則漏檢的問題）
    semantic_check = await self.llm.check_semantic_compliance(llm_response)

    if semantic_check.violates:
        # 替換為安全響應(yīng)，避免泄露違規(guī)內(nèi)容
        return {
            "messages": [HumanMessage(content="該查詢涉及合規(guī)風(fēng)險(xiǎn)，無法處理")],
            "violation": semantic_check
        }

    return None

2. 關(guān)鍵規(guī)則：執(zhí)行順序決定成敗

中間件的執(zhí)行順序有嚴(yán)格規(guī)定，錯(cuò)一步就可能出大問題：

before_model：按中間件列表順序執(zhí)行（比如列表是[合規(guī)→日志→緩存]，就先跑合規(guī)，再日志，最后緩存）；
after_model：按列表反向執(zhí)行（比如列表是[合規(guī)→日志→緩存]，就先跑緩存，再日志，最后合規(guī)）；

為什么after_model要反向？舉個(gè)例子：如果緩存中間件先標(biāo)記“此響應(yīng)需緩存”，日志中間件就能在后續(xù)記錄“該響應(yīng)已緩存”，合規(guī)中間件也能確認(rèn)“緩存的響應(yīng)合規(guī)”——相當(dāng)于“解開?！保_保每個(gè)中間件都能拿到前一個(gè)的結(jié)果。

更關(guān)鍵的是：如果前面的中間件觸發(fā)了“jump_to: end”（比如合規(guī)攔截），后面的中間件就不會(huì)執(zhí)行。這意味著“安全優(yōu)先”——合規(guī)沒通過，就不用走日志、緩存等流程，既高效又安全。

三、中間件實(shí)戰(zhàn)模式：三個(gè)“拿來就用”的方案

LangChain內(nèi)置了多個(gè)中間件模式，不用從零開發(fā)。其中三個(gè)最適合企業(yè)級(jí)場(chǎng)景，幾乎能覆蓋80%的需求。

1. 摘要中間件（SummarizationMiddleware）：解決上下文“爆炸”

問題：智能體多輪交互后，對(duì)話歷史會(huì)撐滿token限制，導(dǎo)致LLM變慢、成本升高。
解法：當(dāng)token達(dá)到閾值時(shí)，自動(dòng)總結(jié)舊消息，保留最新的上下文。

比如設(shè)置token閾值為4000，中間件會(huì)：

自動(dòng)總結(jié)最早的消息（比如“用戶詢問Q4銷售額，已查詢數(shù)據(jù)并返回核心指標(biāo)”）；
保留最近20條消息，確保上下文連貫；
不拆分工具調(diào)用對(duì)（比如智能體調(diào)用工具→獲取結(jié)果，這兩條會(huì)綁定保留，避免上下文丟失）。

我在客戶支持場(chǎng)景中用過這個(gè)中間件——智能體要處理100多輪的長(zhǎng)對(duì)話，用了摘要中間件后，token消耗減少40%，響應(yīng)速度還快了2倍。

2. 人機(jī)協(xié)同中間件（HumanInTheLoopMiddleware）：高風(fēng)險(xiǎn)操作的“安全網(wǎng)”

問題：有些操作（如轉(zhuǎn)賬、刪除數(shù)據(jù)）絕對(duì)不能讓智能體單獨(dú)執(zhí)行，必須人工確認(rèn)。
解法：智能體觸發(fā)特定操作時(shí)，自動(dòng)暫停并通知人工，等待審批后再繼續(xù)。

比如財(cái)務(wù)智能體要執(zhí)行“transfer_funds”（轉(zhuǎn)賬）操作時(shí)：

中間件暫停智能體執(zhí)行；
通過Slack/郵件通知指定負(fù)責(zé)人；
負(fù)責(zé)人5分鐘內(nèi)可“批準(zhǔn)”或“拒絕”；
批準(zhǔn)則繼續(xù)執(zhí)行，拒絕或超時(shí)則終止流程。

曾有一家公司因?yàn)闆]有這個(gè)中間件，智能體因模糊指令誤發(fā)起200萬美元轉(zhuǎn)賬——如果當(dāng)時(shí)有這個(gè)“安全網(wǎng)”，完全可以避免損失。

3. Anthropic提示緩存中間件（AnthropicPromptCachingMiddleware）：成本“殺手”

問題：智能體的系統(tǒng)提示往往很長(zhǎng)（比如1萬token的指令、案例），每次調(diào)用Claude都要重復(fù)傳輸，成本極高。
解法：利用Anthropic的原生緩存——如果前1萬token的系統(tǒng)提示完全相同，直接復(fù)用緩存，不用重新傳輸。

效果非常直觀：

第一次請(qǐng)求：耗時(shí)5000毫秒，全額計(jì)費(fèi)；
5分鐘內(nèi)的重復(fù)請(qǐng)求：耗時(shí)250毫秒，僅收10%費(fèi)用；

如果企業(yè)每天有1萬用戶請(qǐng)求，用這個(gè)中間件能降低75%的成本——這不是“省小錢”，而是企業(yè)級(jí)部署的“必選項(xiàng)”。

唯一需要注意：系統(tǒng)提示必須完全相同才能觸發(fā)緩存。如果每次都加個(gè)性化內(nèi)容（比如用戶ID），緩存會(huì)失效，得重新計(jì)費(fèi)。

四、深度智能體：當(dāng)單一智能體“不夠深”時(shí)

LangChain叫它“深度智能體”，核心原因是“淺層智能體”處理不了復(fù)雜任務(wù)——它們會(huì)在多步驟、多工具的場(chǎng)景中“迷路”。而深度智能體通過三個(gè)特性，解決了“深度任務(wù)”的痛點(diǎn)。

1. 子智能體：讓專業(yè)的人做專業(yè)的事

不同任務(wù)需要不同 expertise（專長(zhǎng)），與其讓一個(gè)智能體“全能”，不如拆分多個(gè)“子智能體”各司其職。

比如搭建一個(gè)“交易分析系統(tǒng)”，我們可以定義兩個(gè)子智能體：

from deepagents.middleware.subagents import SubAgentMiddleware

# 構(gòu)建“主管”智能體，協(xié)調(diào)子智能體
supervisor = create_deep_agent(
    model="claude-sonnet-4-20250514",
    middleware=[
        SubAgentMiddleware(
            subagents=[
                {
                    "name": "data_analyst",  # 數(shù)據(jù)分析師子智能體
                    "description": "分析交易數(shù)據(jù)，識(shí)別風(fēng)險(xiǎn)模式",
                    "system_prompt": "你是數(shù)據(jù)科學(xué)家，專注于統(tǒng)計(jì)嚴(yán)謹(jǐn)性和異常值檢測(cè)",
                    "tools": [sql_query工具, 統(tǒng)計(jì)測(cè)試工具],
                    "model": "gpt-4o"  # GPT-4更擅長(zhǎng)數(shù)據(jù)處理
                },
                {
                    "name": "report_writer",  # 報(bào)告撰寫子智能體
                    "description": "生成簡(jiǎn)潔的高管報(bào)告",
                    "system_prompt": "你是商業(yè)撰稿人，輸出需簡(jiǎn)潔、有可執(zhí)行性",
                    "tools": [格式工具, 導(dǎo)出工具],
                    "model": "claude-sonnet-4-20250514"  # Claude更擅長(zhǎng)邏輯梳理
                }
            ]
        )
    ]
)

每個(gè)子智能體的上下文都很“干凈”——數(shù)據(jù)分析師不用管報(bào)告格式，撰稿人不用懂統(tǒng)計(jì)模型，效率和準(zhǔn)確性都會(huì)大幅提升。而且還能給不同子智能體配不同模型，最大化利用各模型的優(yōu)勢(shì)。

2. 持久化文件系統(tǒng)：告別上下文“爆炸”

普通智能體會(huì)把所有數(shù)據(jù)存在“消息”里，調(diào)用10次工具（每次100KB）后，上下文就會(huì)撐爆。而深度智能體用“文件系統(tǒng)”存儲(chǔ)中間數(shù)據(jù)，消息里只保留“文件引用”。

比如用文件系統(tǒng)中間件：

from deepagents.middleware.filesystem import FilesystemMiddleware

agent = create_deep_agent(
    model="anthropic:claude-sonnet-4-20250514",
    middleware=[
        FilesystemMiddleware(
            backend="memory",  # 可替換為S3、本地文件系統(tǒng)或GCS
            system_prompt="""
            處理數(shù)據(jù)時(shí)需遵循：
            - 用write_file("raw_data.json")保存原始數(shù)據(jù)
            - 用read_file("raw_data.json")讀取數(shù)據(jù)
            - 用ls()查看所有文件
            文件會(huì)持久化，且不會(huì)占用消息上下文
            """
        )
    ]
)

這樣一來，智能體的中間數(shù)據(jù)會(huì)按文件分類存儲(chǔ)：

├── raw_data.json（原始交易數(shù)據(jù)）
├── cleaned_data.json（清洗后數(shù)據(jù)）
├── analysis_results.json（分析結(jié)果）
├── viz_data.json（可視化數(shù)據(jù)）
└── final_report.md（最終報(bào)告）

無論處理多少輪任務(wù)，上下文都不會(huì)“爆炸”——因?yàn)橹悄荏w只需要引用文件路徑，不用攜帶整個(gè)文件內(nèi)容。

3. 詳細(xì)系統(tǒng)提示：用“規(guī)則”替代“硬編碼”

Claude Code之所以強(qiáng)，部分原因是它有40KB+的系統(tǒng)提示，詳細(xì)定義了“如何思考、如何行動(dòng)”。深度智能體也需要這套邏輯——你不用寫復(fù)雜代碼，只需用自然語言描述“行為準(zhǔn)則”。

比如給企業(yè)研究智能體寫系統(tǒng)提示：

SYSTEM_PROMPT = """
你是企業(yè)級(jí)研究智能體，需遵循以下流程：
## 1. 規(guī)劃階段
- 明確需要哪些數(shù)據(jù)
- 確認(rèn)可用工具
- 預(yù)估任務(wù)耗時(shí)
- 預(yù)判可能的風(fēng)險(xiǎn)點(diǎn)

## 2. 執(zhí)行階段
- 一步一步執(zhí)行，不跳過任何環(huán)節(jié)
- 每步結(jié)果都要驗(yàn)證
- 失敗時(shí)重試或升級(jí)處理

## 3. 輸出要求
必須包含：
- 執(zhí)行摘要（2-3段）
- 詳細(xì)發(fā)現(xiàn)（結(jié)構(gòu)清晰）
- 行動(dòng)建議（下一步該做什么）
- 置信度（對(duì)結(jié)果的確定程度）
- 局限性（哪些點(diǎn)沒檢查到）
"""

這看似簡(jiǎn)單，卻是“革命性”的——你不用硬編碼“如何生成摘要”“如何驗(yàn)證結(jié)果”，只需告訴智能體“規(guī)則”，它會(huì)自己適配不同場(chǎng)景。

五、實(shí)戰(zhàn)案例：金融企業(yè)的合規(guī)分析系統(tǒng)

有一家金融公司需要分析100萬+筆交易，識(shí)別合規(guī)風(fēng)險(xiǎn)。用深度智能體+中間件架構(gòu)后，流程是這樣的：

合規(guī)中間件前置攔截：所有查詢先過合規(guī)檢查，排除涉及PII的請(qǐng)求；
摘要中間件管理上下文：處理100萬條數(shù)據(jù)時(shí)，自動(dòng)總結(jié)舊記錄，避免token超限；
子智能體分工：數(shù)據(jù)分析師子智能體找風(fēng)險(xiǎn)模式，報(bào)告撰寫子智能體生成文檔，升級(jí)處理子智能體對(duì)接人工；
人機(jī)協(xié)同中間件審批：發(fā)現(xiàn)高風(fēng)險(xiǎn)交易（如單筆超10萬美元）時(shí)，自動(dòng)暫停并通知合規(guī)團(tuán)隊(duì)審批。

最終結(jié)果：8小時(shí)內(nèi)處理完100萬筆交易，識(shí)別出1200個(gè)合規(guī)風(fēng)險(xiǎn)點(diǎn)，全程無PII泄露，API調(diào)用成本僅400美元。如果用傳統(tǒng)方案（人工+簡(jiǎn)單腳本），至少需要1個(gè)月和5人團(tuán)隊(duì)——效率提升了30倍，成本降低了90%。

六、避坑指南：中間件的正確順序與常見陷阱

很多團(tuán)隊(duì)在落地時(shí)，會(huì)因?yàn)椤绊樞蝈e(cuò)了”或“誤解機(jī)制”導(dǎo)致故障。這里總結(jié)最關(guān)鍵的規(guī)則和陷阱。

1. 中間件的正確順序：安全優(yōu)先，性能靠后

錯(cuò)誤的順序（比如先緩存后合規(guī)）會(huì)導(dǎo)致“合規(guī)違規(guī)的響應(yīng)被緩存”，后續(xù)相同請(qǐng)求會(huì)直接返回違規(guī)內(nèi)容——這是監(jiān)管災(zāi)難。

正確的順序應(yīng)該是：

# ? 正確順序：安全→認(rèn)證→限流→日志→性能
agent = create_agent(
    middleware=[
        ComplianceMiddleware(),     # 1. 先攔合規(guī)風(fēng)險(xiǎn)
        AuthenticationMiddleware(), # 2. 再驗(yàn)用戶身份
        RateLimitMiddleware(),      # 3. 防請(qǐng)求濫用
        LoggingMiddleware(),        # 4. 記錄行為（可追溯）
        CachingMiddleware(),        # 5. 最后做緩存（性能優(yōu)化）
    ]
)

可以類比夜總會(huì)的流程：先查ID（認(rèn)證），再看是否在黑名單（合規(guī)），再控制進(jìn)場(chǎng)人數(shù)（限流），最后記錄進(jìn)場(chǎng)時(shí)間（日志）——不會(huì)讓客人先進(jìn)場(chǎng)再查身份。

而且只要合規(guī)中間件觸發(fā)“jump_to: end”，后面的中間件都不會(huì)執(zhí)行——安全永遠(yuǎn)是第一優(yōu)先級(jí)。

2. 四個(gè)最容易踩的坑

（1）混淆after_model的執(zhí)行順序

我曾花3小時(shí)調(diào)試：以為after_model和before_model按同一順序執(zhí)行，結(jié)果發(fā)現(xiàn)是反向的。記?。篴fter_model是“倒序”執(zhí)行，目的是讓后面的中間件能拿到前面的處理結(jié)果。

（2）假設(shè)狀態(tài)跨跳轉(zhuǎn)后仍持久

如果從after_model跳轉(zhuǎn)到model階段，狀態(tài)會(huì)重置為“model預(yù)期的初始狀態(tài)”——要在跳轉(zhuǎn)前更新狀態(tài)，而不是跳轉(zhuǎn)后。

（3）子智能體不共享上下文

子智能體不會(huì)自動(dòng)同步信息——數(shù)據(jù)分析師子智能體的發(fā)現(xiàn)，報(bào)告撰寫子智能體看不到，必須通過文件系統(tǒng)（如write_file保存結(jié)果）或系統(tǒng)提示（如“參考data_analyst的分析結(jié)果”）顯式傳遞。

（4）動(dòng)態(tài)系統(tǒng)提示破壞緩存

如果每次請(qǐng)求都修改系統(tǒng)提示（比如加用戶ID、時(shí)間戳），Anthropic的提示緩存會(huì)失效——要緩存的話，系統(tǒng)提示必須完全相同。

七、落地步驟：從0到1搭建企業(yè)級(jí)系統(tǒng)

如果想落地這套架構(gòu)，不用一步到位，可以按以下四步循序漸進(jìn)：

步驟1：從日志中間件開始，熟悉機(jī)制

先寫一個(gè)簡(jiǎn)單的日志中間件，觀察鉤子的執(zhí)行邏輯：

class LoggingMiddleware(AgentMiddleware):
    def before_model(self, state: AgentState) -> dict[str, Any] | None:
        logger.info(f"即將調(diào)用模型，消息數(shù)量：{len(state['messages'])}")
        return None

    def after_model(self, state: AgentState) -> dict[str, Any] | None:
        logger.info(f"模型響應(yīng)長(zhǎng)度：{len(state['messages'][-1].content)}")
        return None

通過日志理解“before_model→model→after_model”的流程，熟悉狀態(tài)（state）的結(jié)構(gòu)——這是后續(xù)復(fù)雜開發(fā)的基礎(chǔ)。

步驟2：添加核心業(yè)務(wù)中間件

熟悉機(jī)制后，針對(duì)企業(yè)的核心痛點(diǎn)添加中間件：比如金融行業(yè)先加合規(guī)中間件，電商行業(yè)先加成本優(yōu)化中間件。先解決最緊急的問題，再迭代其他功能。

步驟3：引入深度智能體處理復(fù)雜任務(wù)

如果有長(zhǎng)任務(wù)（如8小時(shí)數(shù)據(jù)分析）或多步驟任務(wù)（如“查數(shù)據(jù)→分析→寫報(bào)告→導(dǎo)出”），再引入深度智能體，拆分子智能體、配置文件系統(tǒng)。

步驟4：部署監(jiān)控，用LangSmith做可觀測(cè)性

上線后一定要用LangSmith監(jiān)控：中間件是否攔截了違規(guī)請(qǐng)求？子智能體的調(diào)用是否正常？緩存命中率有多高？只有看到數(shù)據(jù)，才能持續(xù)優(yōu)化。

八、企業(yè)級(jí)AI系統(tǒng)的“新默認(rèn)架構(gòu)”

對(duì)于構(gòu)建生產(chǎn)環(huán)境的AI系統(tǒng)，“中間件+深度智能體”已經(jīng)不是“可選方案”，而是“默認(rèn)標(biāo)準(zhǔn)”——它解決了企業(yè)最關(guān)心的五大問題：

合規(guī)：中間件前置攔截，系統(tǒng)級(jí)保障；
成本：緩存中間件+動(dòng)態(tài)模型參數(shù)，大幅降本；
長(zhǎng)任務(wù)：文件系統(tǒng)+子智能體，支撐小時(shí)級(jí)任務(wù)；
復(fù)雜推理：專業(yè)化子智能體，各司其職；
安全：人機(jī)協(xié)同中間件，攔截高風(fēng)險(xiǎn)操作。

你不用再用“補(bǔ)丁”拼湊系統(tǒng)，而是有了一套結(jié)構(gòu)化的框架。如果想開始實(shí)踐，建議先看LangChain的官方文檔和GitHub倉庫——里面的示例很完整，從日志中間件到深度智能體的部署，都有詳細(xì)教程。

企業(yè)級(jí)智能體的競(jìng)爭(zhēng)，本質(zhì)是“架構(gòu)能力”的競(jìng)爭(zhēng)。而LangChain的中間件與深度智能體，正是這套架構(gòu)的“核心骨架”。

責(zé)任編輯：武曉燕來源：大模型之路

多智能體系統(tǒng)中間件

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營