從零到一打造商用 AI Agent(智能體)

Hi,大家好,我叫秋水,當(dāng)前專(zhuān)注于 AI 智能體和 AI 工作流自動(dòng)化
經(jīng)常有朋友問(wèn)我,如何打造一個(gè)商用 AI Agent(智能體)?
- 是選擇 Coze?Dify?還是 LangGraph ?
- 過(guò)程中有哪些注意事項(xiàng)?
- 我的數(shù)據(jù)應(yīng)該存儲(chǔ)在哪里?
- 為什么某些網(wǎng)頁(yè)用這個(gè)工具無(wú)法抓取到內(nèi)容?
- ······
因此,在 2025 年初,我結(jié)合這兩年的 AI Agent 的開(kāi)發(fā)經(jīng)驗(yàn),啟動(dòng)了一個(gè)合集《從零到一打造 AI Agent》。
內(nèi)容包含了 AI Agent 的理論、實(shí)操和案例,我將一步步展示如何打造一個(gè)商用 AI Agent 的完整過(guò)程。
如果你是非技術(shù)人員,這對(duì)你來(lái)說(shuō)非常有幫助;如果你是技術(shù)人員,這個(gè)視頻將幫助你少走一些彎路,快速上手!
這篇內(nèi)容將從整體上介紹打造 AI Agent 的七個(gè)步驟,分別是需求梳理、軟件選型、提示工程、數(shù)據(jù)庫(kù)、構(gòu)建 UI 界面、測(cè)試評(píng)估和部署發(fā)布。

梳理需求
梳理工作流
第一步,我們需要做的工作就是梳理需求。
首先,我們需要明確,做這個(gè) AI Agent 是為了幫我們解決什么問(wèn)題?
- 如果你是一位自媒體從業(yè)者,可能會(huì)希望做一個(gè) AI Agent 來(lái)幫你處理一些重復(fù)性的工作,如找對(duì)標(biāo)、找熱點(diǎn)、做分析、寫(xiě)初稿等,這樣你可以把精力集中在內(nèi)容創(chuàng)作上;
- 如果你是一位貿(mào)易公司的老板,可能會(huì)希望做一個(gè) AI Agent 來(lái)幫你匯集來(lái)自不同平臺(tái)的訂單,并在各個(gè)平臺(tái)之間進(jìn)行產(chǎn)品詢價(jià)和價(jià)格比較。
記住,你需要重點(diǎn)梳理的是那些重復(fù)性的、機(jī)械化的、不需要太多思考的工作,越詳細(xì)越好。
當(dāng)然,你也可以借助 AI 工具,與它交流,形成初稿后,再進(jìn)行補(bǔ)充。
你是一位工作流梳理專(zhuān)家,請(qǐng)幫我梳理<自媒體編輯>這個(gè)角色在日常工作中需要重復(fù)干的工作,并標(biāo)記處哪些可以由 AI 來(lái)協(xié)助,哪些主要我來(lái)去做,先以表格的形式(工作內(nèi)容/AI協(xié)助/人工來(lái)做)輸出,我當(dāng)認(rèn)為表格的內(nèi)容完整后,我回復(fù)“繼續(xù)”,你再以mermaid流程圖的形式輸出,每個(gè)流程節(jié)點(diǎn)需要注明是否可由AI協(xié)助完成,流程圖為橫向。
用到哪些工具
梳理完需求后,我們需要根據(jù)梳理的工作流,羅列出需要用到的工具。
例如,采集數(shù)據(jù)需要網(wǎng)頁(yè)抓取工具;發(fā)布文章,需要對(duì)接微信公眾平臺(tái)。
因此,工具的選型也非常重要。借助不同的工具,可以讓 AI Agent 在不同的系統(tǒng)之間自動(dòng)化地執(zhí)行任務(wù),從而減少人工操作。
AI Agent 選型
第二步,我們需要根據(jù)場(chǎng)景選擇 AI Agent 開(kāi)發(fā)平臺(tái),選擇合適的大模型,并選用不同的工具來(lái)執(zhí)行不同系統(tǒng)的操作。
選擇哪個(gè) AI Agent 平臺(tái)
先說(shuō)說(shuō) AI Agent 開(kāi)發(fā)平臺(tái),Dify、Coze、FastGPT 等這么多無(wú)代碼 Agent 開(kāi)發(fā)平臺(tái),我們?cè)撨x擇哪個(gè)比較合適呢?
- Coze 只能使用云端,不能在本地部署。
- Dify 是完全開(kāi)源的,沒(méi)有限制,但在知識(shí)問(wèn)答方面的能力較弱。
- FastGPT 的使用有一定限制,但在知識(shí)回答方面的能力相對(duì)較強(qiáng)。
更高級(jí)的開(kāi)發(fā)平臺(tái),如 LangGraph、CrewAI 等,可以讓 AI 自我規(guī)劃并執(zhí)行任務(wù),但是需要編寫(xiě)代碼。
是否選擇這些平臺(tái),取決于我們的具體需求,當(dāng)然也可以混合使用。
這就要求我們深入了解每個(gè)開(kāi)發(fā)平臺(tái)的特點(diǎn),它擅長(zhǎng)什么、不擅長(zhǎng)什么,存在哪些明顯的缺陷。只有掌握了這些信息,才能根據(jù)我們的場(chǎng)景做出合適的選型。
選擇哪個(gè) LLM
再說(shuō)說(shuō)大模型的選擇,現(xiàn)在有海外的 OpenAI、Claude、Gemini,也有國(guó)內(nèi)的 Kimi、通義千問(wèn)和近期爆火的 DeepSeek,還有一些開(kāi)源模型如 LLaMA、Grok,也有像 Mistral 這樣的小模型。

那么,基于你的 AI Agent 場(chǎng)景,在這么多模型中,最合適的應(yīng)該選擇哪個(gè)?
如果你沒(méi)有隱私數(shù)據(jù),最好的選擇是 OpenAI 和 Claude,因?yàn)樗鼈兪穷^部大模型。如果你僅僅是做翻譯、總結(jié)文章等任務(wù),選擇國(guó)內(nèi)的大模型效果也差不多,當(dāng)前 DeepSeek 的性價(jià)比很高。
選擇哪個(gè)模型,需要根據(jù)你的具體使用場(chǎng)景,當(dāng)然也可以考慮混合使用。這個(gè)時(shí)候,建議你深入了解不同模型的能力。
- 小模型和大模型有什么區(qū)別?
- 哪個(gè)模型的推理能力最強(qiáng)?
- 8K、32K 等同一個(gè)模型的不同大小有什么區(qū)別?
- 如果本地部署,什么樣的配置能運(yùn)行什么樣的模型?這些模型的能力如何?
- 如果使用云端大模型,模型的計(jì)費(fèi)單價(jià)是多少?
- 是否可以混合使用不同的模型?
- 企業(yè)隱私數(shù)據(jù)能否使用云端大模型?
這些問(wèn)題,我會(huì)在后續(xù)的內(nèi)容中會(huì)逐一講解。
選擇哪些工具
最后,就是工具選擇。工具是一種能力,它可以是生成一張圖片,也可以是到互聯(lián)網(wǎng)上去搜索,甚至可以是與一個(gè)系統(tǒng)進(jìn)行對(duì)接。
AI Agent 開(kāi)發(fā)平臺(tái)的能力僅僅是利用大模型的能力,因此,如果需要與外部系統(tǒng)進(jìn)行交互,就需要用到工具。工具大致可以分為有 API 接口的和無(wú) API 接口的兩類(lèi)。
有 API 接口的工具,對(duì)接起來(lái)就非常簡(jiǎn)單。在 Coze、Dify 等平臺(tái)上,已經(jīng)集成了許多工具,可以直接配置和使用。
而對(duì)于無(wú) API 接口的工具,就需要通過(guò) RPA(機(jī)器人流程自動(dòng)化)來(lái)處理。簡(jiǎn)單來(lái)說(shuō),RPA 是一種可以通過(guò)控制瀏覽器來(lái)執(zhí)行一系列操作的自動(dòng)化工具。
提示工程
第三步,提示工程是 AI Agent 的核心,好的提示詞能夠大大提升大模型輸出的準(zhǔn)確性。
- 一個(gè)好的提示詞能幫助 AI Agent 準(zhǔn)確地理解任務(wù),提高大模型的輸出質(zhì)量。
- 一個(gè)好的提示詞可以減少 token 的消耗,降低成本。
- 一個(gè)好的提示詞可以幫助 AI Agent 理解上下文,確保對(duì)話的連貫性。
因此,我們需要掌握如何編寫(xiě)有效的提示詞。
- 什么是 CRISPE 框架?
- 什么是 BROKE 框架?
- 什么是 ICIO 框架?
- 什么是 CoT(思維鏈)?
我們還需要了解與大模型交互的規(guī)則,例如:
- 一篇長(zhǎng)文分多次輸出比一次性輸出的質(zhì)量更高。
- 使用不同的符號(hào)將不同信息分隔開(kāi),可以增強(qiáng)大模型的理解。
- 給出示例能幫助大模型快速理解你的要求。
- 對(duì)于復(fù)雜任務(wù),將其拆解為若干步驟,引導(dǎo)大模型分步執(zhí)行,效果更佳。
- 明確輸出內(nèi)容的限定,如字?jǐn)?shù)、格式、風(fēng)格、語(yǔ)言難度等。
ICIO 框架:
- Intruction(任務(wù)):明確指出希望 AI 執(zhí)行的具體任務(wù),如“翻譯一段文本”或“撰寫(xiě)一篇關(guān)于 AI 倫理的博客文章”。
- Context(背景):提供任務(wù)的背景信息,幫助 AI 理解任務(wù)的上下文,例如,“這段文本是用于公司內(nèi)部會(huì)議的開(kāi)場(chǎng)白”。
- Input Data(輸入數(shù)據(jù)):指定 AI 需要處理的具體數(shù)據(jù),如“請(qǐng)翻譯以下句子:‘人工智能正在改變世界’”。
- Output Indicator(輸出格式):設(shè)定期望的輸出格式和風(fēng)格,例如,“請(qǐng)以正式的商務(wù)英語(yǔ)風(fēng)格翻譯”。
BROKE 框架:
- Background(背景):例如,“你正在為一家初創(chuàng)科技公司撰寫(xiě)一篇關(guān)于其最新產(chǎn)品的新聞稿?!?/span>
- Role(角色):指定 AI 作為“新聞稿撰寫(xiě)者”,以便它能夠以專(zhuān)業(yè)的角度回答問(wèn)題。
- Objectives(目標(biāo)/任務(wù)):給出任務(wù)描述,如“撰寫(xiě)一篇吸引人的新聞稿,突出產(chǎn)品的獨(dú)特賣(mài)點(diǎn)?!?/span>
- Key Result(關(guān)鍵結(jié)果):設(shè)定回答的關(guān)鍵結(jié)果,例如,“使用正式和專(zhuān)業(yè)的語(yǔ)言,包含產(chǎn)品的主要功能和市場(chǎng)定位?!?/span>
- Evolve(改進(jìn)):在 AI 給出回答后,提供三種改進(jìn)方法,如“調(diào)整語(yǔ)言風(fēng)格以吸引目標(biāo)受眾”,“增加產(chǎn)品使用案例”,或“優(yōu)化結(jié)構(gòu)以提高閱讀流暢性”。
CRISPE 框架:
- Capacity and Role(角色):明確 AI 在交互中應(yīng)扮演的角色,如教育者、翻譯者或顧問(wèn)。
- Insight(背景):提供角色扮演的背景信息,幫助 AI 理解其在特定情境下的作用。
- Statement(任務(wù)):直接說(shuō)明 AI 需要執(zhí)行的任務(wù),確保其理解并執(zhí)行用戶的請(qǐng)求。
- Personality(格式):設(shè)定 AI 回復(fù)的風(fēng)格和格式,使其更符合用戶的期望和場(chǎng)景需求。
- Experiment(實(shí)驗(yàn)):如果需要,可以要求 AI 提供多個(gè)示例,以供用戶選擇最佳回復(fù)。
CoT 框架:
Chain-of-Thought,一種引導(dǎo)大模型像人類(lèi)一樣,按照順序一步步思考問(wèn)題解決方案的方法。
主要包括 Few-Shot CoT 和 Zero-Shot CoT 兩種應(yīng)用方式。
Few-Shot CoT(少量示例)
描述思考步驟,先理解客戶需求,再考慮<目標(biāo)>,最后給出推薦并解釋原因。
同時(shí)提供示例,這些示例展示 AI 如何依思維鏈思考給出答案。
Zero-Shot CoT(沒(méi)有示例)
簡(jiǎn)單地增加一句提示詞即可:
讓我們一步步的思考(Let’s think step by step)
數(shù)據(jù)庫(kù)選型
第四步,AI Agent 運(yùn)行過(guò)程中產(chǎn)生的聊天記錄、采集數(shù)據(jù)等內(nèi)容存放到哪里?這個(gè)時(shí)候就需要數(shù)據(jù)庫(kù)了。
對(duì)于非技術(shù)人員,我建議使用飛書(shū)的多維表格,因其可視化程度高、易于操作、對(duì)接簡(jiǎn)單。
不足之處是,當(dāng)數(shù)據(jù)量變大時(shí),讀取速度會(huì)變慢,且無(wú)法處理復(fù)雜的業(yè)務(wù)邏輯。
而對(duì)于技術(shù)人員,可以使用 MySQL、NoSQL 等常用的數(shù)據(jù)庫(kù)。
構(gòu)建 UI 界面
第五步,構(gòu)建屬于你自己的 UI 界面。在 Coze 上,你可以 DIY 自己的界面,而在 Dify 上則有現(xiàn)成的界面,只是不能修改。
這兩個(gè)平臺(tái)也都可以發(fā)布成服務(wù) API,也就是說(shuō),你可以不使用它們提供的界面,而是獨(dú)立開(kāi)發(fā)一個(gè)界面,與其對(duì)接。
如果你要開(kāi)發(fā)自己的界面,可以借助 Cursor 這樣的 AI 編程平臺(tái),來(lái)定制開(kāi)發(fā)一個(gè)。
還有一個(gè)原因需要你自己開(kāi)發(fā)一個(gè)界面,那就是在 Coze 和 Dify 上,你可以定義多個(gè) AI Agent,你可以用自己定義的界面來(lái)調(diào)用,這樣可以讓你在使用時(shí),始終在一個(gè)界面上操作。
測(cè)試評(píng)估
第六步,測(cè)試評(píng)估。測(cè)試是確保你的 AI Agent 不會(huì)出現(xiàn)錯(cuò)誤,例如程序報(bào)錯(cuò)、大模型無(wú)法處理用戶請(qǐng)求等問(wèn)題。
評(píng)估則是確保 AI Agent 輸出的回復(fù)是正確的。在評(píng)估的過(guò)程中,我們需要不斷優(yōu)化 AI Agent,確保它能夠輸出正確的回答,并減少 token 的消耗。
我們可以使用 LangSmith 來(lái)監(jiān)控項(xiàng)目的運(yùn)行。
LangSmith 幫助你更好地使用大模型:
- 調(diào)試和測(cè)試:它可以幫助你找出程序中的問(wèn)題,并提供解決方案,確保 AI Agent 能夠正確地回答問(wèn)題或完成任務(wù)。
- 評(píng)估:通過(guò)創(chuàng)建各種測(cè)試案例,來(lái)測(cè)試 AI Agent 的表現(xiàn),比如它回答問(wèn)題的準(zhǔn)確性和可靠性。
- 監(jiān)控:它可以實(shí)時(shí)觀察 AI Agent 的工作狀態(tài),比如處理請(qǐng)求的速度、花費(fèi)的成本等。
- 日志記錄:它可以記錄 AI Agent 在工作過(guò)程中所有的詳細(xì)信息,包括接收到的問(wèn)題、給出的回答以及使用的參數(shù)等,方便你進(jìn)行分析和改進(jìn)。

部署發(fā)布
第七步,部署發(fā)布。不同的 AI Agent 開(kāi)發(fā)平臺(tái)有不同的部署方式。Coze 可以直接發(fā)布到豆包、小程序等平臺(tái)上,而 Dify 則可以直接發(fā)布為 Web 應(yīng)用,或者嵌入到你的系統(tǒng)當(dāng)中。
如果你是獨(dú)立開(kāi)發(fā)的 AI Agent,那么你可以購(gòu)買(mǎi)服務(wù)器進(jìn)行獨(dú)立部署。
結(jié)尾
這就是我將在合集《從零到一打造 AI Agent》里介紹的一系列內(nèi)容,非常開(kāi)心與你一起深入研究這些內(nèi)容,幫助你打造屬于你自己的完美 AI Agent。


































