大家好,我是九歌AI。在Reddit的AIAgents版本刷到一個(gè)帖子,講的RAG系統(tǒng)在企業(yè)中的落地,覺得寫的不錯(cuò),翻譯共享給大家,英文原文直接讓DeepSeek翻譯后有些生硬,手動(dòng)潤(rùn)色了一下。配圖:GoogleNanoBanana【原貼】BuildingRAGsystemsatenterprisescale(20K+docs):lessonsfrom10+enterpriseimplementations【譯文】背景與分享過(guò)去一年,我們團(tuán)隊(duì)一直為中型企業(yè)(1001000人規(guī)模)搭建RAG系統(tǒng),尤其是在制藥、金融、法律等強(qiáng)監(jiān)管領(lǐng)...
2025-09-11 10:31:39 1715瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
當(dāng)今世界,大模型哪家強(qiáng)?我認(rèn)為現(xiàn)在是群雄逐鹿的時(shí)候,雖然在編程等一些垂直領(lǐng)域,Claude4穩(wěn)坐第一把交椅,但是最后的贏家,未必就是它。作為AI用戶,當(dāng)然要積極享受當(dāng)前的AI紅利,不要將自己局限在某個(gè)平臺(tái),盡量的多去了解每個(gè)大模型的脾氣和秉性,為后面創(chuàng)建智能體或者打造自己的AI數(shù)字員工,選擇合適的大腦引擎。我目前創(chuàng)意和文案的主力模型是Gemini2.5Pro和騰訊元寶的DeepSeekR1,編程主力是Trae國(guó)際版的Claude4。為了能夠...
2025-08-29 10:22:22 3833瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
今年的新詞特別多,AI編程這個(gè)叫法都o(jì)ut了,時(shí)髦的說(shuō)法是vibecoding(氛圍編程)。最近上手體驗(yàn)了googleaistudio新上線的buildapp功能,不能說(shuō)十分驚艷,那是相當(dāng)?shù)皿@艷,真正我能想象出的所想所見即所得的編程方式,特別是對(duì)我這種靠嘴吃飯,需要設(shè)計(jì)產(chǎn)品原型的非程序開發(fā)人員來(lái)說(shuō)。GoogleAIStudio(??https:aistudio.google.com??)是谷歌推出的云端AI開發(fā)平臺(tái),集成了最新的生成式AI模型(如Gemini系列),提供從原型設(shè)計(jì)...
2025-08-01 06:55:04 9003瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是九歌。最近字節(jié)跳動(dòng)開源了一款創(chuàng)新多模態(tài)文檔圖像解析模型——Dolphin,基于先解析結(jié)構(gòu)后解析內(nèi)容的兩階段方法,參數(shù)只有322M,16G顯存就能流暢運(yùn)行,而且效果比不輸GPT4.1!目前支持Pdf和圖片直接解析成Markdown和Json格式。官網(wǎng)直接給出了Demo在線地址,真的太良心了!直接上手體驗(yàn)!http:115.190.42.15:8888dolphin(1)15秒識(shí)別表格圖片(2)30秒識(shí)別公式是不是很酷的感覺,我看了一下github項(xiàng)目文檔,安裝也非...
2025-08-01 06:51:37 2987瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是九歌,一個(gè)智能體科普和實(shí)踐者。做智能體最難的事情,并不是如何怎么學(xué)會(huì)做智能體,工具的學(xué)習(xí)往往是簡(jiǎn)單的,如何找到智能體真正有用的應(yīng)用場(chǎng)景和業(yè)務(wù)需求才是核心能力。我們目前在各大智能體開發(fā)平臺(tái)上的智能體,說(shuō)實(shí)話,更多是玩具的屬性。在AI大模型領(lǐng)域,企業(yè)端正在探索的方向主要有:1.企業(yè)的知識(shí)管理與數(shù)據(jù)治理老生常談的方向2.垂域模型打造利用企業(yè)私有的數(shù)據(jù)、知識(shí)、通用大模型,訓(xùn)練極速的垂域模型3.智能...
2025-05-30 06:42:59 3205瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是九歌。最近刷到最多的AI相關(guān)文章,就是一路好評(píng)的DeepWiki了!手癢難耐的我,也早早就上手體驗(yàn)了一下。整體體驗(yàn)下來(lái),確實(shí)不錯(cuò),對(duì)于想了解一個(gè)Github項(xiàng)目的新人來(lái)說(shuō),確實(shí)非常有幫助。但是有一說(shuō)一,DeepWiki的缺點(diǎn)也是很明顯的,一是只能局限于Github項(xiàng)目,對(duì)于個(gè)人私有代碼倉(cāng)庫(kù)卻愛莫能助!二是時(shí)間具有滯后性,項(xiàng)目代碼不是最新的!如果公司有傳承已久的代碼庫(kù),新入職的同事看到那山一樣高的代碼,內(nèi)心肯定是...
2025-05-30 06:42:20 3879瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
大家好,我是九歌。今天我們聊一聊使用大模型進(jìn)行數(shù)據(jù)分析。AI數(shù)據(jù)分析作為大模型應(yīng)用的剛需,在各大平臺(tái)上的表現(xiàn)卻大相徑庭。阿里百煉的析言、ChatGPT、商湯的小浣熊、豆包,用了一圈,發(fā)現(xiàn)能打的只有豆包。但是豆包只提供大模型接口,AI數(shù)據(jù)分析卻沒有對(duì)應(yīng)的接口。首先定義一下“AI數(shù)據(jù)分析”,本文所說(shuō)的AI數(shù)據(jù)分析,專指大模型對(duì)數(shù)據(jù)表格的處理能力,默認(rèn)數(shù)據(jù)超過(guò)2000行!2000行的表格直接喂給大模型讓其分析,可想而知,這...
2025-05-30 06:41:32 3006瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在前幾天的文章??《論MCPServer與工作流在智能體開發(fā)場(chǎng)景中的作用和區(qū)別》??,我提到了一個(gè)觀點(diǎn),MCP和工作流的關(guān)系將是你中有我,我中有你。Dify工作流可以將MCPServer作為工作流中的某個(gè)關(guān)鍵節(jié)點(diǎn);同樣,Dify工作流可以發(fā)布為McpSever,由大模型選擇和使用。同樣,對(duì)于各大智能體開發(fā)平臺(tái)來(lái)說(shuō),不管是生態(tài)龐大的Coze還是開源界的扛把子Dify,在將來(lái)也是這種互聯(lián)互通的狀態(tài),只要他們各家的API足夠開放就行。比如,因?yàn)镃oze...
2025-04-25 06:46:24 6225瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
今天討論的是個(gè)很無(wú)聊的話題意義,但是卻困擾我很長(zhǎng)時(shí)間。最近突然頓悟了,有種開竅的感覺,下面我把最近關(guān)于智能體開發(fā)中工作流、Mcpserver的一些思考分享給大家,希望得到大家的指正。閱讀本文前,默認(rèn)大家已經(jīng)對(duì)智能體開發(fā)、Mcp工作流、Dify有了一定的認(rèn)識(shí),如果還沒了解過(guò),可以看我以前的文章。??智能體(Agent)的3種表現(xiàn)類型:聊天助手、工作流與對(duì)話流????不再混淆了!一文揭秘MCPServer、FunctionCall與Agent的...
2025-04-25 06:45:25 2943瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
我集中精力,花2個(gè)多小時(shí)把DifySandbox官方源碼研究了一下,終于理清了Sandbox執(zhí)行代碼的邏輯,順便實(shí)現(xiàn)了在不修改官方difysandboxdocker鏡像,用戶上傳文件后路徑的獲取和對(duì)Excel文件的數(shù)據(jù)處理。話不多說(shuō),先看效果。一個(gè)有9406條數(shù)據(jù)的Excel文件瞬間完成了數(shù)據(jù)處理工作。下面我來(lái)說(shuō)一下,這個(gè)如何實(shí)現(xiàn)。Dify安裝成功后,會(huì)有10個(gè)Docker容器,其中dockersandbox的作用是用來(lái)執(zhí)行工作流中”代碼“這個(gè)節(jié)點(diǎn)運(yùn)行的代碼。這樣就保...
2025-04-16 07:12:40 6015瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
智能體主要由大語(yǔ)言模型(LLM)+提示詞(Prompt)+知識(shí)庫(kù)(RAG)+工作流(WorkFlow)+工具(Tools)等若干元素組成。今天我們開啟《人人都會(huì)做智能體》公開課第2節(jié):智能體(Agent)的3種表現(xiàn)類型——聊天助手類型、工作流類型、對(duì)話流類型。「本文配圖主要來(lái)源于我的長(zhǎng)篇圖文寫作助手」??讓DeepSeek聊天記錄秒變長(zhǎng)篇圖文和PPT的智能體,Claude3.7手把手喂飯教程!??與智能體的組成不同,所謂的智能體表現(xiàn)模式,就是智能體...
2025-04-02 07:50:35 3929瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
文章生成的工作流由簡(jiǎn)單的大模型直接生成文章改為按章節(jié)段落迭代生成,并在段落生成時(shí)由Claude3.7大模型根據(jù)段落內(nèi)容,直接總結(jié)凝練后,繪制成一張張網(wǎng)頁(yè)版的PPT配圖,最后再拼成一個(gè)完整的網(wǎng)頁(yè)。這個(gè)工作流還是蠻大的,消耗的token數(shù)量也是肉疼,好在結(jié)果讓人欣慰,我們先來(lái)看一下智能體的實(shí)現(xiàn)效果。怎么樣?效果還是蠻不錯(cuò)吧,這個(gè)智能體能很大程度上解決我們做PPT的一些難點(diǎn),因?yàn)槭忻嫔弦恍┳鯝IPPT的工具,都是直接套的模板...
2025-04-02 07:49:17 3112瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
我們都知道智能體開發(fā)的平臺(tái)非常多,Dify是開源的智能體開發(fā)平臺(tái)中用戶比較多的一款。但是跟Coze平臺(tái)相比,很多想使用Dify的用戶,第一個(gè)難關(guān)就是Dify的本地部署。很多小白可能對(duì)Linux、Docker一竅不通,所以我之前寫過(guò)一篇怎么借助WSL完成windows下Dify的部署,其實(shí)沒有解決痛點(diǎn),Dify的主要用戶還是只局限于程序員這個(gè)群體。?為了能夠更好的完成智能體的科普,讓更多人無(wú)門檻使用Dify這種開源的智能體開發(fā)平臺(tái),經(jīng)過(guò)這兩天的...
2025-04-01 13:14:10 3191瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
前幾天《人人都會(huì)做智能體》社區(qū)的成員提問(wèn),OA請(qǐng)假可以用智能體實(shí)現(xiàn)嗎?我第一反應(yīng)是這種問(wèn)題有點(diǎn)太簡(jiǎn)單了,但是轉(zhuǎn)念一想,越是這種簡(jiǎn)單的任務(wù),反而更有科普價(jià)值,因?yàn)楹芏嗳诉€沒深入了解過(guò)智能體(Agent)到底是什么,我不能先入為主的將其定義為沒有必要的簡(jiǎn)單。想了解智能體是什么,可以先看我之前的這篇文章?!救巳硕紩?huì)做智能體】Agent是什么,簡(jiǎn)單中等復(fù)雜商用的智能體又是什么所以今天我們一起來(lái)實(shí)現(xiàn)一個(gè)基于對(duì)話流的請(qǐng)...
2025-03-21 10:03:46 4904瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
今天我將開啟《人人都會(huì)做智能體》公開課的第1節(jié)課?!度巳硕紩?huì)做智能體》公開課以智能體的小白科普和初級(jí)制作為目標(biāo),將從智能體基礎(chǔ)認(rèn)知(LLM+RAG+WorkFlow+Agent)、智能體拆解復(fù)原、開發(fā)環(huán)境部署、智能體項(xiàng)目實(shí)戰(zhàn)等幾個(gè)部分,按照學(xué)習(xí)習(xí)慣,迭代式遞進(jìn)式的,采用圖文結(jié)合的方式,循序漸進(jìn)帶領(lǐng)大家一步步掌握智能體制作的方法、技巧和經(jīng)驗(yàn)。智能體項(xiàng)目實(shí)戰(zhàn)部分,現(xiàn)在初步定了兩個(gè),我之前的文章已經(jīng)開始寫了。一個(gè)是長(zhǎng)篇圖文...
2025-03-21 09:58:24 3002瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
想象一下,如果普通AI是一個(gè)只會(huì)機(jī)械執(zhí)行指令的機(jī)器人,那么采用ReAct策略的智能體就像是一個(gè)會(huì)先思考后行動(dòng)的偵探。在解決問(wèn)題時(shí),它不會(huì)匆忙跳入結(jié)論的深淵,而是沿著"觀察思考行動(dòng)觀察"的螺旋階梯,一步步接近真相。這就是ReAct(Reasoning+Acting)策略的魅力所在。ReAct策略:智能體的"內(nèi)心獨(dú)白"與"外在行動(dòng)"ReAct就像給AI裝上了"內(nèi)心獨(dú)白"和"行動(dòng)執(zhí)行器"兩個(gè)齒輪,讓它們交替轉(zhuǎn)動(dòng):觀察環(huán)境:智能體睜大眼睛,感知周圍世...
2025-03-14 13:10:12 3411瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、技術(shù)背景與設(shè)計(jì)目標(biāo)當(dāng)前內(nèi)容生成系統(tǒng)普遍面臨三個(gè)技術(shù)挑戰(zhàn):多源異構(gòu)數(shù)據(jù)處理效率低下、長(zhǎng)文本生成的結(jié)構(gòu)連貫性不足、多模態(tài)內(nèi)容協(xié)同生成能力薄弱。本研究提出一種基于LangGraph框架的解決方案,旨在構(gòu)建模塊化、可擴(kuò)展的智能文章生成系統(tǒng),其核心設(shè)計(jì)目標(biāo)包括:實(shí)現(xiàn)端到端的自動(dòng)化內(nèi)容生產(chǎn)流水線支持動(dòng)態(tài)工作流調(diào)整與錯(cuò)誤恢復(fù)機(jī)制確保多模態(tài)內(nèi)容的一致性驗(yàn)證提供可插拔的第三方服務(wù)集成接口二、系統(tǒng)架構(gòu)設(shè)計(jì)2.1整體架構(gòu)概...
2025-03-14 13:04:01 3937瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、大模型知識(shí)庫(kù)戰(zhàn)略架構(gòu)(耗時(shí):初始8小時(shí)月度迭代)1.知識(shí)價(jià)值密度評(píng)估四維篩選模型(Ec業(yè)務(wù)關(guān)鍵度,F(xiàn)a調(diào)用頻率,F(xiàn)h歷史價(jià)值,Ct維護(hù)成本)知識(shí)類型處理策略工具鏈配置高頻核心知識(shí)向量化+微調(diào)GPT4Turbo+PGVector中頻場(chǎng)景知識(shí)RAG增強(qiáng)檢索LlamaIndex+Pinecone低頻長(zhǎng)尾知識(shí)壓縮存儲(chǔ)ZSTD+MinIO知識(shí)熱力分析fromlangchain.analyticsimportKnowledgeHeatmapheatmapKnowledgeHeatmap(querylogsloadlogs("searchlogs.json"),docmeta...
2025-03-14 13:00:54 4853瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
你有沒有想過(guò),為什么當(dāng)紅炸子雞DeepSeek這樣的大語(yǔ)言模型能夠又快又好地回答各種問(wèn)題,而且成本又那么低?秘密之一就在于它使用的"混合專家"(MixtureofExperts,簡(jiǎn)稱MoE)架構(gòu)。本文將用通俗易懂的語(yǔ)言,解釋MoE是什么,它如何工作,以及為什么它如此重要。MoE是什么?想象一下一所大學(xué):傳統(tǒng)模型就像一位超級(jí)教授,必須精通所有學(xué)科,從文學(xué)到物理,從歷史到計(jì)算機(jī)科學(xué)。每個(gè)問(wèn)題都由這位教授獨(dú)自解答。MoE模型則像一所設(shè)有...
2025-03-13 12:48:33 4835瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
引言:LangChain的背景與意義在人工智能快速發(fā)展的時(shí)代,大型語(yǔ)言模型(LLM)如OpenAI的GPT系列,已成為生成自然語(yǔ)言文本的核心技術(shù)。然而,將這些模型應(yīng)用于實(shí)際應(yīng)用(如聊天機(jī)器人或虛擬助手)時(shí),開發(fā)者常常面臨提示管理、外部數(shù)據(jù)集成和上下文保持的挑戰(zhàn)。LangChain作為一個(gè)開源框架,旨在簡(jiǎn)化這些復(fù)雜性,提供模塊化工具,幫助開發(fā)者高效構(gòu)建LLM驅(qū)動(dòng)的應(yīng)用。LangChain于2022年10月由HarrisonChase在RobustIntelligence啟動(dòng)...
2025-03-13 12:43:13 4962瀏覽 0點(diǎn)贊 0回復(fù) 0收藏