“智能體使用工具的本質(zhì)——你告訴模型有哪些工具,需要哪些參數(shù);而模型告訴你調(diào)用哪個(gè)工具,參數(shù)是什么。”現(xiàn)在大模型智能體大行其道(agent),而且也是目前大模型的主流應(yīng)用方向之一,甚至有人說(shuō)智能體是實(shí)現(xiàn)AGI(通用人工智能)的技術(shù)手段。但是,我們需要知道的是大模型和智能體的主要區(qū)別在于其是否會(huì)使用工具;就像哲學(xué)上人和動(dòng)物的根本區(qū)別在于是否會(huì)制造和使用工具。那么,到底什么是智能體?其實(shí)說(shuō)到智能體網(wǎng)絡(luò)上有一堆...
2天前 406瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“做技術(shù)很多時(shí)候想不明白,這時(shí)多做做可能就明白了。”現(xiàn)在基于大模型的人工智能技術(shù)發(fā)展的如火如荼,而且隨著今年人工智能進(jìn)入應(yīng)用元年,人工智能開(kāi)始進(jìn)入各行各業(yè);但由于技術(shù)本身的限制,因此很多應(yīng)用場(chǎng)景大都處于模式階段。所以,到底應(yīng)該怎么學(xué)習(xí)和使用大模型,特別是隨著一些新技術(shù)的出現(xiàn),大家都在摸著石頭過(guò)河。但不管怎么說(shuō),作為一門新技術(shù)其和其它技術(shù)沒(méi)有本質(zhì)上的區(qū)別,都是更加注重實(shí)操,理論作為輔助。大模型技...
3天前 427瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“別再混淆了!RAG、Agent是“發(fā)動(dòng)機(jī)”,智能問(wèn)答、生成工具才是“車”——一文講透大模型的技術(shù)與應(yīng)用場(chǎng)景”做了這么長(zhǎng)時(shí)間的人工智能應(yīng)用,慢慢發(fā)現(xiàn)很多人到現(xiàn)在還分不清哪些是技術(shù),哪些是應(yīng)用場(chǎng)景,甚至很多時(shí)候會(huì)把這兩個(gè)不同的東西混為一談。首先我們要明確一件事,人工智能是一項(xiàng)技術(shù),然后利用這些技術(shù)去解決實(shí)際問(wèn)題,而解決的這些問(wèn)題是應(yīng)用場(chǎng)景;技術(shù)本身是沒(méi)有價(jià)值的,技術(shù)價(jià)值的體現(xiàn)就是在其應(yīng)用場(chǎng)景。技術(shù)與應(yīng)用...
6天前 683瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“一個(gè)好的智能問(wèn)答系統(tǒng)是由細(xì)節(jié)決定的,而不是由流程決定的。”今天在公司項(xiàng)目組review了一下作者最近一直在做的一個(gè)基于RAG技術(shù)的智能問(wèn)答系統(tǒng);在review的過(guò)程中也發(fā)現(xiàn)了一些問(wèn)題,就是雖然召回質(zhì)量還過(guò)得去,但還是存在一些小問(wèn)題。比如說(shuō),偶爾會(huì)出現(xiàn)記憶不存在的問(wèn)題,表面上來(lái)看就是連續(xù)兩個(gè)有關(guān)聯(lián)的問(wèn)題,但回答的時(shí)候卻沒(méi)有任何關(guān)聯(lián)性;簡(jiǎn)單來(lái)說(shuō)就是,記憶功能沒(méi)用好。還有就是所有的技術(shù)手段都用上了,包括召回,去重...
6天前 512瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“模型上下文管理是模型使用的基礎(chǔ),其直接影響到模型的輸出結(jié)果。”在目前的主流大模型應(yīng)用場(chǎng)景中,多輪對(duì)話基本上成為大模型的基本應(yīng)用形式,但這里有一個(gè)很多人都忽略的問(wèn)題,那就是上下文窗口管理;注意這里所說(shuō)的是上下文窗口管理,而不是上下文管理。為什么要強(qiáng)調(diào)上下文窗口管理,原因是因?yàn)槟P蜕舷挛拇翱跁?huì)直接影響到大模型的輸入以及系統(tǒng)的穩(wěn)定性。模型上下文窗口管理首先我們要明確一個(gè)前提,對(duì)模型本身來(lái)說(shuō)不存在多...
9天前 914瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“大模型技術(shù)的本質(zhì)是通過(guò)技術(shù)手段制造一個(gè)能力很強(qiáng)的“人”;讓它用人類的方式去解決問(wèn)題,比如說(shuō)使用工具。”現(xiàn)在人工智能技術(shù)發(fā)展的如火如荼,但還有些人根本不知道到底什么是人工智能,現(xiàn)在爆火的大模型又是什么。事實(shí)上人工智能技術(shù)雖然很復(fù)雜,但從本質(zhì)上來(lái)說(shuō)其實(shí)很簡(jiǎn)單——人工智能就是一個(gè)“人”。在哲學(xué)上講人和動(dòng)物的根本區(qū)別是會(huì)制造和使用工具,人工智能也是如此;現(xiàn)在以人工智能技術(shù)為核心的所有技術(shù)棧,本質(zhì)上就...
9天前 583瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“在初始化場(chǎng)景下,讓AI離開(kāi)人類的干擾,讓AI自主的生活將會(huì)是一個(gè)什么樣的場(chǎng)景。”最近斯坦福的實(shí)驗(yàn)室開(kāi)源了一個(gè)名為“GenerativeAgents”的項(xiàng)目,別名又為“斯坦福小鎮(zhèn)”,主要核心在于"AI與AI的智能交互",這個(gè)項(xiàng)目包含25個(gè)由AI驅(qū)動(dòng)的智能體(代理)。這些智能體只有預(yù)設(shè)的身份和初始記憶,其所有的行為都是由AI驅(qū)動(dòng)產(chǎn)生。這是一個(gè)非常有趣的idea。即便是目前AI大火的趨勢(shì)下,大部分人做的Ai產(chǎn)品都只圍繞著人與AI之間的交互...
2025-10-22 08:58:39 965瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“搜索技術(shù)既是一項(xiàng)獨(dú)立的技術(shù),也是RAG技術(shù)的基礎(chǔ)。”最近了解到一個(gè)新技術(shù),當(dāng)然這個(gè)新技術(shù)是對(duì)作者來(lái)說(shuō),其技術(shù)已經(jīng)存在一段時(shí)間了;它就是深度搜索技術(shù)——DeepSearch。作者最近一段時(shí)間主要從事的方向是RAG和Agent領(lǐng)域,然后這幾天突然了解到深度搜索這項(xiàng)技術(shù),然后就很好奇它和rag有什么區(qū)別和聯(lián)系。DeepSearch和RAG學(xué)習(xí)一項(xiàng)新技術(shù),我們首先要搞明白這個(gè)技術(shù)是干啥的,它有什么用,因此先不糾結(jié)其概念。顧名思義,從名稱...
2025-10-22 08:55:59 1411瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在人工智能浪潮的推動(dòng)下,智能問(wèn)答系統(tǒng)正日益成為企業(yè)服務(wù)、在線教育、智能客服等領(lǐng)域的核心交互工具。其中,基于檢索增強(qiáng)生成(RetrievalAugmentedGeneration,簡(jiǎn)稱RAG)的技術(shù)架構(gòu),因其能夠有效結(jié)合外部知識(shí)、緩解大模型“幻覺(jué)”問(wèn)題、并保持信息的實(shí)時(shí)性,而受到了廣泛青睞。在探討RAG的優(yōu)化之道時(shí),我們往往會(huì)接觸到諸如問(wèn)題改寫、重排序、混合檢索等多種精妙的技巧。這些技術(shù)方案在很大程度上是“可復(fù)用”的通用組件。然...
2025-10-20 08:19:19 553瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“大模型從任務(wù)類型分類主要分為文本,音頻,視頻和多模態(tài)模型。”在人工智能領(lǐng)域,大模型技術(shù)是目前主要的研究方向,但面對(duì)市面上各種各樣的模型,很多時(shí)候我們都搞不明白這些模型都是干什么的,有什么區(qū)別和聯(lián)系。其實(shí)這個(gè)就涉及到模型的分類問(wèn)題,原因在于人工智能技術(shù)涉獵范圍比較廣,不但有各種基于深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的大模型各行其道,還包括傳統(tǒng)的機(jī)器學(xué)習(xí)模型,以及各種模型的變種。并且,從不同的維度模型又有不同的分...
2025-10-20 08:17:40 539瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“人工智能技術(shù)的出現(xiàn),意味著互聯(lián)網(wǎng)行業(yè)進(jìn)入一個(gè)新的快速發(fā)展期,其終將會(huì)再次顛覆現(xiàn)有的商業(yè)模式。”最近發(fā)現(xiàn)一個(gè)問(wèn)題,除了業(yè)內(nèi)人士之外,很多人都認(rèn)為人工智能技術(shù)的發(fā)展和他們無(wú)關(guān),甚至很多人到現(xiàn)在都不知道人工智能到底是什么,有什么用。但是,人工智能技術(shù)作為互聯(lián)網(wǎng)技術(shù)的一個(gè)分支,并且目前處于互聯(lián)網(wǎng)時(shí)代的浪潮之下,不了解人工智能或者說(shuō)不了解互聯(lián)網(wǎng),往往代表著被時(shí)代所拋棄。因此,在當(dāng)前國(guó)家大力推行數(shù)字化轉(zhuǎn)...
2025-10-17 07:33:52 603瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“智能問(wèn)答是基于RAG技術(shù)實(shí)現(xiàn)的724小時(shí)在線問(wèn)答系統(tǒng),可以幫助你解決日常業(yè)務(wù)咨詢等問(wèn)題。”還在為:文檔太多、員工找資料全靠翻;客服重復(fù)回答一堆相似問(wèn)題;產(chǎn)品知識(shí)沒(méi)人整理、客戶問(wèn)不清;或者想做一個(gè)企業(yè)內(nèi)部知識(shí)問(wèn)答系統(tǒng),卻不知道從哪下手而發(fā)愁嗎?我最近在做一個(gè)基于RAG(檢索增強(qiáng)生成)技術(shù)的智能問(wèn)答系統(tǒng),可以讓AI像你的專屬知識(shí)助手一樣,自動(dòng)從你的文檔、數(shù)據(jù)庫(kù)、網(wǎng)頁(yè)中找到信息,并用自然語(yǔ)言準(zhǔn)確回答問(wèn)題。簡(jiǎn)單...
2025-10-17 07:29:05 1571瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“知識(shí)庫(kù)的質(zhì)量才是RAG系統(tǒng)的核心,任何優(yōu)化手段都是建立在高質(zhì)量知識(shí)庫(kù)的基礎(chǔ)之上。”在目前大模型應(yīng)用場(chǎng)景中智能問(wèn)答應(yīng)該是一個(gè)主流的應(yīng)用方法,在很多領(lǐng)域智能問(wèn)答已經(jīng)部分取代人工,不但大大降低了企業(yè)的人工成本,而且能夠做到724小時(shí)在線,能夠及時(shí)解決用戶問(wèn)題。而具體的應(yīng)用場(chǎng)景有智能客服,業(yè)務(wù)咨詢,醫(yī)療教育,金融投資等等多種行業(yè);但目前為止很多人可能還認(rèn)為AI只適用于那些大型互聯(lián)網(wǎng)公司,和中小企業(yè)以及傳統(tǒng)企...
2025-10-17 07:22:18 947瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“基于大模型的RAG多輪對(duì)話功能,其檢索增強(qiáng)的流程和實(shí)際業(yè)務(wù)的場(chǎng)景可能會(huì)存在一定的沖突,而這個(gè)平衡點(diǎn)卻很難把握。”在之前的文章中有講過(guò)一個(gè)RAG檢索優(yōu)化的方法論,簡(jiǎn)單來(lái)說(shuō)就是通過(guò)對(duì)問(wèn)題進(jìn)行改寫和優(yōu)化;比如說(shuō)用戶輸入一個(gè)問(wèn)題query,但由于我們無(wú)法控制用戶的行為,因此用戶輸入的內(nèi)容query可以是任何東西,包括可能存在錯(cuò)別字,語(yǔ)義錯(cuò)誤,甚至是一些無(wú)意義內(nèi)容。面對(duì)這種情況,特別是在多輪對(duì)話過(guò)程中會(huì)導(dǎo)致一個(gè)很嚴(yán)重...
2025-10-15 09:04:33 5865瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“技術(shù)的發(fā)展大都是潤(rùn)物細(xì)無(wú)聲,除了業(yè)內(nèi)人士之外很少有人能明顯感受到技術(shù)發(fā)展的速度;但等你發(fā)現(xiàn)時(shí),機(jī)會(huì)已經(jīng)離你越來(lái)越遠(yuǎn)了。”作者最近一兩年一直在從事人工智能相關(guān)的工作,從剛開(kāi)始什么都不懂的小白,到現(xiàn)在對(duì)人工智能應(yīng)用有一定了解,這其中經(jīng)歷過(guò)很多困難,但也發(fā)現(xiàn)了很多問(wèn)題。從技術(shù)人員的角度來(lái)看,我們主要關(guān)注點(diǎn)都在技術(shù)上,但如果從市場(chǎng)的角度來(lái)看,技術(shù)的關(guān)注點(diǎn)應(yīng)該是應(yīng)用場(chǎng)景;但由于接觸人工智能時(shí)間比較多,...
2025-10-14 10:09:43 682瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
概述數(shù)據(jù)召回是RAG(檢索增強(qiáng)生成)系統(tǒng)中的核心環(huán)節(jié),負(fù)責(zé)從向量數(shù)據(jù)庫(kù)中檢索與用戶查詢最相關(guān)的知識(shí)片段。本流程通過(guò)多階段處理確保召回結(jié)果的準(zhǔn)確性、相關(guān)性和完整性,同時(shí)結(jié)合對(duì)話記憶管理來(lái)維持多輪對(duì)話的連貫性。核心處理模塊詳解查詢優(yōu)化模塊功能描述:對(duì)原始用戶查詢進(jìn)行語(yǔ)義增強(qiáng)和擴(kuò)展,提升檢索覆蓋率。處理策略:查詢改寫:生成多個(gè)語(yǔ)義相同但表述不同的查詢變體假設(shè)性回答:基于問(wèn)題生成可能的回答,反向推導(dǎo)相關(guān)關(guān)...
2025-10-10 06:45:07 1400瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“RAG召回時(shí)最好進(jìn)行多次過(guò)濾,這樣才能大大提升召回文檔的質(zhì)量。”關(guān)于RAG數(shù)據(jù)召回技術(shù),大家都都知道現(xiàn)在普遍使用的是相似度(語(yǔ)義)召回方式;但對(duì)沒(méi)有真正實(shí)際操作過(guò)的人來(lái)說(shuō),可能會(huì)認(rèn)為RAG只能進(jìn)行相似度召回;但在真正的業(yè)務(wù)場(chǎng)景中,標(biāo)量召回的效果可能會(huì)比相似度召回更好。原因在于,RAG的目的是為了更準(zhǔn)確的召回與問(wèn)題相關(guān)的內(nèi)容,但并沒(méi)有限制具體的召回方式,不論是傳統(tǒng)的字符匹配,分詞技術(shù)(如es),還是現(xiàn)在爆火的相...
2025-10-09 06:56:54 566瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“RAG的機(jī)制決定了其執(zhí)行流程比較死板,而Agent更符合人類的思維模式。”在RAG檢索增強(qiáng)系統(tǒng)中,有一個(gè)很重要的概念就是語(yǔ)義相似度檢索,其流程根據(jù)用戶問(wèn)題先去知識(shí)庫(kù)中檢索相關(guān)文檔,然后再丟給模型做增強(qiáng)。但在真實(shí)的業(yè)務(wù)實(shí)踐過(guò)程中發(fā)現(xiàn)了一個(gè)問(wèn)題,具體表現(xiàn)上是多輪對(duì)話的關(guān)聯(lián)性問(wèn)題,實(shí)際上是語(yǔ)義理解問(wèn)題;這個(gè)問(wèn)題產(chǎn)生的場(chǎng)景就是在多輪對(duì)話過(guò)程中無(wú)法準(zhǔn)確理解每次對(duì)話之間的關(guān)系,但這個(gè)是由RAG的流程所決定的,無(wú)法避免...
2025-10-09 06:54:48 640瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“數(shù)據(jù)通訊是系統(tǒng)開(kāi)發(fā)中的重要環(huán)節(jié),而Langgraph有其特有的設(shè)計(jì)哲學(xué)。”在項(xiàng)目開(kāi)發(fā)中,數(shù)據(jù)傳遞一直是一個(gè)很重要的環(huán)節(jié),畢竟任何系統(tǒng)的開(kāi)發(fā)邏輯最終的目的都是實(shí)現(xiàn)數(shù)據(jù)的有效操作,包括查詢,修改,新增等。而在大模型應(yīng)用場(chǎng)景中,數(shù)據(jù)的傳遞又是什么樣的呢?怎么解決?langgraph中的數(shù)據(jù)傳遞在Langgraph中State是貫穿整個(gè)生命周期的數(shù)據(jù)結(jié)構(gòu),其作用就是用來(lái)保存智能體執(zhí)行過(guò)程中的數(shù)據(jù);因此,在Langgraph中的幾個(gè)重要組件中...
2025-10-09 06:52:05 1002瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
“Langgraph對(duì)模型功能進(jìn)行了適度封裝,有些可能乍一看很不合理,因此我們要多看其官網(wǎng)說(shuō)明。”前一段時(shí)間在學(xué)習(xí)使用Langgraph開(kāi)發(fā)框架時(shí),由于對(duì)框架理解不夠深刻,以為發(fā)現(xiàn)了一個(gè)bug,然后今天才發(fā)現(xiàn)這不是bug,而是框架本身就是這么設(shè)計(jì)的。這個(gè)bug就是,在智能體的流式輸出的時(shí)候,會(huì)一塊輸出工具節(jié)點(diǎn)調(diào)用模型結(jié)果;之所以發(fā)現(xiàn)這個(gè)問(wèn)題就是在具體的工具中又調(diào)用了模型進(jìn)行數(shù)據(jù)處理,但在打印輸出的時(shí)候發(fā)現(xiàn)工具的執(zhí)行過(guò)程也...
2025-10-09 06:50:01 558瀏覽 0點(diǎn)贊 0回復(fù) 0收藏