偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<button id="kgube"></button>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

披上Agent盔甲的RAG，從此不再只是召回生成！精華

發(fā)布于 2024-8-22 13:19

瀏覽

0收藏

嘿，大家好！這里是一個專注于AI智能體的頻道！

今天我要和大家聊聊一些實(shí)戰(zhàn)相關(guān)的內(nèi)容。大模型在實(shí)際的工業(yè)場景下最常見的2個場景分別為應(yīng)用助手（copilot）, 文檔/知識庫問答（RAG）。事實(shí)上后者也逐漸在往更復(fù)雜的Agentic方向發(fā)展了，今天我們來看以下如何搭建一個可控的RAG Agent。

RAG Agent核心是它的“大腦”，一個復(fù)雜的確定性圖，它能讓AI進(jìn)行復(fù)雜的推理。而且，這個系統(tǒng)一般還能防止“幻覺”。確保所有答案都基于提供的數(shù)據(jù)，而不是憑空想象。

那我們要完成的這個系統(tǒng)需要具備哪些方面的能力呢？

可控自主，能夠回答自定義數(shù)據(jù)集中的重要問題。
充當(dāng)系統(tǒng)的“大腦”agent ，能實(shí)現(xiàn)復(fù)雜的推理。
幻覺低，確保答案僅基于提供的數(shù)據(jù)，避免人工智能幻覺。
多步驟推理，將復(fù)雜的用戶查詢分解為可管理的子任務(wù)。
適應(yīng)性規(guī)劃，根據(jù)新信息不斷更新其計劃。

大體的框架圖如下：

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

它是怎么工作的呢？簡單來說，就是先把PDF文檔加載進(jìn)來，然后進(jìn)行文本預(yù)處理，生成每個章節(jié)的摘要，再把這些內(nèi)容編碼到向量庫中。當(dāng)有人問問題時，AI會先對問題脫敏，生成一個規(guī)劃，然后再根據(jù)這個規(guī)劃進(jìn)行細(xì)化出執(zhí)行任務(wù)，最后生成最終答案。詳細(xì)步驟如下：

S1：構(gòu)建adavanced RAG

數(shù)據(jù)準(zhǔn)備，召回的retriever，可以理解為給文檔建立出索引，用戶后續(xù)的召回。當(dāng)然在S1的搭建高級RAG中，我們只需要分段的即可。

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

接下來，可以構(gòu)建標(biāo)準(zhǔn)的adavanced RAG的流程，召回塊 -> 保留與query相關(guān)的塊 -> 根據(jù)是否相關(guān)來決定是否需要改寫 -> 答案如果可用則結(jié)束了（這里的很多函數(shù)都可以在langgraph的官方examples中找到）

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

S2：從adavanced RAG 到 Agent

對于更復(fù)雜的任務(wù)，僅通過基于語義相似性檢索信息無法回答問題，需要更復(fù)雜的pipeline。為了實(shí)現(xiàn)這一目標(biāo)，我們先忘記adavanced rag的流程。我們需要定義出Agent的工具，一般RAG的tool就是S1中的retriever（召回）。（為了更復(fù)雜一些，我們在S1數(shù)據(jù)準(zhǔn)備中，準(zhǔn)備了3個retriever（文檔塊、摘要、引用）單獨(dú)作為不同的tool）

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

可以得到3個子圖：

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

有了工具，那接下來就是Agent的核心，planning部分了。

計劃制定

首先需要制定計劃->計劃細(xì)化到工具上。

制定計劃

計劃細(xì)化

示例：

question = {"question": "主人公是如何打敗反派的？"}
my_plan = planner.invoke(question) # Generate a plan to answer the question
print(my_plan)
refined_plan = break_down_plan_chain.invoke(my_plan.steps) # Refine the plan
print(refined_plan)

#### output
steps1 = [
    '識別故事中的主人公和反派。',
    '找到主人公和反派之間的高潮或最終對決。',
    '分析主人公在這次對決中采取的行動。',
    '確定導(dǎo)致反派失敗的具體行動或策略。',
    '總結(jié)發(fā)現(xiàn)，回答主人公是如何打敗反派的。'
]

steps2 = [
    '通過從書籍塊的向量存儲、章節(jié)摘要或書籍引用中檢索相關(guān)信息來識別故事中的主人公和反派。',
    '通過從書籍塊的向量存儲、章節(jié)摘要或書籍引用中檢索相關(guān)信息來定位主人公和反派之間的高潮或最終對決。',
    '通過從書籍塊的向量存儲、章節(jié)摘要或書籍引用中檢索相關(guān)信息來分析主人公在這次對決中采取的行動。',
    '通過從書籍塊的向量存儲、章節(jié)摘要或書籍引用中檢索相關(guān)信息來確定導(dǎo)致反派失敗的具體行動或策略。',
    '通過根據(jù)給定上下文回答問題來總結(jié)發(fā)現(xiàn)，回答主人公是如何打敗反派的。'
]

計劃更新

給定原始問題、當(dāng)前計劃、過去的步驟以及迄今為止匯總的信息，更新計劃（這個類似于一個迭代用到的，一次計劃無法完成任務(wù)，通過多次收集信息迭代）

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

任務(wù)處理

定義任務(wù)處理程序 - 決定是使用哪個工具來處理計劃中的每個任務(wù)

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

問題脫敏

脫敏

為了生成一個總體計劃，不帶任何基于任何先驗(yàn)知識的偏見LLM，我們首先對輸入問題進(jìn)行匿名化，并將名稱實(shí)體映射到變量中

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

還原

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

上面的串聯(lián)起來：

# 用戶問題
state1 = {'question': "how did the harry beat quirrell? \n"} 
print(f'question: {state1["question"]}')

# 脫敏
anonymized_question_output = anonymize_question_chain.invoke(state1) 

## 脫敏后的問題和脫敏字段
anonymized_question = anonymized_question_output["anonymized_question"]
mapping = anonymized_question_output["mapping"] 


print(f'anonimized_querry: {anonymized_question} \n')
print(f'mapping: {mapping} \n')

# 制定計劃
plan = planner.invoke({"question": anonymized_question})
print(text_wrap(f'plan: {plan.steps}'))
print("")

# 計劃的脫敏信息還原
deanonimzed_plan = de_anonymize_plan_chain.invoke({"plan": plan.steps, "mapping": mapping})

## 還原后的計劃
print(text_wrap(f'deanonimized_plan: {deanonimzed_plan.plan}'))


# output
question：harry是如何打敗Quirrell的？

anonimized_querry：X是如何打敗Y的？

mapping：{'X': 'harry', 'Y': 'Quirrell'}

plan：[
    '確定查詢的上下文或領(lǐng)域（例如，體育、競賽、游戲等）。',
    '收集X和Y參加的事件或競賽的信息。',
    '找到X與Y競爭的特定實(shí)例或比賽。',
    '查找那個特定實(shí)例或比賽的結(jié)果。',
    '分析比賽的細(xì)節(jié)，以了解X是如何設(shè)法打敗Y的。',
    '總結(jié)解釋X如何打敗Y的關(guān)鍵點(diǎn)。'
]

deanonimized_plan：[
    '確定查詢的上下文或領(lǐng)域（例如，體育、競賽、游戲等）。',
    '收集harry和Quirrell參加的事件或競賽的信息。',
    '找到harry與Quirrell競爭的特定實(shí)例或比賽。',
    '查找那個特定實(shí)例或比賽的結(jié)果。',
    '分析比賽的細(xì)節(jié)，以了解harry是如何設(shè)法打敗Quirrell的。',
    '總結(jié)解釋harry如何打敗Quirrell的關(guān)鍵點(diǎn)。'
]

最后在加一個判斷，確定是否能根據(jù)信息推出答案。

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

整體的流程圖如下：

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

本文轉(zhuǎn)載自 ??探索AGI??，作者：獼猴桃

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

讓大模型不再「巨無霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述

輕薄滴假象 ? 2781瀏覽 ? 0回復(fù)
RAG 的盡頭是 Agent？

玄姐聊AGI ? 2655瀏覽 ? 0回復(fù)
用于復(fù)雜RAG任務(wù)的先進(jìn)可控Agent

PaperAgent ? 2838瀏覽 ? 0回復(fù)
適用于TTS語音處理項(xiàng)目的召回模型：詞袋模型究竟是個啥？和語義召回相比有什么優(yōu)劣？

AI博物院 ? 2476瀏覽 ? 0回復(fù)
基于Agent的金融問答系統(tǒng)：RAG檢索模塊初建成

一起AI技術(shù) ? 2730瀏覽 ? 0回復(fù)
基于Agent的金融問答系統(tǒng)：RAG的檢索增強(qiáng)之ElasticSearch

一起AI技術(shù) ? 3292瀏覽 ? 0回復(fù)
怎么提升向量數(shù)據(jù)庫的召回準(zhǔn)確率

AI探索時代 ? 2901瀏覽 ? 0回復(fù)
PPTAgent：PPT自動生成Agent框架

大模型自然語言處理 ? 3770瀏覽 ? 0回復(fù)
WebWalker：通過Multi Agent提升RAG在開放域QA的性能

大語言模型論文跟蹤 ? 2107瀏覽 ? 0回復(fù)
編程不再是專業(yè)技能！Replit「Agent」引爆編程革命，零基礎(chǔ)也能輕松上手

duhorse ? 1946瀏覽 ? 0回復(fù)
從此告別收藏即吃灰！DeepSeek玩轉(zhuǎn)飛書的終極攻略

Bx玩AI ? 3359瀏覽 ? 0回復(fù)
DeepSeek 在微信上的 4 個入口，快來試試，從此遠(yuǎn)離“系統(tǒng)繁忙”！

wsp_ping ? 2781瀏覽 ? 0回復(fù)
Agent只是手段，工作流才是內(nèi)容！

51CTO技術(shù)棧 ? 2167瀏覽 ? 0回復(fù)
不再混淆了！一文揭秘MCP Server、Function Call與Agent的核心區(qū)別

九歌AI大模型 ? 8533瀏覽 ? 0回復(fù)
DoraCycle跨模態(tài)自循環(huán)算法：讓生成不再依賴配對數(shù)據(jù)

angel ? 2516瀏覽 ? 0回復(fù)
【萬字長文】深度剖析：RAG、AI Agent與Agentic RAG的融合發(fā)展|值得收藏

Halo咯咯 ? 5932瀏覽 ? 0回復(fù)
基于LangGraph的智能文章生成Agent架構(gòu)設(shè)計思路

九歌AI大模型 ? 2438瀏覽 ? 0回復(fù)
不再只是建議：Augment Agent 想成為真正幫你干活的 AI 開發(fā)伙伴！

墨風(fēng)如雪小站 ? 2975瀏覽 ? 0回復(fù)
關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究

AI探索時代 ? 1460瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

谷歌又來砸飯碗！免費(fèi)AI Agent發(fā)布，程序員狂喜 7天前發(fā)布
AI Agents開源工具棧全解析~ 2025-06-16 00:17:05發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 0回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測：真·超DS！ 1回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

我把DeepSeek微調(diào)參數(shù)扒光了，顯存和性能優(yōu)化的秘密都在這 0回復(fù)

上一篇： Multi-Meta-RAG：langchain點(diǎn)名，評論爆吹的新研究

下一篇：長上下文還是 RAG？ Google:我全都要！

社區(qū)精華內(nèi)容

目錄

<code id="mon8y"><dl id="mon8y"></dl></code>

<center id="mon8y"><video id="mon8y"><small id="mon8y"></small></video></center><em id="mon8y"><th id="mon8y"></th></em>

<pre id="mon8y"><tt id="mon8y"></tt></pre>