偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<bdo id="lxlcq"><legend id="lxlcq"><pre id="lxlcq"></pre></legend></bdo><thead id="lxlcq"><option id="lxlcq"><track id="lxlcq"></track></option></thead><abbr id="lxlcq"><table id="lxlcq"></table></abbr>

<tt id="lxlcq"></tt>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

關(guān)于大模型窗口大小的思考——上下文工程和提示詞工程原創(chuàng)

AI探索時(shí)代

發(fā)布于 2025-9-17 13:58

瀏覽

0收藏

“ 上下文工程是一種復(fù)雜的提示詞方法論，其作用是為了解決模型上下文窗口限制所導(dǎo)致的問題?！?/strong>

最近在優(yōu)化RAG的增強(qiáng)問題，也就是提示詞的封裝，包含系統(tǒng)提示詞，用戶問題，歷史記錄和召回文檔等；然后就發(fā)現(xiàn)一個(gè)平常沒有關(guān)注的問題，那就是模型上下文窗口大小以及其帶來的問題。

我們都知道模型的上下文窗口是有大小限制的，哪怕隨著模型技術(shù)的發(fā)展其窗口大小也越來越大，但總歸有一個(gè)限制；而在這個(gè)窗口中不但包含了用戶問題，還同時(shí)包含了歷史記錄和參考文檔；特別是在多輪對(duì)話中，隨著對(duì)話次數(shù)的增多，很容易就達(dá)到了上下文窗口的限制。

當(dāng)然，可能很有人會(huì)說，我在使用模型的時(shí)候聊天好多輪但都沒有報(bào)超長錯(cuò)誤啊；原因是模型廠商默認(rèn)給你做了上下文裁剪，當(dāng)上下文超過模型窗口時(shí)會(huì)默認(rèn)丟棄之前的對(duì)話，這也是大模型“失憶”的原因。

模型上下文窗口

模型上下文窗口限制，這是一個(gè)客觀存在的事實(shí)；但可能很多人到現(xiàn)在都沒搞明白這個(gè)上下文窗口到底是怎么算的，特別是在多輪對(duì)話中，比如說上下文窗口與輸入輸出之間的關(guān)系？

模型上下文窗口因模型不同，其值也不同；但我們要明白一件事，那就是模型上下文窗口是指模型能夠處理的最大數(shù)據(jù)長度，其計(jì)量單位是Token，如果不知道什么是token的，自己去查。

因此，模型上下文窗口包含了輸入和輸出；特別是在多輪對(duì)話中的處理最為顯著。

舉例來說，一個(gè)模型的上下文窗口是1000token；你輸入用了100token(包含問題，系統(tǒng)提示詞，參考文檔等）；然后模型回答問題用了兩百token，這時(shí)模型的上下文窗口就還剩700token；然后在第二輪對(duì)話中，假如你的輸入還是用了100token，第二輪回答也是用了200token，那么由于歷史記錄的存在，第二輪對(duì)話消耗了多少token?

100 + 200 + 300(第一輪對(duì)話的輸入和輸出100+200)，這時(shí)就用了600token，那么再對(duì)話一次，在第四次對(duì)話的時(shí)候，上下文窗口就超限了。這時(shí)應(yīng)該怎么辦？

默認(rèn)情況下會(huì)對(duì)上下文進(jìn)行截取，丟掉最開始的第一輪對(duì)話內(nèi)容或者前200個(gè)token。

當(dāng)然，以上內(nèi)容都是基于多輪對(duì)話和有記憶功能存在的前提下，如果是單輪對(duì)話或者沒有記憶，那么只要單次沒有超出模型上下文限制，那么就不會(huì)有問題。

由于目前大部分的應(yīng)用場(chǎng)景都是基于多輪對(duì)話，因此基于以上情況就面臨一個(gè)問題，上下文超長是一個(gè)必然的過程；那么，怎么才能讓模型更好地輸入和輸出呢？

這時(shí)，提示詞工程和上下文工程的作用就體現(xiàn)出來了；在這里我們要明白一個(gè)前提，不管模型的上下文限制是多少，對(duì)模型來說它接受的最終形式就是一串提示詞。

而這就是提示詞工程要做的事情，但這里為什么又搞出了一個(gè)上下文工程呢？

在大模型應(yīng)用中，提示詞工程一般是指靜態(tài)的提示詞，其作用是為了在單次對(duì)話中，盡可能的引導(dǎo)模型，讓其表現(xiàn)達(dá)到最好；但是，在多輪對(duì)話中，提示詞最終的來源很復(fù)雜，包括用戶問題，系統(tǒng)提示詞，歷史記錄和參考問題；特別是歷史記錄。

上下文工程雖然很多人都認(rèn)為它是一個(gè)新概念，但事實(shí)上我們?cè)陂_發(fā)過程中已經(jīng)在使用它了；比如說在langchain的提示詞模板中拼接歷史記錄和參考文檔就屬于上下文工程的一部分。

上下文工程可以簡(jiǎn)單理解為是提示詞工程的一種復(fù)雜情況，由于歷史記錄和參考文檔的存在；特別是隨著多輪對(duì)話，歷史記錄會(huì)逐漸增多，這時(shí)怎么保證在盡可能不丟失歷史記錄的前提下，還能保證最終的提示詞不會(huì)超出上下文窗口，以及使用什么樣的提示詞結(jié)構(gòu)才能讓大模型更好的理解和輸出，這就是上下文工程所需要解決的問題。

為了解決這個(gè)問題，因此有了歷史記錄壓縮技術(shù)，提示詞結(jié)構(gòu)設(shè)計(jì)，參考文檔處理等一系列技術(shù)問題。

總之，上下文工程的目的是為了解決在模型上下文有限的情況下，盡可能的讓模型表現(xiàn)的更好，輸出更高質(zhì)量的回答。

本文轉(zhuǎn)載自?????AI探索時(shí)代????? 作者：DFires

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽
大模型
上下文工程
提示詞工程

贊

收藏

回復(fù)

分享

微博

QQ

微信

舉報(bào)
舉報(bào)

微信掃碼分享

刪除帖子
刪除取消

回復(fù)

相關(guān)推薦

生成式AI大模型之提示詞工程實(shí)踐

數(shù)智飛輪 ? 4758瀏覽 ? 0回復(fù)
大模型的提示工程：提示是對(duì)程序的搜索

lintoms ? 3979瀏覽 ? 0回復(fù)
什么是提示詞工程(prompt engineering)？為什么需要提示詞工程？

AI探索時(shí)代 ? 9138瀏覽 ? 0回復(fù)
關(guān)于大模型的使用——提示詞工程

AI探索時(shí)代 ? 4973瀏覽 ? 0回復(fù)
大模型超長窗口上下文與檢索增強(qiáng)生成——RAG

AI探索時(shí)代 ? 4043瀏覽 ? 0回復(fù)
提示詞工程對(duì)大模型應(yīng)用的重要性

AI探索時(shí)代 ? 3171瀏覽 ? 0回復(fù)
提示詞工程對(duì)大模型應(yīng)用的重要性

AI探索時(shí)代 ? 2547瀏覽 ? 0回復(fù)
上下文工程的崛起：提示工程已是過去式

Syrupup ? 2813瀏覽 ? 0回復(fù)
Prompt 工程已過時(shí)？AI大神Andrej Karpathy力推上下文工程！

草臺(tái)AI ? 2192瀏覽 ? 0回復(fù)
告別提示詞工程，「上下文工程」才是 AI Agent 的核心競(jìng)爭(zhēng)力

Baihai_IDP ? 1554瀏覽 ? 0回復(fù)
大語言模型Agent上下文工程綜述：AI 的 “上下文密碼” ，從提示詞到多智能體，這篇綜述講透了

十一月雨_55 ? 2291瀏覽 ? 0回復(fù)
大型語言模型的上下文工程（Context Engineering）綜述

chengganfei ? 4311瀏覽 ? 0回復(fù)
上下文工程如何重塑智能體的“思考方式”？

骨灰級(jí)AI愛好者 ? 822瀏覽 ? 0回復(fù)
上下文工程：大模型長期任務(wù)的破局之道

云原生AI百寶箱 ? 1868瀏覽 ? 0回復(fù)
超越提示詞：深入理解 AI 應(yīng)用成功的關(guān)鍵--上下文工程

玄姐聊AGI ? 1744瀏覽 ? 0回復(fù)
LangGraph + 多Agent系統(tǒng)實(shí)戰(zhàn)：上下文工程才是智能協(xié)作的核心基建

AI博物院 ? 2147瀏覽 ? 0回復(fù)
提示詞工程還沒玩明白，又多了一個(gè)新詞叫上下文工程！

DataForAI ? 849瀏覽 ? 0回復(fù)
上下文工程：2025 年最核心的能力

玄姐聊AGI ? 2009瀏覽 ? 0回復(fù)
談?wù)?em>上下文工程（Context Engineering）

周末程序猿 ? 454瀏覽 ? 0回復(fù)

AI探索時(shí)代

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

讓AI像人一樣動(dòng)手！大模型是怎么學(xué)會(huì)使用工具的？ 2天前發(fā)布
大模型應(yīng)用技術(shù)是一項(xiàng)重實(shí)操輕理論的技術(shù) 3天前發(fā)布

熱門推薦

關(guān)于RAG系統(tǒng)在多輪對(duì)話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)
阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)
別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)
Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)
代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

上一篇：在企業(yè)級(jí)RAG系統(tǒng)中需要關(guān)注和優(yōu)化的點(diǎn)

下一篇：關(guān)于相似度計(jì)算和Rerank重排序的區(qū)別和作用

社區(qū)精華內(nèi)容

目錄

Copyright ? 2005-2025 51CTO.COM 京ICP證060544版權(quán)所有未經(jīng)許可請(qǐng)勿轉(zhuǎn)載

客服

感谢您访问我们的网站，您可能还对以下资源感兴趣：
偷偷摘套内射激情视频