偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

LightMem用3招重新設(shè)計了LLM的記憶，結(jié)果出乎意料

發(fā)布于 2025-10-31 07:50

瀏覽

0收藏

1. LLM 的“記性”又貴又差

在超長多輪對話里，LLM 面臨兩大痛點：

上下文窗口有限——“中間丟失”現(xiàn)象嚴(yán)重。
記憶系統(tǒng)昂貴——每輪都把原始對話塞進(jìn) LLM 做摘要/更新，Token 與 API 調(diào)用爆炸。

LightMem用3招重新設(shè)計了LLM的記憶，結(jié)果出乎意料-AI.x社區(qū)

圖 1 現(xiàn)有記憶系統(tǒng) vs LightMem

如圖 1 所示，現(xiàn)有系統(tǒng)要么“全量硬存”，要么“逐輪硬更新”，冗余信息 > 50%，實時推理被拖垮。

2. 人類記憶的三把鑰匙

LightMem用3招重新設(shè)計了LLM的記憶，結(jié)果出乎意料-AI.x社區(qū)

Atkinson-Shiffrin 模型把記憶分為：

階段	功能	對應(yīng) LLM 痛點
感覺記憶	毫秒級過濾無關(guān)刺激	冗余 Token
短期記憶	秒-分鐘級主題整合	語義混雜
長期記憶	睡眠時離線鞏固	實時更新延遲

LightMem 直接把這套機制搬進(jìn)了 Transformer 時代。

3. LightMem 架構(gòu)：三盞“燈”點亮高效記憶

LightMem用3招重新設(shè)計了LLM的記憶，結(jié)果出乎意料-AI.x社區(qū)

圖 3 整體架構(gòu)

模塊	昵稱	關(guān)鍵設(shè)計	效果
Light1	感覺記憶	預(yù)壓縮 + 主題分段	砍掉 20-80% 冗余 Token
Light2	短期記憶	主題緩沖 + 到達(dá)閾值再摘要	API 調(diào)用 ↓ 17-177×
Light3	長期記憶	在線“軟更新”+ 睡眠離線并行合并	運行時 ↓ 1.7-12×

4. 核心技術(shù)拆解

4.1 Light1：預(yù)壓縮 + 主題分段

圖 4(a)：不同壓縮率下 QA 準(zhǔn)確率幾乎不變，token 先砍一半

LightMem用3招重新設(shè)計了LLM的記憶，結(jié)果出乎意料-AI.x社區(qū)

做法：

用 LLMLingua-2 給每輪對話打“保留概率”。
動態(tài)閾值 τ = 百分位(r)，只保留信息量最大的 token。
壓縮率 r=0.6 時，輸入 token ↓ 40 %，準(zhǔn)確率不掉。

4.2 Light2：主題級短期記憶

緩沖結(jié)構(gòu)：??{topic, [user_i, model_i]}??
到達(dá) Token 閾值后，一次性調(diào)用 LLM 生成摘要 → 入庫。
相比“逐輪摘要”，主題純度↑ → 摘要幻覺↓，圖 4(c) 顯示去掉該模塊 ACC 掉 6%。

4.3 Light3：睡眠期離線合并

在線階段只做“追加寫”，零延遲。
離線階段并行執(zhí)行“讀-改-寫”：每條記憶維護(hù)一個更新隊列 ??(e_i)，僅與更高時間戳的條目合并，可批量并行，總延遲從 O(N) → O(1)。

5. 實驗結(jié)果：又快又準(zhǔn)，全線 SOTA

表 1 在 LongMemEval-S（平均 110k Token）上與 6 個強基線Full-Text、Naive RAG、LangMem、A-MEM、MemoryOS、Mem0對比：

LightMem用3招重新設(shè)計了LLM的記憶，結(jié)果出乎意料-AI.x社區(qū)

基于GPT和Qwen骨干網(wǎng)絡(luò)在LongMemEval上的實驗表明：LightMem在準(zhǔn)確率上超越強勁基線（最高提升10.9%），同時顯著降低token使用量達(dá)117倍，減少API調(diào)用達(dá)159倍，并將運行時間縮短超過12倍。

6. 關(guān)鍵消融：參數(shù)怎么選？

表 2 給出壓縮率 r 與緩沖閾值 th 的聯(lián)合調(diào)參：

LightMem用3招重新設(shè)計了LLM的記憶，結(jié)果出乎意料-AI.x社區(qū)

th↑ → 摘要批次↑ → API/時間↓，但 ACC 非單調(diào)。
r=0.6 + th=512在 GPT 上取得最佳平衡點；Qwen 則偏好r=0.6 + th=768。

7. 案例：睡眠更新如何避免“誤刪”？

LightMem用3招重新設(shè)計了LLM的記憶，結(jié)果出乎意料-AI.x社區(qū)

場景	硬更新	LightMem 軟更新
用戶先去東京→再問京都	直接覆蓋為“計劃京都游”，東京信息丟失	追加寫入，兩地行程并存

離線合并時再做知識消歧，既保證實時性，又避免不可逆信息損失。

LightMem: Lightweight and Efficient Memory-Augmented Generation
浙江大學(xué) & 新加坡國立大學(xué)  
https://arxiv.org/html/2510.18866
https://github.com/zjunlp/LightMem

本文轉(zhuǎn)載自??PaperAgent??

標(biāo)簽

已于2025-10-31 07:50:27修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

超越GPT4的Agent，我用代碼實現(xiàn)了！

ermulong ? 4486瀏覽 ? 0回復(fù)
Llama 3低比特量化性能下降顯著！全面評估結(jié)果來了 | 港大&北航&ETH

Crystalcxt ? 4333瀏覽 ? 0回復(fù)
如何訓(xùn)練LLM自動在RAG和參數(shù)記憶之間進(jìn)行選擇

51CTO內(nèi)容精選 ? 3903瀏覽 ? 0回復(fù)
如何使用HippoRAG增強LLM的記憶

51CTO內(nèi)容精選 ? 5274瀏覽 ? 0回復(fù)
如何評估大語言模型生成結(jié)果的多樣性

sbf_2000 ? 4730瀏覽 ? 1回復(fù)
【活動結(jié)果公布】AIGC創(chuàng)新先鋒者征文大賽懸賞召集?

AI.x社區(qū)官方賬號 ? 7819瀏覽 ? 0回復(fù)
GLM4模型開源，意料之中的尺寸，意料之外的效果

NLP工作站 ? 5278瀏覽 ? 0回復(fù)
GLM4模型開源，意料之中的尺寸，意料之外的效果

NLP工作站 ? 3788瀏覽 ? 0回復(fù)
總算有人把智能體記憶說清楚了

ermulong ? 5227瀏覽 ? 0回復(fù)
如何借助 kimiChat 創(chuàng)造好用的提示詞？一招教會你

wsp_ping ? 3456瀏覽 ? 0回復(fù)
沖，DeepSeek-R1/V3推理系統(tǒng)架構(gòu)設(shè)計被開源了！

PaperAgent ? 3885瀏覽 ? 0回復(fù)
奧特曼自曝：改版后的GPT-4o諂媚過頭了，系情緒價值拉滿后的結(jié)果，實測：大廠薅開源羊毛有錯嗎？沒錯！

51CTO技術(shù)棧 ? 2425瀏覽 ? 0回復(fù)
八大LLM架構(gòu)大比較總結(jié)：從DeepSeek-V3->qwen3->Kimi K2看LLM架構(gòu)設(shè)計

大模型自然語言處理 ? 6114瀏覽 ? 0回復(fù)
8種LLM架構(gòu)設(shè)計大比拼：從 DeepSeek-V3 到 Kimi K2，究竟有啥不同

CourseAI ? 3880瀏覽 ? 0回復(fù)
Zhipu AI剛剛發(fā)布了GLM-4.5系列：重新定義帶有混合推理的開源代理AI

Halo咯咯 ? 5538瀏覽 ? 0回復(fù)
AI 智能體的八種記憶系統(tǒng)架構(gòu)設(shè)計與落地

玄姐聊AGI ? 3598瀏覽 ? 0回復(fù)
LLM 上下文窗口越大越好？錯了，用這 6 招給你的 AI Agent「瘦身」

草臺AI ? 1639瀏覽 ? 0回復(fù)
讓Agents更聰明，3招搞定記憶管理！

探索AGI ? 1538瀏覽 ? 0回復(fù)
Memori：用 SQL 給 AI 加上記憶

Syrupup ? 1284瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepAgent：能夠自主找工具的深度思考智能體，工具&任務(wù)隨心配 2天前發(fā)布
國產(chǎn)開源LLM大爆發(fā)，Qwen、Minimax、美團(tuán)、騰訊~ 2天前發(fā)布

熱門推薦

一篇大模型Agentic框架到應(yīng)用最新綜述 0回復(fù)

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復(fù)

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁PDF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復(fù)

上一篇：一篇92頁大模型Vibe Coding技術(shù)全面綜述

下一篇：告別Demo，行業(yè)落地的Agents：技術(shù)、應(yīng)用與評估

社區(qū)精華內(nèi)容

目錄