偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<u id="ywkda"><table id="ywkda"><optgroup id="ywkda"></optgroup></table></u>

<rt id="ywkda"></rt>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

HedgeSpec：比EAGLE3推理速度快2倍的LLM推測解碼

發(fā)布于 2025-10-31 07:45

瀏覽

0收藏

論文(Not-a-Bandit: Provably No-Regret Drafter Selection in Speculative Decoding for LLMs)通過推測解碼為大語言模型推理加速創(chuàng)造了新的SOTA。通過協(xié)調(diào)一組專家drafters，論文在Llama-3.1-8B-Instruct上實現(xiàn)了4.99倍加速，在Qwen-32B上實現(xiàn)了4.93倍加速——比EAGLE3快了近2倍。

那么它是如何工作的?大語言模型會收到各種各樣的請求:數(shù)學(xué)、編程、科學(xué)、論文寫作等。EAGLE3草稿器是一個試圖在整體上表現(xiàn)良好的通才。但在每個領(lǐng)域中，專家會更好。論文的方法——HedgeSpec——幾乎能為每個查詢匹配到最佳專家!

HedgeSpec：比EAGLE3推理速度快2倍的LLM推測解碼-AI.x社區(qū)

論文在每輪推測解碼后添加了一個評估階段，在這個階段論文在那些未被選擇的草稿器上"重放"生成的token。這能夠動態(tài)更新"押注"。最佳drafters通常在幾輪內(nèi)就會脫穎而出。

一個自然的替代想法是使用賭博機(jī)算法( bandits algorithms)。BanditSpec平衡了"探索"和"利用"。lunwen 的洞察是"探索"實際上是不必要的，因此可以實現(xiàn)更快的學(xué)習(xí)。

HedgeSpec：比EAGLE3推理速度快2倍的LLM推測解碼-AI.x社區(qū)

HedgeSpec享有可證明的遺憾保證。而且它在專家數(shù)量方面以指數(shù)級優(yōu)勢擊敗BanditSpec(見下圖)。

HedgeSpec：比EAGLE3推理速度快2倍的LLM推測解碼-AI.x社區(qū)

唯一剩下的障礙是工程挑戰(zhàn)——以低開銷為所有專家實現(xiàn)評估階段。

HedgeSpec：比EAGLE3推理速度快2倍的LLM推測解碼-AI.x社區(qū)

結(jié)果：在論文測試的7個領(lǐng)域中，HedgeSpec在每一個領(lǐng)域都占主導(dǎo)地位。

HedgeSpec：比EAGLE3推理速度快2倍的LLM推測解碼-AI.x社區(qū)

本文轉(zhuǎn)載自??AI帝國??，作者：無影寺

標(biāo)簽

已于2025-10-31 07:45:46修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

3倍生成速度還降內(nèi)存成本，超越Medusa2的高效解碼框架終于來了

輕薄滴假象 ? 3245瀏覽 ? 0回復(fù)
渲染速度比ENeRF快30倍！4K4D:實時4K分辨率4D視圖合成

angel ? 3815瀏覽 ? 0回復(fù)
ECCV`24 | 比DragDiffusion快100倍！RegionDrag：快·準(zhǔn)·好的圖像編輯方法！港大&牛津

angel ? 3853瀏覽 ? 0回復(fù)
比OpenAI的Whisper快50%，最新開源語音模型

Aceryt ? 4197瀏覽 ? 0回復(fù)
ECCV`24 | 比現(xiàn)有方法快50倍！新加坡國立開源FlashSplat：簡單&全局最優(yōu)3D-GS分割求解器

angel ? 6025瀏覽 ? 0回復(fù)
微軟 RetrievalAttention: LLM+ANN, LLM 推理速度與精度的平衡

amei2000go ? 4236瀏覽 ? 0回復(fù)
比ControlNet和T2I-Adapter 快五倍！北大&騰訊等重磅發(fā)布CAR

angel ? 3832瀏覽 ? 0回復(fù)
Meta AI發(fā)布全新量化版本Llama 3.2（1B & 3B）：推理速度提升2-4倍，模型大小減少56%

Halo咯咯 ? 4247瀏覽 ? 0回復(fù)
賈佳亞團(tuán)隊提出DreamOmni：訓(xùn)練收斂速度快且性能強(qiáng)大

angel ? 3383瀏覽 ? 0回復(fù)
谷歌AI發(fā)布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型

Halo咯咯 ? 7763瀏覽 ? 0回復(fù)
混元T1正式版推出，公開對壘DeepSeek：速度快幻覺少!

51CTO技術(shù)棧 ? 3028瀏覽 ? 0回復(fù)
比DeepSeek快8倍！智譜AI開源6款模型，推理速度200 tokens/秒碾壓競品，價格僅1/30！

AI博物院 ? 6699瀏覽 ? 0回復(fù)
阿里Qwen3一夜封神！開源模型跑出3倍推理速度，OpenAI沉默

AI博物院 ? 5563瀏覽 ? 0回復(fù)
在線教程｜支持 19 種語言，生成速度快 15 倍！ACE-Step 音樂生成模型上線

HyperAI超神經(jīng) ? 5760瀏覽 ? 0回復(fù)
推理速度快50倍，MIT團(tuán)隊提出FASTSOLV模型，實現(xiàn)任意溫度下的小分子溶解度預(yù)測

HyperAI超神經(jīng) ? 1404瀏覽 ? 0回復(fù)
ICCV`25 | 把DragDiffusion“卷”哭了：速度快600倍，效果更精準(zhǔn)！港大開源Inpaint4Drag

zhangyannni ? 1013瀏覽 ? 0回復(fù)
mmBERT：3萬億詞訓(xùn)練出的新一代多語言編碼器，速度快 4 倍，還能照顧到冷門語言

Halo咯咯 ? 2194瀏覽 ? 0回復(fù)
性能追平 Sonnet 4，速度快 2 倍，成本效益炸裂

Halo咯咯 ? 1553瀏覽 ? 0回復(fù)
最強(qiáng)AI編程神器Cursor自研核心模型，速度快4倍，AI創(chuàng)業(yè)公司大佬：這是我用過最瘋狂的模型之一！

51CTO技術(shù)棧 ? 501瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenAI 開源了推理安全模型-gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 2天前發(fā)布
黑盒模型溯源：利用訓(xùn)練數(shù)據(jù)順序的"重寫效應(yīng)"追蹤模型來源 2天前發(fā)布

熱門推薦

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復(fù)

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁PDF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復(fù)

DeepSeek團(tuán)隊開源新模型DeepSeek-OCR，用3B參數(shù)量實現(xiàn)10倍文本壓縮的多模態(tài)突破 0回復(fù)

上一篇：黑盒模型溯源：利用訓(xùn)練數(shù)據(jù)順序的"重寫效應(yīng)"追蹤模型來源

下一篇： OpenAI 開源了推理安全模型-gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b

社區(qū)精華內(nèi)容

目錄

<var id="dtvmq"><form id="dtvmq"></form></var>