偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

忘記大模型,英偉達(dá):小模型才是Agentic AI的未來(lái)!

發(fā)布于 2025-9-26 00:11
瀏覽
0收藏

截至 2024 年末,Agentic AI 領(lǐng)域已獲得逾 20 億美元 的初創(chuàng)公司融資,整體估值達(dá) 52 億美元,并有望在 2034 年前逼近 2000 億美元。先分享一個(gè)AI Agent 2025的發(fā)展趨勢(shì)圖譜:Agentic RAG、Voice Agents、CUA、Coding Agents、DeepResearch Agents、Protocols。

忘記大模型,英偉達(dá):小模型才是Agentic AI的未來(lái)!-AI.x社區(qū)

但,過(guò)去兩年,大模型參數(shù)規(guī)模在狂奔:從 7B → 70B → 400B+,幾乎所有指標(biāo)都在漲。是不是所有場(chǎng)景都適合用大模型,NVIDIA發(fā)布的研究報(bào)告顯示:

  • 在大多數(shù)Agentic AI場(chǎng)景中,小型語(yǔ)言模型(SLM)已足夠強(qiáng)、更適配、更便宜,理應(yīng)成為默認(rèn)選擇。
  • LLM-to-SLM 遷移不是“可選項(xiàng)”,而是“必然趨勢(shì)”。忘記大模型,英偉達(dá):小模型才是Agentic AI的未來(lái)!-AI.x社區(qū)

1. Agentic AI 的“大模型迷信”

  • 現(xiàn)狀:2024 年57bn USD砸進(jìn)云基建,只為支撐通用 LLM API,而當(dāng)年市場(chǎng)規(guī)模僅5.6bn USD(10 倍溢價(jià))。
  • 問(wèn)題:Agent 的絕大多數(shù)調(diào)用其實(shí)只做重復(fù)、狹窄、非對(duì)話任務(wù),卻硬要調(diào)用 175B 參數(shù)的“巨無(wú)霸”。

忘記大模型,英偉達(dá):小模型才是Agentic AI的未來(lái)!-AI.x社區(qū)

2. SLM 才是未來(lái)

論點(diǎn)

一句話總結(jié)

V1 足夠強(qiáng)

7B 模型在代碼生成、工具調(diào)用、指令遵循等關(guān)鍵指標(biāo)上 ≈ 70B LLM

V2 更適配

低時(shí)延、可本地部署、單任務(wù) fine-tune 一夜完成

V3 更便宜

推理、微調(diào)、運(yùn)維成本全線下降一個(gè)量級(jí)

忘記大模型,英偉達(dá):小模型才是Agentic AI的未來(lái)!-AI.x社區(qū)

3. SLM 已經(jīng)能打

模型家族

參數(shù)量

對(duì)標(biāo) LLM 表現(xiàn)

效率提升

Microsoft Phi-3-small

7B

追平 70B 級(jí)代碼生成

↑70×

 吞吐

NVIDIA Nemotron-H-9B

9B

追平 30B Dense LLM

↓10×

 FLOPs

HuggingFace SmolLM2-1.7B

1.7B

追平 14B 模型

可跑手機(jī)端

Salesforce xLAM-2-8B

8B

工具調(diào)用 SOTA,超越 GPT-4o

忘記大模型,英偉達(dá):小模型才是Agentic AI的未來(lái)!-AI.x社區(qū)

4. 經(jīng)濟(jì)賬:SLM 碾壓式成本優(yōu)勢(shì)

SLMs在延遲、能耗和浮點(diǎn)運(yùn)算次數(shù)上比LLMs便宜10到30倍,LoRA、DoRA微調(diào)只需少量GPU小時(shí),并能夠在消費(fèi)級(jí)GPU上本地執(zhí)行,

忘記大模型,英偉達(dá):小模型才是Agentic AI的未來(lái)!-AI.x社區(qū)

5. 遷移實(shí)操:LLM→SLM 6 步算法

步驟

動(dòng)作

工具/技巧

S1

日志采集

加密管道 + 匿名化

S2

數(shù)據(jù)清洗

PII 自動(dòng)脫敏、敏感實(shí)體替換

S3

任務(wù)聚類(lèi)

無(wú)監(jiān)督聚類(lèi)發(fā)現(xiàn)高頻子任務(wù)

S4

選型

按任務(wù)選 1–10 B 模型家族

S5

微調(diào)

LoRA/QLoRA/蒸餾,<1 GPU-day

S6

持續(xù)迭代

在線日志回流 → 再訓(xùn)練

忘記大模型,英偉達(dá):小模型才是Agentic AI的未來(lái)!-AI.x社區(qū)

6. 案例研究:三大開(kāi)源 Agent 的替換潛力

Agent

可替換比例

高潛場(chǎng)景

仍需 LLM 的場(chǎng)景

MetaGPT

60%

代碼補(bǔ)全、模板文檔

架構(gòu)設(shè)計(jì)、復(fù)雜 Debug

Open Operator

40%

命令解析、固定格式報(bào)告

多輪對(duì)話、跨 API 推理

Cradle

70%

重復(fù) GUI 點(diǎn)擊序列

動(dòng)態(tài)界面適應(yīng)、異常處理

Small Language Models are the Future of Agentic AI
https://arxiv.org/pdf/2506.02153

本文轉(zhuǎn)載自??智駐未來(lái)??

已于2025-9-26 11:19:23修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦