偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

這個(gè)大模型Badcase修復(fù)方案，我服！

丁師兄大模型

發(fā)布于 2024-12-31 12:38

瀏覽

0收藏

工作以后，對(duì)于做業(yè)務(wù)的同學(xué)，一個(gè)避免不了的話題就是“badcase”，在大模型時(shí)代，當(dāng)然也是避免不了的問(wèn)題。

對(duì)于很多沒(méi)接觸過(guò)實(shí)際業(yè)務(wù)的同學(xué)可能認(rèn)為大模型足夠強(qiáng)，強(qiáng)到可以很好的 fit 用戶的所有需求，就算 fit 不了，也可以微調(diào)模型來(lái)解決。

但實(shí)際情況是怎樣呢？其實(shí)不管是大模型，還是專有領(lǐng)域小模型，一定存會(huì)各式各樣模型解決不了的 badcase。

具體原因很多，以智能客服系統(tǒng)為例，用戶的咨詢分布也符合二八原則，即用戶 80% 的咨詢問(wèn)題主要是集中在 20% 的知識(shí)點(diǎn)中；

針對(duì)用戶 20% 長(zhǎng)尾知識(shí)咨詢，一般采用 AI 模型手段解決，這個(gè)部分是比較好處理的。那剩下的 20% 的問(wèn)題覆蓋了 80% 的知識(shí)點(diǎn)，就屬于長(zhǎng)尾問(wèn)題了。

這部分出現(xiàn)頻率低，數(shù)據(jù)量不足，模型也不易學(xué)習(xí)到。長(zhǎng)尾不代表不重要，但是卻很難優(yōu)化，線上出的 badcase 也經(jīng)常屬于這部分。

那線上大模型服務(wù)報(bào)了 badcase，如何解決呢？

我結(jié)合自己的經(jīng)驗(yàn)，總結(jié)主要有以下 4 個(gè)思路：

加前置模塊
加后處理
調(diào) prompt
模型微調(diào)優(yōu)化

最直接方式就是加前處理。具體來(lái)說(shuō)就是在進(jìn)入大模型前，做一級(jí)或者多級(jí)前置模塊。

實(shí)際業(yè)務(wù)系統(tǒng)中，會(huì)呈現(xiàn)一個(gè)漏斗形，最前面是高頻話術(shù)緩存，用戶的問(wèn)題會(huì)被逐級(jí)過(guò)濾和篩選。高頻簡(jiǎn)單的問(wèn)題會(huì)被優(yōu)先處理掉，直接返回。

這部分的模塊具有幾個(gè)很明顯的特點(diǎn)：

精度高
速度快
模型/規(guī)則簡(jiǎn)單

所以針對(duì)某些 badcase，可以直接在這一層做掉，如果命中，直接加 trigger 返回。

我給大家舉幾個(gè)例子：

（1）比如用戶的 query 可能會(huì)出現(xiàn)一些敏感話題或詞語(yǔ)，這種情況是不能進(jìn)大模型。

如果敏感詞檢測(cè)模型也沒(méi)有攔住，往往會(huì)在前面加一個(gè)拒識(shí)模塊，問(wèn)題可以及時(shí) hotfix。

（2）有時(shí)候會(huì)出現(xiàn)地域性方言或者當(dāng)?shù)乜谡Z(yǔ)的話術(shù)，query 改寫沒(méi)兜住，意圖識(shí)別沒(méi)兜住，大模型也沒(méi)兜住，怎么辦？

第一類加前置處理。結(jié)合一些泛化手段，這個(gè)在平時(shí)工作中會(huì)總結(jié)出一套完整流程，從種子語(yǔ)料，query 泛化，到線上自動(dòng)配置化，基本能做到只需要少量人工參與的快速 fix。

第二類方法是后處理。為了方便理解，我也給大家舉個(gè)例子。

比如大模型被人熟知的輸出會(huì)有“幻覺(jué)”，甚至出現(xiàn)一些不可控的話題。這種比較好的方案就是在后面加一個(gè)處理模塊來(lái)二次過(guò)濾。

根據(jù)不可控的內(nèi)容來(lái)構(gòu)建檢索規(guī)則，直接對(duì)這種話術(shù)過(guò)濾刪掉，快速修復(fù)，保證產(chǎn)品的安全性。

第三類方法是調(diào) prompt。這種方案一般是在 bug 不太緊急的情況下使用，不要求立即 fix。

例如有些場(chǎng)景對(duì)輸出話術(shù)有要求，比如必須要回答上關(guān)鍵要點(diǎn)，比如機(jī)器人的人設(shè)不能偏離，保證一致性等。

在線下多次測(cè)試已經(jīng) OK 了，但推到線上發(fā)現(xiàn)了漏網(wǎng)之魚，這種就可以通過(guò)調(diào) prompt 來(lái)解決，這個(gè)過(guò)程比較長(zhǎng)，也需要經(jīng)驗(yàn)，所以一般不會(huì)很高效。

最后一類方案才是微調(diào)模型。是不是跟大家想象得不太一樣？

把這個(gè)方案放到最后，原因有兩點(diǎn)：

重新訓(xùn)練模型，時(shí)間比較長(zhǎng)，可能需要多次調(diào)優(yōu)。
對(duì)原有結(jié)果有影響，線上系統(tǒng)一般比較復(fù)雜，比如修復(fù)了 A，影響了 B，出現(xiàn)蹺蹺板的情況

所以，一般是有大版本升級(jí)的情況，才會(huì)更新模型。工作中，1，2，3 類的 badcase 會(huì)累積整理，累計(jì)到一個(gè)周期以后，再微調(diào)優(yōu)化模型，然后經(jīng)過(guò)嚴(yán)格的冒煙測(cè)試，回歸測(cè)試和灰度測(cè)試以后，才發(fā)布到線上。

最后做一個(gè)總結(jié)吧，線上問(wèn)題多種多樣，科技含量最高的方案不一定是最好的，實(shí)際處理時(shí)要考慮幾個(gè)方面，問(wèn)題的緊急性，是否對(duì)現(xiàn)有模塊有影響，修復(fù)所費(fèi)的成本，對(duì)系統(tǒng)的負(fù)擔(dān)等。

“奧卡姆剃刀”是合適的指導(dǎo)準(zhǔn)則，復(fù)雜不一定是最好的，即思維經(jīng)濟(jì)性原則，如無(wú)必要，勿增實(shí)體。

本文轉(zhuǎn)載自 ??丁師兄大模型??，作者：丁師兄

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

騰訊混元大模型在研發(fā)安全漏洞修復(fù)的實(shí)踐

381972426 ? 5597瀏覽 ? 0回復(fù)
LangChain百萬(wàn)代碼全解析：這個(gè)模型胃口很大！

ermulong ? 3499瀏覽 ? 0回復(fù)
編程表現(xiàn)比肩ChatGPT，這個(gè)新模型能力很強(qiáng)大

Syrupup ? 4155瀏覽 ? 0回復(fù)
如何分析和修復(fù)LLM應(yīng)用程序中的錯(cuò)誤

51CTO內(nèi)容精選 ? 4484瀏覽 ? 0回復(fù)
阿里國(guó)際發(fā)布首個(gè)大規(guī)模商用翻譯大模型Marco，效果超Google、DeepL等，全球開(kāi)放！

51CTO技術(shù)棧 ? 5074瀏覽 ? 0回復(fù)
Kimi 我的神，它終于更新了！這個(gè)探索版，有點(diǎn)牛！

wsp_ping ? 4424瀏覽 ? 0回復(fù)
怎么設(shè)計(jì)一個(gè)自己的大模型？設(shè)計(jì)一個(gè)大模型需要哪些能力？

AI探索時(shí)代 ? 4798瀏覽 ? 0回復(fù)
Kaggle大模型競(jìng)賽優(yōu)勝方案總結(jié)與思考

arnoldzhw ? 5530瀏覽 ? 0回復(fù)
吳恩達(dá)開(kāi)源AISuite，簡(jiǎn)單高效調(diào)用多個(gè)大模型

小虎哦哦 ? 4918瀏覽 ? 0回復(fù)
精通大型語(yǔ)言模型的準(zhǔn)確性：如何測(cè)試、檢測(cè)和修復(fù)AI模型的幻覺(jué)

丟翅膀的魚 ? 6179瀏覽 ? 0回復(fù)
怎么學(xué)習(xí)設(shè)計(jì)和訓(xùn)練一個(gè)大模型——也就是神經(jīng)網(wǎng)絡(luò)？

AI探索時(shí)代 ? 2980瀏覽 ? 0回復(fù)
這個(gè)開(kāi)源項(xiàng)目厲害了：一鍵部署DeepSeek R1！

NLP前沿1 ? 7621瀏覽 ? 0回復(fù)
我試了，結(jié)果讓我詫異.....

AI博物院 ? 9895瀏覽 ? 0回復(fù)
這個(gè)問(wèn)題DeepSeek也整不會(huì)了！

51CTO技術(shù)棧 ? 4554瀏覽 ? 0回復(fù)
AI大模型本地化方案：Xinference 本地運(yùn)行大模型

風(fēng)云2002_1 ? 6512瀏覽 ? 0回復(fù)
部署一個(gè)大模型，到底需要多大機(jī)器？

hm673c38238a021 ? 6478瀏覽 ? 0回復(fù)
3步輕松微調(diào)Qwen3，本地電腦就能搞，這個(gè)方案可以封神了！【喂飯級(jí)教程】

袋鼠帝AI客棧 ? 5569瀏覽 ? 0回復(fù)
字節(jié)的這個(gè)新模型，牛了！

NLP前沿1 ? 3852瀏覽 ? 0回復(fù)
這個(gè)AI打通Midjourney+Wan2.5

沃垠AI ? 4409瀏覽 ? 0回復(fù)

丁師兄大模型

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepSeek為何要做MoE負(fù)載均衡？ 2025-06-12 00:24:35發(fā)布
DeepSeek如何用MTP逆天改命？ 2025-04-30 06:23:53發(fā)布

熱門推薦

別再怪AI“聽(tīng)不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開(kāi)發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對(duì)話中的問(wèn)題改寫(優(yōu)化)方法—使用歷史記錄改寫問(wèn)題 0回復(fù)

DeepSeek 成長(zhǎng)史：從量化投資到 AI 革命的一個(gè) “非主流” 量化大佬的 AI 夢(mèng) 0回復(fù)

上一篇： SFT loss計(jì)算的那些坑，完美避開(kāi)?。?！

下一篇：新來(lái)的妹子不懂大模型中的token！已勸退...

社區(qū)精華內(nèi)容

目錄