偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<u id="6stob"></u>

<wbr id="6stob"><nav id="6stob"></nav></wbr>

<bdo id="6stob"></bdo>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

綜述 | 大模型的可控文本生成

發(fā)布于 2024-8-27 12:05

瀏覽

0收藏

大家好，我是劉聰NLP。

大模型已經(jīng)展現(xiàn)出了較強(qiáng)的文本生成能力，但隨著使用場(chǎng)景變得越加復(fù)雜和嚴(yán)格，除了避免生成誤導(dǎo)或不當(dāng)言論內(nèi)容外，往往還希望可以滿足用戶的特殊需求。而可控文本生成就是為了在保持文本生成有用性、流暢性和多樣性的同時(shí)，保證文本符合預(yù)定的控制條件，例如安全性、主題一致性、語(yǔ)言風(fēng)格等。

今天給大家?guī)?lái)一篇綜述，介紹大模型可控文本生成（Controllable Text Generation, CTG）的相關(guān)技術(shù)。

Paper: https://arxiv.org/abs/2408.12599
Github: https://github.com/IAAR-Shanghai/CTGSurvey

以Transformer結(jié)構(gòu)的大模型為重點(diǎn)，關(guān)注為大模型量身定制的CTG方法
探索如何將外部控制條件集成到CTG過(guò)程中、如何定義更有效和有用的文本生成
將CTG任務(wù)分為兩個(gè)類別：內(nèi)容控制（或語(yǔ)言控制/硬控制）和屬性控制（或語(yǔ)義控制/軟控制）
將CTG方法分為兩個(gè)階段：訓(xùn)練階段方法（再訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)）和推理階段（提示工程、潛在空間操縱和解碼時(shí)間干預(yù)）方法。

綜述 | 大模型的可控文本生成-AI.x社區(qū)

可控文本生成的任務(wù)

在CTG領(lǐng)域，任務(wù)可以大致分為兩種類型：內(nèi)容控制（或語(yǔ)言控制/硬控制）和屬性控制（或語(yǔ)義控制/軟控制）。

內(nèi)容控制（或語(yǔ)言控制/硬控制）

結(jié)構(gòu)控制：（1）特定格式：生成符合特定格式要求的文本；（2）組織結(jié)構(gòu)：生成文本具有一定的段落劃分等；（3）長(zhǎng)度控制：生成文本的整體長(zhǎng)度滿足特定要求。
詞匯控制：（1）必填詞：生成文本中必須要包含一組預(yù)定的關(guān)鍵詞；（2）禁止詞：生成文本中機(jī)制出現(xiàn)潛在有害或不適當(dāng)?shù)男g(shù)語(yǔ)。

屬性控制（或語(yǔ)義控制/軟控制）
安全控制：（1）去毒：生成文本應(yīng)避免出現(xiàn)任何形式的有害內(nèi)容；（2）遵守法律法規(guī)：生成文本應(yīng)遵守所有適用的法律法規(guī)要求，例如隱私法、版權(quán)法等。
情緒控制：生成文本需要具有明確的情感傾向，例如積極、消極或中立。
風(fēng)格控制：（1）通用樣式：通用樣式控制保證生成的文本滿足特定場(chǎng)合和行業(yè)的需求；（2）個(gè)人風(fēng)格：主要涉及生成模仿特定寫作風(fēng)格、個(gè)人習(xí)慣表達(dá)、個(gè)人偏好性的文本。
主題控制：生成文本嚴(yán)格遵循指定的主題，使內(nèi)容與目標(biāo)受眾的預(yù)期知識(shí)和興趣保持一致。

可控文本生成的方法

CTG方法根據(jù)干預(yù)模型生成的階段分別為訓(xùn)練階段和推理階段。

綜述 | 大模型的可控文本生成-AI.x社區(qū)

綜述 | 大模型的可控文本生成-AI.x社區(qū)

訓(xùn)練階段

再訓(xùn)練：當(dāng)預(yù)訓(xùn)練模型不充分或需要修改模型架構(gòu)時(shí)，使用專門設(shè)計(jì)的控制條件數(shù)據(jù)集從頭開始訓(xùn)練模型，以更好地適應(yīng)這些控制需求。

綜述 | 大模型的可控文本生成-AI.x社區(qū)

微調(diào)：利用較少的數(shù)據(jù)和計(jì)算資源，通過(guò)專門的數(shù)據(jù)集將所需的控制屬性合并到模型參數(shù)中來(lái)調(diào)整預(yù)訓(xùn)練模型。

綜述 | 大模型的可控文本生成-AI.x社區(qū)

強(qiáng)化學(xué)習(xí)：采用獎(jiǎng)勵(lì)信息引導(dǎo)模型輸出特定控制條件的文本。

綜述 | 大模型的可控文本生成-AI.x社區(qū)

預(yù)測(cè)階段

提示工程：通過(guò)修改輸入提示來(lái)指導(dǎo)模型的輸出。綜述 | 大模型的可控文本生成-AI.x社區(qū)

潛在空間操縱：通過(guò)調(diào)整模型隱藏層內(nèi)的激活狀態(tài)來(lái)控制生成的文本。

解碼干預(yù)：通過(guò)修改生成輸出的概率分布或在解碼過(guò)程中應(yīng)用特定規(guī)則來(lái)影響Token的選擇，以改變輸出文本，包括分類器引導(dǎo)、類條件語(yǔ)言模型、基于能量的模型、模型自反饋和外部知識(shí)。綜述 | 大模型的可控文本生成-AI.x社區(qū)

可控文本生成的評(píng)估

CTG任務(wù)的評(píng)估可分為自動(dòng)評(píng)估、人工評(píng)估和基于LLM的評(píng)估三種。

綜述 | 大模型的可控文本生成-AI.x社區(qū)

自動(dòng)評(píng)估

一般指標(biāo)：基于N-Gram重疊的指標(biāo)、基于語(yǔ)言模型的指標(biāo)、基于距離的指標(biāo);

特殊任務(wù)指標(biāo)：情感、話題、毒性；

人工評(píng)估
流暢度
連貫性
話題性
質(zhì)量情況
屬性相關(guān)度
LLM評(píng)估

目前可控文本生成的評(píng)測(cè)榜單主要包括：CTRLEval、ConGenBench、 CoDI-Eval、FOFO。

本文轉(zhuǎn)載自?? NLP工作站??，作者：劉聰NLP

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

基于圖增強(qiáng)的大模型可控生成框架

kcoufee ? 4304瀏覽 ? 0回復(fù)
CVPR 2024 Highlight | 讓SD乖乖學(xué)會(huì)文本生360°全景！PanFusion 強(qiáng)勢(shì)來(lái)襲！

angel ? 7008瀏覽 ? 0回復(fù)
TAVGBench: 文本生成語(yǔ)音-視頻最新基準(zhǔn)

angel ? 4970瀏覽 ? 0回復(fù)
騰訊AI新研究打破長(zhǎng)文本生成模型限制，序列并行技術(shù)再突破

AI論文解讀 ? 8507瀏覽 ? 0回復(fù)
開源音頻模型Stable Audio Open，文本生成47秒高清音效

Aceryt ? 6686瀏覽 ? 0回復(fù)
浙大、螞蟻集團(tuán)推出MaPa：文本生成超真實(shí)3D模型

Aceryt ? 4452瀏覽 ? 0回復(fù)
上科大、影眸聯(lián)合提出DressCode：從文本生成3D服裝板片

輕薄滴假象 ? 5327瀏覽 ? 0回復(fù)
大語(yǔ)言模型知識(shí)沖突的綜述

sbf_2000 ? 6132瀏覽 ? 0回復(fù)
僅需1分鐘，文本生成高質(zhì)量3D模型—Meta 3D-Gen

Aceryt ? 5142瀏覽 ? 0回復(fù)
Midjourney大更新，細(xì)節(jié)最強(qiáng)文本生圖片模型來(lái)啦！

Aceryt ? 4023瀏覽 ? 0回復(fù)
大模型技術(shù)細(xì)節(jié)——大模型之文本生成與文檔總結(jié)

AI探索時(shí)代 ? 8287瀏覽 ? 0回復(fù)
面向大語(yǔ)言模型的檢索增強(qiáng)生成(RAG)技術(shù)：綜述

angel ? 6855瀏覽 ? 0回復(fù)
RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索

PaperAgent ? 4173瀏覽 ? 0回復(fù)
多模態(tài)大模型能力評(píng)測(cè)基準(zhǔn)全面綜述：理解、推理、生成、應(yīng)用、趨勢(shì)

十一月雨_55 ? 1.3w瀏覽 ? 0回復(fù)
你知道大模型聊天補(bǔ)全和文本生成的區(qū)別嗎？

AI探索時(shí)代 ? 5343瀏覽 ? 0回復(fù)
關(guān)于兩次大模型文本生成的嘗試，以及由此帶來(lái)的思考

AI探索時(shí)代 ? 3005瀏覽 ? 0回復(fù)
文本生成無(wú)限長(zhǎng)視頻，無(wú)需任何訓(xùn)練

Aceryt ? 3423瀏覽 ? 0回復(fù)
2025首篇關(guān)于多模態(tài)大模型在富文本圖像理解上的全面研究綜述

PaperAgent ? 7518瀏覽 ? 0回復(fù)
大語(yǔ)言模型增強(qiáng)的文本到 SQL 生成：綜述

AIGC前沿技術(shù)追蹤 ? 3994瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepSeek又開源，這次是OCR模型！附論文解讀！ 2025-10-21 00:36:13發(fā)布
美團(tuán)龍貓?jiān)匍_源LongCat-Flash-Thinking模型，細(xì)節(jié)滿滿！ 2025-09-24 07:07:05發(fā)布

熱門推薦

DeepSeek又開源，這次是OCR模型！附論文解讀！ 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

上一篇：大模型是泡沫嗎？

下一篇：大模型微調(diào)終極指南

社區(qū)精華內(nèi)容

目錄

<em id="lvr5f"></em>