偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

“梗王”大模型,靠講笑話登上CVPR | 中山大學

人工智能
這項研究正是來自中山大學HCP實驗室林倞教授團隊、Sea AI Lab和哈佛大學等單位,主打的就是打破常規(guī)思維思考(Think Outside the Box),探索多模態(tài)大模型的創(chuàng)造力。

誰能想到,只是讓大模型講笑話,論文竟入選了頂會CVPR

沒開玩笑,這還真真兒的是一項正兒八經(jīng)的研究。

例如看下面這張圖,如果讓你根據(jù)它來講個笑話或梗,你會想到什么?

現(xiàn)在的大模型看完后會說:

腦子短路。

再看一眼 蜘蛛俠 的海報,大模型會配一句“剛擦的玻璃不能弄臟”。

圖片

李云龍 、 奧本海默 也被玩得飛起:

導師讀了我的論文之后……

真男人不回頭看爆炸。

圖片

還有醬紫的:

圖片

不得不說,大模型這腦洞還是挺大的。

這項研究正是來自中山大學HCP實驗室林倞教授團隊、Sea AI Lab和哈佛大學等單位,主打的就是打破常規(guī)思維思考(Think Outside the Box),探索多模態(tài)大模型的創(chuàng)造力。

圖片

要知道,同樣的圖要是“喂”給ChatGPT(GPT-4)等主流大模型,讓它們講笑話或梗,畫風可并非如此:

圖片

太正經(jīng)了!So boring~~~~

那么中山大學等單位的這個“梗王大模型”,是怎么煉成的呢?

先讓大模型看搞笑的數(shù)據(jù)

在數(shù)據(jù)的選擇上,團隊pick的是來自日本的“大喜利”(Oogiri)創(chuàng)新響應游戲。

“大喜利”本來是指一系列日本傳統(tǒng)戲劇游戲,隨著時代的快速發(fā)展。現(xiàn)代的“大喜利”,目前一般是指一種叫Tonchi (頓智)的游戲,通常以游戲節(jié)目或智力問答節(jié)目的形式呈現(xiàn)。

玩家被提供各種多模態(tài)內(nèi)容,可以是簡單的問題、隨機圖像等,然后提示玩家想出幽默的、有創(chuàng)意的反應,以達到令人驚訝的喜劇效果。

例如下面這個“圖文到文”的例子:

圖片

玩家要求閱讀圖像,和上面對應的文字,嘗試想出一段文字填入對應的問號“?”位置,使得整個圖文可以展示出幽默且有創(chuàng)意的效果。

在第一個例子中,老人向年輕人尋求幫助,從正常的思維來看,可能的填寫方式可以是“請問xxx路怎么走?”或者是“可以帶我回家嗎,我迷路了”之類的。

然而,所給出的“你…你能幫我解開手銬嗎?”的寫法具有沖擊感、幽默感,且看起來確實是這么一回事,讓人忍俊不禁。

再看下“圖到文”的例子:

圖片

玩家要求看圖配文,并使得圖文搭配起來具有幽默效果。

這張圖看起來是一個很普通的拖車的圖片(需要注意的是,在“大喜利”游戲中,一般圖片都是很普通的日常圖片)。

配文“快讓開!我的兄弟傷得很嚴重”讓傾斜著身體45°向上的車看起來像是一個奄奄一息的車子;在道路上快速的馳騁也確實體現(xiàn)了位于下方的車很著急,急著送兄弟去醫(yī)院。

還有第三種“文到文”的例子:

圖片

玩家被要求根據(jù)所給的文字進行回復,使得回復和問題合在一起具備幽默感。

這個例子中的回復似乎在調(diào)侃程序員的日常工作主要就是代碼的“復制+黏貼”(注:CV工程師除了可以表示computer vision工程師也可以表示ctrl+c/ctrl+v工程師 )。

這項工作主要關注的就是這三種類型的“大喜利”游戲,相關數(shù)據(jù)Oogiri-GO 如下表所示,含中英日三種語言:

圖片

至于為什么要選擇“大喜利”這個游戲,是因為團隊認為它是用于探索多模態(tài)大模型創(chuàng)新能力的理想平臺。具體原因如下:

  • “大喜利”游戲是天然的創(chuàng)新響應任務。如上所提到的,現(xiàn)代“大喜利”也被稱為Tonchi (頓智)?!邦D”在日文和中文中都表示“突然”,而“智”的意思是“智力、洞察力或直覺”,該游戲天然地要求玩家給出令人眼前一亮、靈光一閃的創(chuàng)新響應;
  • “大喜利”的數(shù)據(jù)格式是高度合適的。不管是“圖文到文”、“圖到文”還是“文到文”,這些類型都天然地和目前多模特大模型的輸入輸出格式吻合,即輸入為“圖文”,輸出僅為“文”。
  • “大喜利”數(shù)據(jù)質量高。創(chuàng)新是一件很難的事情,即使是人類,因此能作為“創(chuàng)新”相關的數(shù)據(jù)集并不多。鑒于該游戲長期在互聯(lián)網(wǎng)上非常活躍(在中文社區(qū)中,一般也叫日式神吐槽/冷吐槽),而且?guī)в写罅奎c評數(shù)據(jù),比如點贊數(shù)等等。正好積累了大量高質量人類創(chuàng)新幽默響應可以被用于研究。

再讓大模型打破常規(guī)思考

傳統(tǒng)的鏈式思考(Chain-of-Thought,CoT)方法是一種順序思考過程,通過逐步推理指導大模型進行邏輯推理,每個后續(xù)的思考都建立在前一個思考的基礎上:

圖片

這一思考過程一定程度上確保了精確性和嚴謹性,但對于創(chuàng)造性問題表現(xiàn)不佳。

因此,團隊探索了一種新的非順序、創(chuàng)造性思維范式——跳躍思維Leap-of-Thought(LoT)。

圖片

這種范式涉及到思考關聯(lián)性和知識跳躍。遠距離的思考也被認為是聯(lián)想。

與CoT強調(diào)邏輯緊密的思維鏈不同,LoT強調(diào)打破常規(guī)思維思考問題,激發(fā)模型的創(chuàng)造力。

基于此,團隊在Oogiri-GO數(shù)據(jù)集基礎之上,進一步提出了一套激發(fā)多模態(tài)大模型創(chuàng)造力的訓練方法CLoT。

圖片

具體而言,CLoT包括兩個階段。

首先是關聯(lián)性指令微調(diào)。

在這一階段,本文設計生成式和判別式模板,將Oogiri-GO數(shù)據(jù)集轉換為指令微調(diào)的訓練數(shù)據(jù),用于訓練多模態(tài)大模型,使得模型具備初步的創(chuàng)新響應能力。

其次是探索性自我調(diào)整。

在這一階段中,本文首先通過設計遠關聯(lián)的條件詞,促使(1)中的模型生成多樣化且與輸入遠關聯(lián)的回答,并設計篩選流程,獲得可靠的新LoT數(shù)據(jù)。隨后,新數(shù)據(jù)被轉換成指令微調(diào)的訓練數(shù)據(jù),用于進一步微調(diào)模型。

這一階段可以再細分為兩個步驟:

  • 探索性遠程關聯(lián):這一步驟鼓勵LLM在給定的弱關聯(lián)條件下產(chǎn)生創(chuàng)新的回應。通過這種方式,LLM學習在看似不相關的概念之間建立聯(lián)系,從而生成多樣化的創(chuàng)意內(nèi)容。
  • 自我精煉:在探索性遠程關聯(lián)的基礎上,通過設計一系列篩選流程,收集到的創(chuàng)意回應被用來進一步訓練LLM。這樣做可以提高LLM在處理創(chuàng)造性任務時的表現(xiàn),使其能夠生成更高質量和多樣性的內(nèi)容。

性能評估

為了盡可能全面評估CLoT,這項研究基于Oogiri-GO數(shù)據(jù)集,設計了選擇題和排序題作為量化評估方式。

實驗結果表明,CLoT能夠顯著提高多模態(tài)大模型(如Qwen和CogVLM)的性能,顯著超越包括GPT4v在內(nèi)的先進模型。

另外,與其他先進推理框架CoT等相比,在各項量化指標下也是有顯著優(yōu)勢的。

圖片
圖片
圖片

此外,研究團隊還通過用戶調(diào)查,證實了CLoT幫助模型生成了更好的幽默內(nèi)容。

圖片

研究團隊還考慮到了CLoT的泛化性,用“看云猜物CGG”和“發(fā)散思維測試DAT”兩個其他任務評估CLoT的性能,實驗結果顯示CLoT相對于基準模型具有更好的準確度,說明CLoT具備不錯的泛化能力。

DAT是一種用于評估人類聯(lián)想創(chuàng)造能力的測試。

團隊介紹

中山大學人機物智能融合實驗室 (HCP Lab) 由林倞教授于 2010 年創(chuàng)辦,近年來在多模態(tài)內(nèi)容理解、因果及認知推理、具身學習等方面取得豐富學術成果,數(shù)次獲得國內(nèi)外科技獎項及最佳論文獎,并致力于打造產(chǎn)品級的AI技術及平臺。

論文:https://arxiv.org/abs/2312.02439。

Project:https://zhongshsh.github.io/CLoT/。

Code:https://github.com/sail-sg/CLoT。

責任編輯:姜華 來源: 量子位
相關推薦

2021-02-24 15:38:37

數(shù)據(jù)語言架構

2023-03-14 14:06:52

訓練模型

2024-01-29 06:40:00

AI模型

2009-05-19 11:46:21

2020-11-05 16:21:15

中山大學

2024-02-29 13:55:00

模型訓練

2016-12-24 00:08:11

教育信息化

2023-08-22 13:20:00

模型訓練

2024-12-20 09:39:05

2014-11-13 10:17:30

中山大學新炬網(wǎng)絡學院大數(shù)據(jù)技術

2022-11-04 17:02:31

AI模型

2016-07-15 09:53:27

太一星晨

2015-11-18 17:12:25

太一星晨/應用交付

2021-11-16 15:37:43

AI 數(shù)據(jù)人工智能

2024-03-28 13:19:05

AI數(shù)據(jù)

2015-10-15 19:23:29

負載均衡應用交付太一星晨

2024-01-12 13:10:06

AI數(shù)據(jù)

2023-10-30 17:23:54

數(shù)據(jù)模型
點贊
收藏

51CTO技術棧公眾號