偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<kbd id="wnfyk"></kbd>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書

發(fā)布于 2024-4-7 09:36

瀏覽

0收藏

離大譜了，

弱智吧登上正經(jīng)AI論文，還成了

最好的中文訓(xùn)練數(shù)據(jù)？？

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

具體來說，使用弱智吧數(shù)據(jù)訓(xùn)練的大模型，跑分超過百科、知乎、豆瓣、小紅書等平臺，甚至是研究團(tuán)隊(duì)精心挑選的數(shù)據(jù)集。

?

在問答、頭腦風(fēng)暴、分類、生成、總結(jié)、提取等8項(xiàng)測試中取得最高分。

?

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

沒錯(cuò)，論文中的Ruozhiba就是指百度貼吧弱智吧，一個(gè)充滿荒謬、離奇、不合常理發(fā)言的中文社區(qū)，畫風(fēng)通常是這樣的：

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

最離譜的是，弱智吧AI代碼能力也超過了使用專業(yè)技術(shù)問答社區(qū)思否數(shù)據(jù)訓(xùn)練的AI，這下吧友自己都鬧不明白了。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

其他平臺圍觀網(wǎng)友也紛紛蚌埠住。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

這項(xiàng)研究來自中科院深圳先進(jìn)技術(shù)研究院、中科院自動(dòng)化研究所，滑鐵盧大學(xué)等眾多高校、研究機(jī)構(gòu)聯(lián)合團(tuán)隊(duì)。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

作者之一也現(xiàn)身評論區(qū)，透露使用弱智吧數(shù)據(jù)訓(xùn)練AI屬于靈機(jī)一動(dòng)，以前只用來測試。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

弱智吧數(shù)據(jù)究竟如何達(dá)成這一成就，具體到論文中看。

弱智發(fā)言成指令微調(diào)神器

這項(xiàng)研究起初為解決中文大模型訓(xùn)練中的諸多問題：

中文數(shù)據(jù)集很多是從英文翻譯過來的，沒有很好地契合中文的語言習(xí)慣和文化背景
不少數(shù)據(jù)集是用AI生成的，質(zhì)量難以保證，容易出現(xiàn)事實(shí)性錯(cuò)誤
即使是人工標(biāo)注的數(shù)據(jù)集，也存在數(shù)據(jù)量小、覆蓋領(lǐng)域不全面等問題

為了解決這些痛點(diǎn)，團(tuán)隊(duì)從中文互聯(lián)網(wǎng)的各種知識源頭直接收集數(shù)據(jù)，比如知乎、豆瓣、百科、小紅書等，經(jīng)過一系列嚴(yán)格的清洗和人工審核，打造成高質(zhì)量、多樣化的中文指令微調(diào)數(shù)據(jù)集COIG-CQIA。

除了探索不同數(shù)據(jù)源的作用，團(tuán)隊(duì)還專門從中抽取出一個(gè)精華子集CQIA-Subset。

在眾多數(shù)據(jù)來源中，弱智吧成了最特別的一個(gè)。

由500個(gè)點(diǎn)贊最高的帖子標(biāo)題+人工或GPT-4的回復(fù)組成指令微調(diào)數(shù)據(jù)集，經(jīng)過人工審核后，最終留下了240組指令-回復(fù)數(shù)據(jù)對。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

分別用各種數(shù)據(jù)集訓(xùn)練零一萬物Yi系列開源大模型，在BELLE-Eval測試集上使用GPT-4評分得到結(jié)果。

在規(guī)模較小的Yi-6B模型上，純?nèi)踔前砂姹究偡峙琶谌?，還不算太突出。

看來小模型還沒能領(lǐng)悟弱智的精髓。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

到了Yi-34B，弱智吧版本表現(xiàn)就一騎絕塵了。

只有在改寫和數(shù)學(xué)任務(wù)上沒能取得最高分，但成績也比較靠前。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

另外，在安全評估上弱智吧版本也能排上第二。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

對于這類現(xiàn)象，研究人員在分析中也給出簡單猜測：

可能是弱智吧問題

增強(qiáng)了AI的邏輯推理能力，從而使指令遵循任務(wù)受益。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

當(dāng)然弱智吧并不是這項(xiàng)研究的全部，它的真正貢獻(xiàn)在于為中文大模型開發(fā)提供了一個(gè)高質(zhì)量的指令微調(diào)數(shù)據(jù)集COIG-CQIA。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

通過對各種中文互聯(lián)網(wǎng)數(shù)據(jù)源的探索，這項(xiàng)研究為構(gòu)建中文指令數(shù)據(jù)集提供了很多有益的啟示。比如社交媒體數(shù)據(jù)雖然開放多樣，但也存在不少有害信息風(fēng)險(xiǎn)；而百科類數(shù)據(jù)專業(yè)性強(qiáng)，但覆蓋面可能不夠廣。

弱智吧上大分

這項(xiàng)研究一發(fā)，網(wǎng)友集體笑不活。除了“XSWL、思路開闊了”嬸兒的純圍觀，也有網(wǎng)友認(rèn)真討論起了弱智吧有如此奇效的原因。

大伙兒都比較認(rèn)可的一個(gè)原因是弱智吧題目的“異質(zhì)”。

像腦筋急轉(zhuǎn)彎，增加了指令多樣性，所以提升了模型最終性能：

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

通用數(shù)據(jù)集多半已經(jīng)在pretrain階段見過了，再訓(xùn)一遍只會加重overfitting。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

另一個(gè)原因是弱智吧數(shù)據(jù)文本質(zhì)量很高，用詞準(zhǔn)確且簡潔。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

千言萬語匯成一句話：把弱智吧只當(dāng)簡單的段子合集真的是嚴(yán)重低估了它的價(jià)值！

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

雀食，要不此前弱智吧問題也經(jīng)常被大伙兒用來測試大模型呢。事實(shí)上從ChatGPT誕生之初，弱智吧就深度參與了大模型的發(fā)展，可以算是這一波AI浪潮的重要見證者了。

一開始只是網(wǎng)友拿來拷打AI，搞搞節(jié)目效果。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

后來大家發(fā)現(xiàn)，弱智吧問題中充滿陷阱，剛好可以用來分辨AI能力高低。

還記得23年初那會兒，各家大模型第一版還不太能很好應(yīng)對這類問題，如2023年3月的文心一言：

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

后續(xù)版本也漸入佳境了，如2023年8月的文心一言：

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

直到今天，弱智吧問題都是每個(gè)新發(fā)布大模型都必須要過的一關(guān)，被戲稱為弱智吧Benchmark。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

△

秘塔寫作貓

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

△

Inspo

再后來，AI公司們自己也開始重視起來，如百度官方就搞過聯(lián)動(dòng)直播。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

當(dāng)初網(wǎng)友為了調(diào)戲大模型專門搜集的弱智吧問題測試集，沒想到有一天也能搖身一變，成了訓(xùn)練集。

弱智吧竟成最佳中文AI訓(xùn)練數(shù)據(jù)？！中科院等：8項(xiàng)測試第一，遠(yuǎn)超知乎豆瓣小紅書-AI.x社區(qū)

本文轉(zhuǎn)自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/iq5lGyh9Y5P7NXLUS3-giA??

標(biāo)簽

模型訓(xùn)練

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

唯一保住OpenAI董事會席位、美版知乎CEO發(fā)聲：Quora確保頂尖網(wǎng)站地位的招數(shù)、OpenAI不是競爭對手

51CTO技術(shù)棧 ? 3085瀏覽 ? 0回復(fù)
14 項(xiàng)任務(wù)測下來，GPT4V、Gemini等多模態(tài)大模型竟都沒什么視覺感知能力？

輕薄滴假象 ? 2838瀏覽 ? 0回復(fù)
極佳、中科院等9機(jī)構(gòu)聯(lián)合首發(fā) | 3萬字長文全面解析世界模型(內(nèi)容生成/自動(dòng)駕駛等)

angel ? 6286瀏覽 ? 0回復(fù)
37項(xiàng)SOTA！全模態(tài)預(yù)訓(xùn)練范式MiCo：理解任何模態(tài)并學(xué)習(xí)通用表示｜港中文&中科院

Crystalcxt ? 2972瀏覽 ? 0回復(fù)
CVPR 2024最佳論文獎(jiǎng)公布！生成式AI成最大贏家

angel ? 6588瀏覽 ? 0回復(fù)
考考大模型視頻理解能力，中科院人大百川提出新基準(zhǔn)合成框架

Crystalcxt ? 2767瀏覽 ? 0回復(fù)
百萬級高質(zhì)量視頻數(shù)據(jù)集發(fā)布，登頂抱抱臉數(shù)據(jù)集排行榜，中科大&上海AI Lab等出品

Crystalcxt ? 3066瀏覽 ? 0回復(fù)
LG開源韓語大模型Exaone 3.0，8萬億token訓(xùn)練數(shù)據(jù)

Aceryt ? 2637瀏覽 ? 0回復(fù)
小紅書開源StoryMaker：個(gè)性化圖像生成模型，實(shí)現(xiàn)角色一致性與背景變化的完美結(jié)合

angel ? 7332瀏覽 ? 0回復(fù)
小紅書翻譯緊急上線，見證歷史：大模型翻譯首次上線C端應(yīng)用！AI竟自稱是GPT-4?

51CTO技術(shù)棧 ? 2525瀏覽 ? 0回復(fù)
小紅書 NoteLLM：用于筆記推薦和標(biāo)簽生成的 LLM

amei2000go ? 6241瀏覽 ? 0回復(fù)
世界第一位AI程序員Devin：20項(xiàng)任務(wù)只完成了3項(xiàng)！14項(xiàng)任務(wù)徹底失?。?/a>

51CTO技術(shù)棧 ? 2091瀏覽 ? 0回復(fù)
RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%

PaperAgent ? 3688瀏覽 ? 0回復(fù)
小紅書 NoteLLM-2：用于推薦的多模態(tài)表征

amei2000go ? 2566瀏覽 ? 0回復(fù)
中科院、百度提出新架構(gòu)：突破參數(shù)限制，實(shí)現(xiàn)高效推理

Aceryt ? 1923瀏覽 ? 0回復(fù)
騰訊&港中文發(fā)布影視后期黑科技！VideoPainter：視頻編輯修復(fù)8項(xiàng)SOTA!

angel ? 1971瀏覽 ? 0回復(fù)
PaRT：小紅書團(tuán)隊(duì)讓AI平均對話時(shí)長顯著提升21.77%

大語言模型論文跟蹤 ? 1122瀏覽 ? 0回復(fù)
破解 RL 訓(xùn)練崩潰難題，快手聯(lián)合中科院、清華、南大提出多模態(tài)獎(jiǎng)勵(lì)模型 R1-Reward！

快手技術(shù) ? 538瀏覽 ? 0回復(fù)
NVIDIA：Blackwell GPU MXFP8 預(yù)訓(xùn)練最佳實(shí)踐

amei2000go ? 1042瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

何愷明開辟分形圖像生成新范式！計(jì)算效率提高4000倍，首次實(shí)現(xiàn)高分辨率逐像素生成 2025-02-26 11:59:41發(fā)布
達(dá)摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測：真·超DS！ 1回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

圖像編輯革命！FLUX.1 Kontext [dev]震撼開源：挑戰(zhàn)GPT-4o的圖像編輯 0回復(fù)

下一篇： 10萬美元訓(xùn)出Llama-2級大模型！全華人打造新型MoE，賈揚(yáng)清SD前CEO圍觀

社區(qū)精華內(nèi)容

目錄

<s id="analb"><label id="analb"></label></s>

<u id="analb"><li id="analb"><option id="analb"></option></li></u>

<strong id="analb"><strong id="analb"></strong></strong>

<nav id="analb"></nav>