偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

新版Llama 3 70B反超405B!Meta開(kāi)卷后訓(xùn)練,谷歌馬斯克都來(lái)?yè)岀R

人工智能
有網(wǎng)友感嘆,o1、Llama 3.3和新版Gemini接連發(fā)布,馬斯克的Grok3也要來(lái),還有GPT-4.5初露端倪……這簡(jiǎn)直是最棒的一個(gè)圣誕季。

OpenAI“雙12”剛進(jìn)行到第二天,就把大模型圈攪得好不熱鬧!

一邊是Meta沒(méi)預(yù)告就發(fā)布了Llama 3.3,70B版本就能實(shí)現(xiàn)以前405B的性能。

圖片

另一邊谷歌的Gemini也上線了新的實(shí)驗(yàn)版模型,再一次登上大模型競(jìng)技場(chǎng)榜首。

圖片

有網(wǎng)友感嘆,o1、Llama 3.3和新版Gemini接連發(fā)布,馬斯克的Grok3也要來(lái),還有GPT-4.5初露端倪……這簡(jiǎn)直是最棒的一個(gè)圣誕季。

圖片

Llama 3.3:70B實(shí)現(xiàn)405B效果

Llama 3.3目前只有70B一個(gè)型號(hào)。

但在指令遵循(IFEval)、數(shù)學(xué)(MATH)、推理(GPQA Diamond)等領(lǐng)域,水平都超過(guò)了七月份發(fā)布的Llama 3.1 405B。

在語(yǔ)言(MMLU)、代碼(HumanEval)、長(zhǎng)文本和多語(yǔ)種能力上,成績(jī)也和Llama 3.1 405B比較接近。

而在工具使用(BFCL)上,和405B的差距則顯得稍大一些。

圖片

不過(guò),Llama 3.3的使用成本要比Llama 3.1 405B低得多。

雖然Llama本身是免費(fèi)的,但是各個(gè)大模型平臺(tái)的服務(wù)價(jià)格也可以作為衡量成本的一個(gè)參考。

在Meta合作的平臺(tái)當(dāng)中,Llama 3.3最便宜的價(jià)格是0.1/0.4美元每百萬(wàn)輸入/輸出Token。

而Llama 3.1 405B,則是1美元每百萬(wàn)輸入token,是Llama 3.3的10倍,輸出token為1.8美元,是Llama 3.3的4.5倍。

圖片

Meta生成式AI團(tuán)隊(duì)領(lǐng)導(dǎo)者Ahmad Al-Dahle表示,Llama 3.3能用70B實(shí)現(xiàn)405B的效果,主要是“運(yùn)用了后訓(xùn)練技術(shù)的最新進(jìn)展”,并點(diǎn)名其中包括在線偏好優(yōu)化(online preference optimization)。

圖片

Meta AI官方賬號(hào)也提到,Llama 3.3的進(jìn)步歸功于新的對(duì)齊過(guò)程和在線強(qiáng)化學(xué)習(xí)技術(shù)的進(jìn)步。

圖片

目前,Llama 3.3的模型權(quán)重已在官網(wǎng)和Hugging Face上開(kāi)放下載。

圖片

Gemini迎來(lái)周歲生日

Gemini 1206上線的這天,剛好是Gemini的一周歲生日。

不過(guò),從節(jié)奏和以日期命名的方式來(lái)看,Gemini更像是一次例行更新(上一個(gè)版本是1121)。

當(dāng)然成績(jī)還是很不錯(cuò)的,直接登上了lmsys大模型競(jìng)技場(chǎng)的榜首。

圖片

而且不只是總成績(jī)奪冠,困難提示詞、代碼、數(shù)學(xué)、創(chuàng)意寫(xiě)作等各個(gè)單項(xiàng)排名也都是第一。

圖片

實(shí)際上,Gemini此前有個(gè)1114版本,也當(dāng)了一周的“榜一大哥”,后來(lái)被更新的GPT-4o給比了下去。

現(xiàn)在的最新版本,又讓Gemini重新回到了榜單上的王座。

圖片

此外,谷歌AI Studio產(chǎn)品負(fù)責(zé)人(原OpenAI開(kāi)發(fā)者社區(qū)主管)Logan介紹,Gemini 1206擁有2百萬(wàn)token的上下文窗口,目前可通過(guò)谷歌AI Studio和Gemini API免費(fèi)使用。

圖片

谷歌首席科學(xué)家Jeff Dean表示,取得這樣的成績(jī)是對(duì)Gemini生日最好的慶祝方式。

圖片

不過(guò)也有網(wǎng)友給谷歌潑了盆冷水,表示o1還沒(méi)出現(xiàn)在這個(gè)榜單上,而且GPT-4.5就要來(lái)了,谷歌第一的位置恐怕很快又會(huì)被OpenAI奪走。

圖片

One More Thing

除了谷歌和Meta,馬斯克xAI也被盛傳即將發(fā)布Grok 3。

有網(wǎng)友發(fā)現(xiàn),正在測(cè)試的Grok 2 mini消失了,認(rèn)為這是要發(fā)Grok 3的征兆。

圖片

除了對(duì)Grok 3的猜測(cè),還有一條更確定的消息——此前要充會(huì)員才能用的Grok,現(xiàn)在可以免費(fèi)用了。

不過(guò)免費(fèi)用戶用量比較有限,每?jī)尚r(shí)只能處理10條消息,而圖片分析一天只能處理三張。

圖片

有意思的是,我們?cè)嚵嗽囋儐?wèn)Grok自己,它也表示Grok 3計(jì)劃在這個(gè)月上線。

但抓馬的是,點(diǎn)進(jìn)后面引用的消息源,發(fā)現(xiàn)這名博主也是問(wèn)Grok之后發(fā)的帖子……

圖片

那么,在這個(gè)發(fā)布密集的十二月,你最鐘意或者最期待哪一款產(chǎn)品呢?

參考鏈接:
[1]https://x.com/AIatMeta/status/1865079067390956006。
[2]https://x.com/Ahmad_Al_Dahle/status/1865071436630778109。
[3]https://x.com/lmarena_ai/status/1865080944455225547。

責(zé)任編輯:姜華 來(lái)源: 量子位
相關(guān)推薦

2024-08-26 10:00:00

模型數(shù)據(jù)

2024-07-23 09:20:35

2024-06-05 08:33:29

2024-11-13 15:00:42

2024-11-25 08:10:00

2024-09-09 09:20:00

2024-05-29 14:11:00

2024-04-09 13:21:00

AI開(kāi)源

2024-07-24 13:58:25

2025-01-08 09:30:00

Meta大模型訓(xùn)練

2024-05-30 12:50:05

2025-03-05 08:50:00

模型AI數(shù)據(jù)

2024-04-19 10:32:08

2024-07-24 13:18:17

2022-04-15 10:55:59

Web3反壟斷元宇宙

2024-04-19 08:01:01

Llama 3 8BMeta

2024-08-02 14:53:00

2023-10-11 13:21:12

模型數(shù)據(jù)

2024-07-29 08:19:00

服務(wù)引擎
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)