偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

擊敗DeepSeek-R1！豆包新推理模型僅用前者參數(shù)量1/3！還將開源兩個(gè)基準(zhǔn)，瞄準(zhǔn)通用推理能力！

原創(chuàng) 精選

2025-04-11 14:54:44

Seed-Thinking-v1.5 在數(shù)學(xué)、科學(xué)和邏輯推理等“硬核”任務(wù)中表現(xiàn)穩(wěn)定：在 AIME 2024 上取得了 86.7 分，在 Codeforces 上達(dá)到 55.0 分，在 GPQA 上達(dá)到 77.3 分，展現(xiàn)出在 STEM 領(lǐng)域和編程任務(wù)中的出色推理表現(xiàn)。

剛剛，字節(jié)旗下的豆包團(tuán)隊(duì)發(fā)布了他們最新的推理模型Seed-Thinking-v1.5！

亮點(diǎn)很突出：200B參數(shù)擊敗DeepSeek R1(671B),不到后者參數(shù)量的三分之一！

與其他最新的超大杯推理模型相比，Seed-Thinking-v1.5 是一個(gè)相對(duì)小型的專家混合（MoE）模型——激活參數(shù)為 20B，總參數(shù)規(guī)模為 200B。

Seed-Thinking-v1.5 在數(shù)學(xué)、科學(xué)和邏輯推理等“硬核”任務(wù)中表現(xiàn)穩(wěn)定：在 AIME 2024 上取得了 86.7 分，在 Codeforces 上達(dá)到 55.0 分，在 GPQA 上達(dá)到 77.3 分，展現(xiàn)出在 STEM 領(lǐng)域和編程任務(wù)中的出色推理表現(xiàn)。

除了推理任務(wù)，該方法還展現(xiàn)出對(duì)多種任務(wù)的優(yōu)秀泛化能力。例如，在非推理任務(wù)上的勝率比 DeepSeek R1 高出 8%，表明其適用范圍更廣。

此外，為了更好評(píng)估模型通用推理能力，字節(jié)專門開發(fā)了兩個(gè)內(nèi)部基準(zhǔn)：BeyondAIME 和 Codeforces。這兩個(gè)基準(zhǔn)之后會(huì)開源，以支持后續(xù)研究。

報(bào)告地址：https://github.com/ByteDance-Seed/Seed-Thinking-v1.5

責(zé)任編輯：武曉燕來(lái)源： 51CTO技術(shù)棧

STEM DeepSeek-R 豆包

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<legend id="d7ipv"><track id="d7ipv"></track></legend><style id="d7ipv"></style>