小米殺入推理大模型賽道!MiMo-7B以小搏大,數(shù)學(xué)代碼雙殺32B參數(shù)巨頭
昨天科技圈被小米的一條重磅消息刷屏了——全球首個(gè)專(zhuān)為推理設(shè)計(jì)的大型開(kāi)源模型 Xiaomi MiMo 正式亮相!更令人震驚的是,這個(gè)僅 70億參數(shù) 的小模型,在數(shù)學(xué)推理(AIME24-25)和代碼競(jìng)賽(LiveCodeBench v5)測(cè)評(píng)中,直接碾壓了OpenAI閉源的 o1-mini 和阿里開(kāi)源的 QwQ-32B-Preview。
在DeepSeek-R1掀起強(qiáng)化學(xué)習(xí)(RL)熱潮的當(dāng)下,小米用MiMo-7B交出了一份驚艷答卷:
數(shù)學(xué)推理:AIME24-25測(cè)試中,MiMo解題準(zhǔn)確率遠(yuǎn)超同賽道選手,甚至能處理復(fù)雜微積分和幾何證明;代碼能力:LiveCodeBench v5競(jìng)賽級(jí)題目中,它生成的代碼邏輯嚴(yán)謹(jǐn),調(diào)試效率直逼人類(lèi)工程師:
能以小模型搏大場(chǎng)面,背后是小米AI團(tuán)隊(duì)的兩板斧:
在預(yù)訓(xùn)練階段,小米合成了海量數(shù)學(xué)論文、編程題庫(kù)和邏輯謎題,通過(guò)三階段漸進(jìn)式訓(xùn)練(從簡(jiǎn)單到復(fù)雜),讓模型啃透25T tokens的“推理硬菜”。而在后訓(xùn)練階段,則通過(guò)強(qiáng)化學(xué)習(xí)優(yōu)化效果:
小米這次不玩“閉源炫技”,而是直接把MiMo全系列模型扔上了HuggingFace(鏈接見(jiàn)文末),開(kāi)發(fā)者可免費(fèi)商用。
小米的野心:AGI長(zhǎng)征才剛開(kāi)始
盡管MiMo-7B已展現(xiàn)驚人潛力,但小米清醒地表示:2025年只是大模型下半場(chǎng)的起點(diǎn),AGI之路道阻且長(zhǎng)。不過(guò),從手機(jī)到汽車(chē)再到AI,這家公司正用實(shí)際行動(dòng)證明——中國(guó)科技企業(yè),完全能在基礎(chǔ)模型層面與全球巨頭掰手腕。
