2小時(shí)登頂全球最強(qiáng)開源模型!Qwen3力壓DeepSeek-R1和OpenAI o1,登頂開源王座!
最近,阿里Qwen3 正式開源,兩小時(shí)就狂攬17k星,直接登頂全球最強(qiáng)開源模型,暴擊DeepSeek-R1和OpenAI o1,中國AI的牌面支棱起來了!
這次開源的Qwen3主要有以下核心亮點(diǎn):
1?? 混合推理模式:首創(chuàng)非思考模式+慢思考雙模式:對于追求速度的問題,可使用非思考模式實(shí)現(xiàn)秒速回應(yīng),遇到復(fù)雜任務(wù)則轉(zhuǎn)為慢思考模式,進(jìn)行深度推演;
2?? 低成本高性能:Qwen3采用36萬億token預(yù)訓(xùn)練。并且在數(shù)學(xué)能力方面,Qwen3在AIME25 中獲得81.5分;代碼能力同樣很強(qiáng):在LiveCodeBench中以 70+分全面碾壓其他大模型。
性能大幅提升的同時(shí),Qwen3 的部署成本還大幅下降,僅需 4 張 H20 即可部署滿血版,顯存占用僅為性能相近模型的三分之一,在手機(jī)端也能絲滑運(yùn)行;
3?? 支持多種語言:Qwen3支持119種語言,就連方言也不在話下。
有網(wǎng)友甚至調(diào)侃:“Meta LlamaCon還沒開,風(fēng)頭就被阿里截胡了。”
這波就像開源界的《流浪地球》,中國技術(shù)再次以實(shí)力輸出全球。
只能說,OpenAI和DeepSeek的板凳該坐熱了…
贊
收藏
回復(fù)
分享
微博
QQ
微信
舉報(bào)

回復(fù)
相關(guān)推薦