偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<ruby id="hr66k"><samp id="hr66k"></samp></ruby>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用

發(fā)布于 2025-1-9 11:47

瀏覽

0收藏

今天凌晨，微軟研究院開(kāi)源了目前最強(qiáng)小參數(shù)模型——phi-4。

去年12月12日，微軟首次展示了phi-4，參數(shù)只有140億性能卻極強(qiáng)，在GPQA研究生水平、MATH數(shù)學(xué)基準(zhǔn)測(cè)試中，超過(guò)了OpenAI的GPT-4o，也超過(guò)了同類頂級(jí)開(kāi)源模型Qwen 2.5 -14B和Llama-3.3-70B。

在美國(guó)數(shù)學(xué)競(jìng)賽AMC的測(cè)試中phi-4更是達(dá)到了91.8分，超過(guò)了Gemini Pro 1.5、GPT-4o、Claude 3.5 Sonnet、Qwen 2.5等知名開(kāi)閉源模型，甚至整體性能可以與4050億參數(shù)的Llama-3.1媲美。

當(dāng)時(shí)很多人就希望微軟開(kāi)源這款超強(qiáng)的小參數(shù)模型，甚至還有人在HuggingFace上傳盜版的phi-4權(quán)重?，F(xiàn)在，終于開(kāi)源了，并且支持MIT許可證下商業(yè)用途。

開(kāi)源地址：https://huggingface.co/microsoft/phi-4/tree/main

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

連HuggingFace官推都來(lái)祝賀，phi-4面子不小。

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

2025 年美好的開(kāi)始！有史以來(lái)最好的14B模型?。。?/p>

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

140參數(shù)的模型在MMLU獲得84.8分，太瘋狂了。恭喜！

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

謝謝你的模型和許可證變更！真棒。

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

你們都是英雄，趕緊下起來(lái)吧！

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

我期待Phi-4在Azure上實(shí)現(xiàn)無(wú)服務(wù)器功能。什么時(shí)候會(huì)可用？

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

小參數(shù)模型非常好。

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

Phi的小參數(shù)對(duì)于創(chuàng)意寫(xiě)作來(lái)說(shuō)是非常驚人的。

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

哇，phi-4 模型能在蘋(píng)果的M4 Pro筆記本上，以每秒約 12 個(gè)tokens的速度流暢運(yùn)行，這太棒了，感謝！

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

phi-4簡(jiǎn)單介紹

phi-4能以如此小的參數(shù)在眾多測(cè)試基準(zhǔn)中打敗著名開(kāi)閉源模型，高質(zhì)量的合成數(shù)據(jù)發(fā)揮了重要作用。

與傳統(tǒng)的從網(wǎng)絡(luò)爬取的有機(jī)數(shù)據(jù)相比，高質(zhì)量的合成數(shù)據(jù)更具優(yōu)勢(shì)。合成數(shù)據(jù)能夠提供結(jié)構(gòu)化、逐步的學(xué)習(xí)材料，使得模型能夠更加高效地學(xué)習(xí)語(yǔ)言的邏輯與推理過(guò)程。例如，在數(shù)學(xué)問(wèn)題的解答中，合成數(shù)據(jù)可以按照解題步驟逐步呈現(xiàn)，幫助模型更好地理解問(wèn)題的結(jié)構(gòu)與解題思路。

此外，合成數(shù)據(jù)能夠更好地與模型的推理上下文對(duì)齊，更接近于模型在實(shí)際應(yīng)用中需要生成的輸出格式，這有助于模型在預(yù)訓(xùn)練階段就適應(yīng)實(shí)際應(yīng)用場(chǎng)景的需求。例如，將網(wǎng)絡(luò)論壇中的事實(shí)信息改寫(xiě)成類似大模型交互的風(fēng)格，使得這些信息在模型生成的對(duì)話中更加自然、合理。

phi-4的合成數(shù)據(jù)生成遵循多樣性、細(xì)膩性與復(fù)雜性、準(zhǔn)確性和推理鏈等原則。涵蓋了 50 多種不同類型的合成數(shù)據(jù)集，通過(guò)多階段提示流程、種子策劃、改寫(xiě)與增強(qiáng)、自我修訂等多種方法，生成了約 4000 億個(gè)未加權(quán)的 tokens。

除了合成數(shù)據(jù)，phi-4還對(duì)有機(jī)數(shù)據(jù)進(jìn)行了嚴(yán)格的篩選與過(guò)濾。研究團(tuán)隊(duì)從網(wǎng)絡(luò)內(nèi)容、授權(quán)書(shū)籍和代碼庫(kù)等多渠道收集數(shù)據(jù)，并通過(guò)兩階段過(guò)濾過(guò)程，提取出具有高教育價(jià)值和推理深度的種子數(shù)據(jù)。

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

這些種子數(shù)據(jù)為合成數(shù)據(jù)的生成提供了基礎(chǔ)，同時(shí)也直接用于預(yù)訓(xùn)練，進(jìn)一步豐富了模型的知識(shí)儲(chǔ)備。在篩選過(guò)程中，微軟采用了基于小分類器的過(guò)濾方法，從大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)中挑選出高質(zhì)量的文檔。還針對(duì)多語(yǔ)言數(shù)據(jù)進(jìn)行了專門(mén)的處理，確保模型能夠處理包括德語(yǔ)、西班牙語(yǔ)、法語(yǔ)、葡萄牙語(yǔ)、意大利語(yǔ)、印地語(yǔ)和日語(yǔ)在內(nèi)的多種語(yǔ)言。

預(yù)訓(xùn)練方面，phi-4主要使用合成數(shù)據(jù)進(jìn)行訓(xùn)練，同時(shí)輔以少量的高質(zhì)量有機(jī)數(shù)據(jù)。這種數(shù)據(jù)混合策略使得模型能夠在學(xué)習(xí)推理和問(wèn)題解決能力的同時(shí)，也能夠吸收豐富的知識(shí)內(nèi)容。

在中期訓(xùn)練階段，phi-4將上下文長(zhǎng)度從 4096 擴(kuò)展到 16384，以提高模型對(duì)長(zhǎng)文本的處理能力。幫助模型進(jìn)一步增加了對(duì)長(zhǎng)文本數(shù)據(jù)的訓(xùn)練，包括從高質(zhì)量非合成數(shù)據(jù)集中篩選出的長(zhǎng)于 8K 上下文的樣本，以及新創(chuàng)建的滿足4K 序列要求的合成數(shù)據(jù)集。

后訓(xùn)練階段是 phi-4 優(yōu)化模型的關(guān)鍵。微軟采用了監(jiān)督微調(diào)（SFT）和直接偏好優(yōu)化（DPO）技術(shù)。在 SFT 階段，使用來(lái)自不同領(lǐng)域的高質(zhì)量數(shù)據(jù)生成的約 8B tokens對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào)，學(xué)習(xí)率為 10 - 6，并添加了 40 種語(yǔ)言的多語(yǔ)言數(shù)據(jù)，所有數(shù)據(jù)均采用 chatml 格式。

DPO 技術(shù)則通過(guò)生成偏好數(shù)據(jù)來(lái)調(diào)整模型的輸出，使其更符合人類偏好。微軟還引入了關(guān)鍵tokens搜索（PTS）技術(shù)來(lái)生成DPO 對(duì)，該技術(shù)能夠識(shí)別對(duì)模型回答正確性有重大影響的關(guān)鍵tokens，并針對(duì)這些tokens創(chuàng)建偏好數(shù)據(jù)，從而提高模型在推理任務(wù)中的性能。

重磅！微軟開(kāi)源最強(qiáng)小模型Phi-4，超GPT-4o、可商用-AI.x社區(qū)

為了評(píng)估 phi-4 的性能，微軟在多個(gè)基準(zhǔn)測(cè)試上進(jìn)行了測(cè)試。在學(xué)術(shù)基準(zhǔn)測(cè)試方面，如 MMLU、GPQA、MATH、HumanEval 等，phi-4 表現(xiàn)出色。

在 MMLU測(cè)試中，phi-4取得了84.8 的高分，在 GPQA 和 MATH 測(cè)試中，甚至超越了GPT - 4o，在數(shù)學(xué)競(jìng)賽相關(guān)的任務(wù)中展現(xiàn)出強(qiáng)大的推理能力。在與其他類似規(guī)模和更大規(guī)模的模型比較中，phi-4 在 12 個(gè)基準(zhǔn)測(cè)試中的9個(gè)上優(yōu)于同類開(kāi)源模型 Qwen - 2.5 - 14B - Instruct。

本文轉(zhuǎn)自 AIGC開(kāi)放社區(qū) ，作者：AIGC開(kāi)放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/Rk-XBLd3PosXCJhH_mth1w??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

GPT-4o 的數(shù)學(xué)又雙叕進(jìn)步了？來(lái) MathBench 看看新版 GPT-4o 到底強(qiáng)在哪！

戀戀青鳥(niǎo) ? 4710瀏覽 ? 0回復(fù)
GPT-4o做Code Review可行嗎？

51CTO技術(shù)棧 ? 4968瀏覽 ? 0回復(fù)
AutoCoder：性能超越GPT-4o的模型，居然只有33B，還是開(kāi)源！

大語(yǔ)言模型論文跟蹤 ? 1.0w瀏覽 ? 0回復(fù)
GPT-4o背后可能的語(yǔ)音技術(shù)

魚(yú)蟲(chóng)子 ? 4439瀏覽 ? 0回復(fù)
英偉達(dá)開(kāi)源3400億巨獸，98%合成數(shù)據(jù)訓(xùn)出最強(qiáng)開(kāi)源通用模型！性能對(duì)標(biāo)GPT-4o

duhorse ? 4045瀏覽 ? 0回復(fù)
性能超Llama 3，可商用！開(kāi)源大模型Falcon 2

Aceryt ? 4500瀏覽 ? 0回復(fù)
OpenAI正式打響海外價(jià)格戰(zhàn)，GPT-4o mini成地表最強(qiáng)小模型，百萬(wàn)tokens僅需60美分

InfonityAI智推星 ? 4781瀏覽 ? 0回復(fù)
最強(qiáng)GPT-4o正確率僅55.8%，開(kāi)源模型不如瞎蒙

duhorse ? 4309瀏覽 ? 0回復(fù)
英偉達(dá)最強(qiáng)勁敵Groq一招絕殺GPU，反超GPT-4o mini2倍，AI大佬Karpathy：直接飛升AGI!

51CTO技術(shù)棧 ? 3400瀏覽 ? 0回復(fù)
阿里重磅開(kāi)源Qwen2-VL：能理解超20分鐘視頻，媲美GPT-4o！

Aceryt ? 4835瀏覽 ? 0回復(fù)
阿里史上最大規(guī)模開(kāi)源發(fā)布，超GPT-4o 、Llama-3.1！

Aceryt ? 3298瀏覽 ? 0回復(fù)
擊敗GPT-4o、僅次于o1！英偉達(dá)重磅開(kāi)源超強(qiáng)大模型--Nemotron

Aceryt ? 4380瀏覽 ? 0回復(fù)
重磅開(kāi)源Nemotron大模型：擊敗GPT-4o、僅次于o1！

51CTO技術(shù)棧 ? 3093瀏覽 ? 0回復(fù)
超GPT-4o，1240億參數(shù)！最強(qiáng)開(kāi)源多模態(tài)模型 Pixtral Large！

Aceryt ? 3721瀏覽 ? 0回復(fù)
小模型界o1來(lái)了：微軟推出Phi-4，數(shù)學(xué)推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個(gè)重要推斷

51CTO技術(shù)棧 ? 3581瀏覽 ? 0回復(fù)
微軟 Phi-4 震撼發(fā)布：14B 參數(shù)模型性能超越一眾大模型，數(shù)學(xué)推理性能提升顯著

Syrupup ? 4241瀏覽 ? 0回復(fù)
微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

Aceryt ? 3509瀏覽 ? 0回復(fù)
微軟開(kāi)源小模型Phi系列：技術(shù)演進(jìn)、能力突破與未來(lái)展望

上堵吟1 ? 4712瀏覽 ? 0回復(fù)
微軟Phi-4-Mini技術(shù)報(bào)告：Phi-4-Mini如何以小博大

sbf_2000 ? 4659瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來(lái)啦 2025-04-24 09:57:36發(fā)布
字節(jié)跳動(dòng)開(kāi)源多模態(tài)AI Agent—UI-TARS-1.5 2025-04-23 11:55:00發(fā)布

熱門(mén)推薦

阿里新一代企業(yè)級(jí)多 AI 智能體開(kāi)發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

DeepSeek 成長(zhǎng)史：從量化投資到 AI 革命的一個(gè) “非主流” 量化大佬的 AI 夢(mèng) 0回復(fù)

DeepSeek團(tuán)隊(duì)開(kāi)源新模型DeepSeek-OCR，用3B參數(shù)量實(shí)現(xiàn)10倍文本壓縮的多模態(tài)突破 0回復(fù)

上一篇：機(jī)器人ChatGPT時(shí)刻！英偉達(dá)開(kāi)源世界大模型，完美模擬物理世界！

下一篇：清華團(tuán)隊(duì)靠強(qiáng)化學(xué)習(xí)讓 7B 模型打敗 GPT-4o 數(shù)學(xué)推理

社區(qū)精華內(nèi)容

目錄

<legend id="spli1"><track id="spli1"></track></legend>

<legend id="spli1"><track id="spli1"></track></legend>