偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用

發(fā)布于 2025-1-9 11:47
瀏覽
0收藏

今天凌晨,微軟研究院開(kāi)源了目前最強(qiáng)小參數(shù)模型——phi-4。


去年12月12日,微軟首次展示了phi-4,參數(shù)只有140億性能卻極強(qiáng),在GPQA研究生水平、MATH數(shù)學(xué)基準(zhǔn)測(cè)試中,超過(guò)了OpenAI的GPT-4o,也超過(guò)了同類頂級(jí)開(kāi)源模型Qwen 2.5 -14B和Llama-3.3-70B。


在美國(guó)數(shù)學(xué)競(jìng)賽AMC的測(cè)試中phi-4更是達(dá)到了91.8分,超過(guò)了Gemini Pro 1.5、GPT-4o、Claude 3.5 Sonnet、Qwen 2.5等知名開(kāi)閉源模型,甚至整體性能可以與4050億參數(shù)的Llama-3.1媲美。


當(dāng)時(shí)很多人就希望微軟開(kāi)源這款超強(qiáng)的小參數(shù)模型,甚至還有人在HuggingFace上傳盜版的phi-4權(quán)重?,F(xiàn)在,終于開(kāi)源了,并且支持MIT許可證下商業(yè)用途。


開(kāi)源地址:https://huggingface.co/microsoft/phi-4/tree/main

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

連HuggingFace官推都來(lái)祝賀,phi-4面子不小。

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

2025 年美好的開(kāi)始!有史以來(lái)最好的14B模型?。。?/p>

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

140參數(shù)的模型在MMLU獲得84.8分,太瘋狂了。恭喜!

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

謝謝你的模型和許可證變更!真棒。

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

你們都是英雄,趕緊下起來(lái)吧!

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

我期待Phi-4在Azure上實(shí)現(xiàn)無(wú)服務(wù)器功能。什么時(shí)候會(huì)可用?

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

小參數(shù)模型非常好。

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

Phi的小參數(shù)對(duì)于創(chuàng)意寫(xiě)作來(lái)說(shuō)是非常驚人的。

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

哇,phi-4 模型能在蘋(píng)果的M4 Pro筆記本上,以每秒約 12 個(gè)tokens的速度流暢運(yùn)行,這太棒了,感謝!

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

phi-4簡(jiǎn)單介紹

phi-4能以如此小的參數(shù)在眾多測(cè)試基準(zhǔn)中打敗著名開(kāi)閉源模型,高質(zhì)量的合成數(shù)據(jù)發(fā)揮了重要作用。


與傳統(tǒng)的從網(wǎng)絡(luò)爬取的有機(jī)數(shù)據(jù)相比,高質(zhì)量的合成數(shù)據(jù)更具優(yōu)勢(shì)。合成數(shù)據(jù)能夠提供結(jié)構(gòu)化、逐步的學(xué)習(xí)材料,使得模型能夠更加高效地學(xué)習(xí)語(yǔ)言的邏輯與推理過(guò)程。例如,在數(shù)學(xué)問(wèn)題的解答中,合成數(shù)據(jù)可以按照解題步驟逐步呈現(xiàn),幫助模型更好地理解問(wèn)題的結(jié)構(gòu)與解題思路。


此外,合成數(shù)據(jù)能夠更好地與模型的推理上下文對(duì)齊,更接近于模型在實(shí)際應(yīng)用中需要生成的輸出格式,這有助于模型在預(yù)訓(xùn)練階段就適應(yīng)實(shí)際應(yīng)用場(chǎng)景的需求。例如,將網(wǎng)絡(luò)論壇中的事實(shí)信息改寫(xiě)成類似 大模型交互的風(fēng)格,使得這些信息在模型生成的對(duì)話中更加自然、合理。


phi-4的合成數(shù)據(jù)生成遵循多樣性、細(xì)膩性與復(fù)雜性、準(zhǔn)確性和推理鏈等原則。涵蓋了 50 多種不同類型的合成數(shù)據(jù)集,通過(guò)多階段提示流程、種子策劃、改寫(xiě)與增強(qiáng)、自我修訂等多種方法,生成了約 4000 億個(gè)未加權(quán)的 tokens。


除了合成數(shù)據(jù),phi-4還對(duì)有機(jī)數(shù)據(jù)進(jìn)行了嚴(yán)格的篩選與過(guò)濾。研究團(tuán)隊(duì)從網(wǎng)絡(luò)內(nèi)容、授權(quán)書(shū)籍和代碼庫(kù)等多渠道收集數(shù)據(jù),并通過(guò)兩階段過(guò)濾過(guò)程,提取出具有高教育價(jià)值和推理深度的種子數(shù)據(jù)。

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

這些種子數(shù)據(jù)為合成數(shù)據(jù)的生成提供了基礎(chǔ),同時(shí)也直接用于預(yù)訓(xùn)練,進(jìn)一步豐富了模型的知識(shí)儲(chǔ)備。在篩選過(guò)程中,微軟采用了基于小分類器的過(guò)濾方法,從大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)中挑選出高質(zhì)量的文檔。還針對(duì)多語(yǔ)言數(shù)據(jù)進(jìn)行了專門(mén)的處理,確保模型能夠處理包括德語(yǔ)、西班牙語(yǔ)、法語(yǔ)、葡萄牙語(yǔ)、意大利語(yǔ)、印地語(yǔ)和日語(yǔ)在內(nèi)的多種語(yǔ)言。


預(yù)訓(xùn)練方面,phi-4主要使用合成數(shù)據(jù)進(jìn)行訓(xùn)練,同時(shí)輔以少量的高質(zhì)量有機(jī)數(shù)據(jù)。這種數(shù)據(jù)混合策略使得模型能夠在學(xué)習(xí)推理和問(wèn)題解決能力的同時(shí),也能夠吸收豐富的知識(shí)內(nèi)容。


在中期訓(xùn)練階段,phi-4將上下文長(zhǎng)度從 4096 擴(kuò)展到 16384,以提高模型對(duì)長(zhǎng)文本的處理能力。幫助模型進(jìn)一步增加了對(duì)長(zhǎng)文本數(shù)據(jù)的訓(xùn)練,包括從高質(zhì)量非合成數(shù)據(jù)集中篩選出的長(zhǎng)于 8K 上下文的樣本,以及新創(chuàng)建的滿足4K 序列要求的合成數(shù)據(jù)集。


后訓(xùn)練階段是 phi-4 優(yōu)化模型的關(guān)鍵。微軟采用了監(jiān)督微調(diào)(SFT)和直接偏好優(yōu)化(DPO)技術(shù)。在 SFT 階段,使用來(lái)自不同領(lǐng)域的高質(zhì)量數(shù)據(jù)生成的約 8B tokens對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào),學(xué)習(xí)率為 10 - 6,并添加了 40 種語(yǔ)言的多語(yǔ)言數(shù)據(jù),所有數(shù)據(jù)均采用 chatml 格式。


DPO 技術(shù)則通過(guò)生成偏好數(shù)據(jù)來(lái)調(diào)整模型的輸出,使其更符合人類偏好。微軟還引入了關(guān)鍵tokens搜索(PTS)技術(shù)來(lái)生成DPO 對(duì),該技術(shù)能夠識(shí)別對(duì)模型回答正確性有重大影響的關(guān)鍵tokens,并針對(duì)這些tokens創(chuàng)建偏好數(shù)據(jù),從而提高模型在推理任務(wù)中的性能。

重磅!微軟開(kāi)源最強(qiáng)小模型Phi-4,超GPT-4o、可商用-AI.x社區(qū)

為了評(píng)估 phi-4 的性能,微軟在多個(gè)基準(zhǔn)測(cè)試上進(jìn)行了測(cè)試。在學(xué)術(shù)基準(zhǔn)測(cè)試方面,如 MMLU、GPQA、MATH、HumanEval 等,phi-4 表現(xiàn)出色。


在 MMLU測(cè)試中,phi-4取得了84.8 的高分,在 GPQA 和 MATH 測(cè)試中,甚至超越了GPT - 4o,在數(shù)學(xué)競(jìng)賽相關(guān)的任務(wù)中展現(xiàn)出強(qiáng)大的推理能力。在與其他類似規(guī)模和更大規(guī)模的模型比較中,phi-4 在 12 個(gè)基準(zhǔn)測(cè)試中的9個(gè)上優(yōu)于同類開(kāi)源模型 Qwen - 2.5 - 14B - Instruct。


本文轉(zhuǎn)自 AIGC開(kāi)放社區(qū)  ,作者:AIGC開(kāi)放社區(qū)


原文鏈接:??https://mp.weixin.qq.com/s/Rk-XBLd3PosXCJhH_mth1w??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦