偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<meter id="0m3gb"></meter>

<var id="0m3gb"><legend id="0m3gb"></legend></var>

<thead id="0m3gb"><option id="0m3gb"><track id="0m3gb"></track></option></thead>

<tt id="0m3gb"></tt>

<tt id="0m3gb"></tt>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

大模型的發(fā)展趨勢預(yù)測——大模型會做的更小，還是做的更大原創(chuàng)

AI探索時(shí)代

發(fā)布于 2024-8-7 11:56

瀏覽

0收藏

“ 大模型的發(fā)展，類似于計(jì)算機(jī)的發(fā)展由大到小”

最近在抖音上看到360創(chuàng)始人——周鴻祎說他關(guān)于大模型的發(fā)展的四個趨勢，也就是開源，廉價(jià)，專業(yè)，小巧。

開源就是以openAI為代表的閉源大模型和Meta/Google為代表的開源大模型的模型大戰(zhàn)；廉價(jià)就是大模型的訓(xùn)練成本會進(jìn)一步降低，也就是意味著大模型會越來越便宜；專業(yè)即垂直領(lǐng)域的大模型會大放異彩；最后小巧是大模型在未來會被移植到手機(jī)上。

雖然不知道周鴻祎的預(yù)測是否準(zhǔn)確，開源與閉源模型的大戰(zhàn)最終會是什么結(jié)果；但不可否認(rèn)的是，大模型的發(fā)展不可能是一家獨(dú)大，而很可能是多種趨勢并存。

大模型會越來越大

大模型越來越大這是一個趨勢，畢竟根據(jù)現(xiàn)有的理論，大模型的參數(shù)越多其效果越好，涌現(xiàn)能力越強(qiáng)，這是一個不可爭議的事實(shí)，除非出現(xiàn)新的理論能夠顛覆現(xiàn)有的大模型基礎(chǔ)理論。

因此，大模型要想越來越強(qiáng)大，那么大模型變大的可能性就越高；其功能也會更強(qiáng)。

大模型越來越大這是它的優(yōu)勢，但同樣也是它的劣勢；因?yàn)榇竽Ｐ驮酱?，對算力和能源的要求越高，其?xùn)練和維護(hù)的成本越高。

這對很對企業(yè)來說是無法接受的，因此越來越大的大模型只能有那些巨頭企業(yè)或國家才能玩得轉(zhuǎn)。

大模型的發(fā)展趨勢預(yù)測——大模型會做的更小，還是做的更大-AI.x社區(qū)

越來越大的大模型就類似于超級計(jì)算機(jī)，其功能強(qiáng)大，但能玩得轉(zhuǎn)的人特別少。

因此，超大模型的競爭，是大廠之間的競爭，也是國家之間的競爭。

當(dāng)然，隨著技術(shù)的發(fā)展，更先進(jìn)的大模型架構(gòu)和理論會持續(xù)出現(xiàn)，那時(shí)的大模型可能會越來越強(qiáng)，越來越小。

大模型越來越小

大模型會變得越來越小，其最終有可能會被安裝到手機(jī)等移動設(shè)備之上，雖然其功能趕不上大模型，但滿足普通人的日常使用還是有可能的。

而這就類似于現(xiàn)在的智能手機(jī)，所謂的智能手機(jī)就是把電腦的操作系統(tǒng)給做的更小，功能更強(qiáng)。

大模型的發(fā)展趨勢預(yù)測——大模型會做的更小，還是做的更大-AI.x社區(qū)

當(dāng)然，雖然大模型的蒸餾和壓縮技術(shù)在持續(xù)發(fā)展，但怎么才能把龐大的模型壓縮到手機(jī)能夠支持的體積的同時(shí)，還要同時(shí)保證大模型的強(qiáng)大功能，還是一個需要研究的課題。

個人預(yù)測，大模型的壓縮是一個必須功課的課題；因?yàn)樵趯?shí)際應(yīng)用領(lǐng)域，大模型的離線操作是一個很重要的功能，比如自動駕駛，無人設(shè)備等；在惡劣的自然環(huán)境或者沒有網(wǎng)絡(luò)的情況下，能夠讓設(shè)備正常使用。

而這就需要大模型能夠安裝到這些設(shè)備之上。

大模型垂直化發(fā)展

大模型有大模型的應(yīng)用場景，小模型有小模型的應(yīng)用場景；但從功能性和成本考慮，垂直化應(yīng)用的大模型也必不可少。

畢竟，哪怕是人也有自己擅長和不擅長的方面；大模型也是如此，因此通用大模型在垂直領(lǐng)域的效果就大打折扣；所以垂直化的大模型就成了垂直領(lǐng)域最好的解決方案。

比如說，大模型在法律，金融，教育，航空航天等領(lǐng)域的使用；有些會涉及到國家安全和民生的領(lǐng)域，這時(shí)使用一個通用的超大模型，不但具有巨大的安全風(fēng)險(xiǎn)，而且一個模型也無法完全支撐如此龐大的領(lǐng)域。

因此，每個領(lǐng)域有每個領(lǐng)域的“專家模型”就是最好的選擇，沒有之一。

再有就是，類似于互聯(lián)網(wǎng)常見的分布式部署方案，通過上層統(tǒng)一架構(gòu)，可以在底層集成多個大模型來完成需要的功能。

大模型的發(fā)展趨勢預(yù)測——大模型會做的更小，還是做的更大-AI.x社區(qū)

比如360邀約十多家國內(nèi)的大模型公司，然后基于其自研的架構(gòu)，可以使得多個模型協(xié)作，來達(dá)到超越GPT4o的能力；雖然單獨(dú)一個模型的表現(xiàn)并不出色，但通過混合模型(狼群戰(zhàn)術(shù))，同樣能夠達(dá)到GPT4o的效果。

總結(jié)

從成本和技術(shù)門檻的角度來說，發(fā)展垂直化模型是最好的選擇，但同樣其它的方式也不能完全放棄；只有多條腿走路，才能在大模型的競爭中生存下來，并且找到最適合自己的解決方案。

本文轉(zhuǎn)載自公眾號AI探索時(shí)代作者：DFires

原文鏈接：????https://mp.weixin.qq.com/s/J3lS6oX0FzjrPHqsOWAv2Q???

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型做時(shí)序預(yù)測也很強(qiáng)！華人團(tuán)隊(duì)激活LLM新能力，超越一眾傳統(tǒng)模型實(shí)現(xiàn)SOTA

Crystalcxt ? 3496瀏覽 ? 0回復(fù)
15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展

angel ? 2538瀏覽 ? 0回復(fù)
2024年了,Diffusion模型還有什么可做的？

angel ? 5082瀏覽 ? 1回復(fù)
2024年云中AI工程的三大關(guān)鍵趨勢

51CTO技術(shù)棧 ? 2936瀏覽 ? 0回復(fù)
生成式AI的發(fā)展方向，應(yīng)當(dāng)是Chat還是Agent？

angel ? 2540瀏覽 ? 0回復(fù)
學(xué)會區(qū)分大模型——大模型的分類，讓你更清晰的認(rèn)識大模型

AI探索時(shí)代 ? 1.0w瀏覽 ? 0回復(fù)
更小、更弱，卻更優(yōu)：通過計(jì)算最優(yōu)抽樣訓(xùn)練大語言模型推理器

sbf_2000 ? 2686瀏覽 ? 0回復(fù)
AI數(shù)學(xué)天才還是數(shù)字騙子？GSM-Symbolic揭秘大語言模型的數(shù)學(xué)推理能力

sbf_2000 ? 2547瀏覽 ? 0回復(fù)
從AIGC來看大模型技術(shù)的發(fā)展和現(xiàn)狀

AI探索時(shí)代 ? 2183瀏覽 ? 0回復(fù)
2025年人工智能十大趨勢！最新預(yù)測

風(fēng)云2002_1 ? 5500瀏覽 ? 0回復(fù)
多模態(tài)大模型能力評測基準(zhǔn)全面綜述：理解、推理、生成、應(yīng)用、趨勢

十一月雨_55 ? 9913瀏覽 ? 0回復(fù)
推演大模型局限與發(fā)展脈絡(luò)

ceesoft ? 2534瀏覽 ? 0回復(fù)
大模型是能力強(qiáng)還是記憶強(qiáng)？一項(xiàng)發(fā)人深省的研究

芝士AI吃魚 ? 2906瀏覽 ? 0回復(fù)
人工智能智能體(AI Agent)發(fā)展趨勢2024年總結(jié)與2025年展望

十一月雨_55 ? 9974瀏覽 ? 0回復(fù)
2025年的八大技術(shù)趨勢

Halo咯咯 ? 3803瀏覽 ? 0回復(fù)
秒懂Function Call：DeepSeek大模型的隱藏超能力，讓AI從"會聊天"變"會做事"

九歌AI大模型 ? 4108瀏覽 ? 0回復(fù)
AI 大模型：產(chǎn)業(yè)變革的引擎與未來發(fā)展的關(guān)鍵路徑

AI算力補(bǔ)給站 ? 2290瀏覽 ? 0回復(fù)
大模型的能力和大模型應(yīng)用

AI探索時(shí)代 ? 1517瀏覽 ? 0回復(fù)
從全心臟模型到基于 LLM 的疾病網(wǎng)絡(luò)分析，清華長庚醫(yī)院李棟從數(shù)據(jù)視角剖析醫(yī)療大模型發(fā)展趨勢

HyperAI超神經(jīng) ? 1039瀏覽 ? 0回復(fù)

AI探索時(shí)代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Agent智能體和workflow工作流是一回事嗎？如果不是那么它們的區(qū)別是什么？ 3天前發(fā)布
關(guān)于Agent智能體的開發(fā)心得——從人的角度去理解智能體 3天前發(fā)布

熱門推薦

關(guān)于ChatGPT和DeepSeek模型在使用上的感受——ChatGPT更像一個人，而DeepSeek更像一個機(jī)器 0回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實(shí)測：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測：真·超DS！ 1回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

上一篇：大模型技術(shù)細(xì)節(jié)——大模型之文本生成與文檔總結(jié)

下一篇：對企業(yè)來說大模型商業(yè)化的三種方式

社區(qū)精華內(nèi)容

目錄

<em id="6q0av"></em>

<nobr id="6q0av"></nobr>