偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

大模型的發(fā)展趨勢預(yù)測——大模型會做的更小,還是做的更大 原創(chuàng)

發(fā)布于 2024-8-7 11:56
瀏覽
0收藏

“ 大模型的發(fā)展,類似于計(jì)算機(jī)的發(fā)展由大到小”

最近在抖音上看到360創(chuàng)始人——周鴻祎說他關(guān)于大模型的發(fā)展的四個趨勢,也就是開源,廉價(jià),專業(yè),小巧。

開源就是以openAI為代表的閉源大模型和Meta/Google為代表的開源大模型的模型大戰(zhàn);廉價(jià)就是大模型的訓(xùn)練成本會進(jìn)一步降低,也就是意味著大模型會越來越便宜;專業(yè)即垂直領(lǐng)域的大模型會大放異彩;最后小巧是大模型在未來會被移植到手機(jī)上。

雖然不知道周鴻祎的預(yù)測是否準(zhǔn)確,開源與閉源模型的大戰(zhàn)最終會是什么結(jié)果;但不可否認(rèn)的是,大模型的發(fā)展不可能是一家獨(dú)大,而很可能是多種趨勢并存。

大模型會越來越大

大模型越來越大這是一個趨勢,畢竟根據(jù)現(xiàn)有的理論,大模型的參數(shù)越多其效果越好,涌現(xiàn)能力越強(qiáng),這是一個不可爭議的事實(shí),除非出現(xiàn)新的理論能夠顛覆現(xiàn)有的大模型基礎(chǔ)理論。

因此,大模型要想越來越強(qiáng)大,那么大模型變大的可能性就越高;其功能也會更強(qiáng)。

大模型越來越大這是它的優(yōu)勢,但同樣也是它的劣勢;因?yàn)榇竽P驮酱?,對算力和能源的要求越高,其?xùn)練和維護(hù)的成本越高。

這對很對企業(yè)來說是無法接受的,因此越來越大的大模型只能有那些巨頭企業(yè)或國家才能玩得轉(zhuǎn)。

大模型的發(fā)展趨勢預(yù)測——大模型會做的更小,還是做的更大-AI.x社區(qū)

越來越大的大模型就類似于超級計(jì)算機(jī),其功能強(qiáng)大,但能玩得轉(zhuǎn)的人特別少。

因此,超大模型的競爭,是大廠之間的競爭,也是國家之間的競爭。

當(dāng)然,隨著技術(shù)的發(fā)展,更先進(jìn)的大模型架構(gòu)和理論會持續(xù)出現(xiàn),那時(shí)的大模型可能會越來越強(qiáng),越來越小。

大模型越來越小

大模型會變得越來越小,其最終有可能會被安裝到手機(jī)等移動設(shè)備之上,雖然其功能趕不上大模型,但滿足普通人的日常使用還是有可能的。

而這就類似于現(xiàn)在的智能手機(jī),所謂的智能手機(jī)就是把電腦的操作系統(tǒng)給做的更小,功能更強(qiáng)。

大模型的發(fā)展趨勢預(yù)測——大模型會做的更小,還是做的更大-AI.x社區(qū)

當(dāng)然,雖然大模型的蒸餾和壓縮技術(shù)在持續(xù)發(fā)展,但怎么才能把龐大的模型壓縮到手機(jī)能夠支持的體積的同時(shí),還要同時(shí)保證大模型的強(qiáng)大功能,還是一個需要研究的課題。

個人預(yù)測,大模型的壓縮是一個必須功課的課題;因?yàn)樵趯?shí)際應(yīng)用領(lǐng)域,大模型的離線操作是一個很重要的功能,比如自動駕駛,無人設(shè)備等;在惡劣的自然環(huán)境或者沒有網(wǎng)絡(luò)的情況下,能夠讓設(shè)備正常使用。

而這就需要大模型能夠安裝到這些設(shè)備之上。

大模型垂直化發(fā)展

大模型有大模型的應(yīng)用場景,小模型有小模型的應(yīng)用場景;但從功能性和成本考慮,垂直化應(yīng)用的大模型也必不可少。

畢竟,哪怕是人也有自己擅長和不擅長的方面;大模型也是如此,因此通用大模型在垂直領(lǐng)域的效果就大打折扣;所以垂直化的大模型就成了垂直領(lǐng)域最好的解決方案。

比如說,大模型在法律,金融,教育,航空航天等領(lǐng)域的使用;有些會涉及到國家安全和民生的領(lǐng)域,這時(shí)使用一個通用的超大模型,不但具有巨大的安全風(fēng)險(xiǎn),而且一個模型也無法完全支撐如此龐大的領(lǐng)域。

因此,每個領(lǐng)域有每個領(lǐng)域的“專家模型”就是最好的選擇,沒有之一。

再有就是,類似于互聯(lián)網(wǎng)常見的分布式部署方案,通過上層統(tǒng)一架構(gòu),可以在底層集成多個大模型來完成需要的功能。

大模型的發(fā)展趨勢預(yù)測——大模型會做的更小,還是做的更大-AI.x社區(qū)

比如360邀約十多家國內(nèi)的大模型公司,然后基于其自研的架構(gòu),可以使得多個模型協(xié)作,來達(dá)到超越GPT4o的能力;雖然單獨(dú)一個模型的表現(xiàn)并不出色,但通過混合模型(狼群戰(zhàn)術(shù)),同樣能夠達(dá)到GPT4o的效果。

總結(jié)

從成本和技術(shù)門檻的角度來說,發(fā)展垂直化模型是最好的選擇,但同樣其它的方式也不能完全放棄;只有多條腿走路,才能在大模型的競爭中生存下來,并且找到最適合自己的解決方案。


本文轉(zhuǎn)載自公眾號AI探索時(shí)代 作者:DFires

原文鏈接:????https://mp.weixin.qq.com/s/J3lS6oX0FzjrPHqsOWAv2Q???


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦