如何縮小中美通用大模型差距? 我在兩會(huì)看到了答案
“通用大模型關(guān)乎國運(yùn)之爭”……
“人工智能+”首次出現(xiàn)在政府工作報(bào)告中,并直接上升為一種行動(dòng) 。
雷軍劉慶峰等代表委員都將人工智能納入到自己的建議之中;
又是一年兩會(huì)進(jìn)行時(shí),AI大模型受到前所未有的關(guān)注。
彼時(shí)在大洋彼岸的另一邊,GPT-4正被最新大模型全面超越,Sora新視頻持續(xù)驚艷網(wǎng)友。
一時(shí)間,關(guān)于國產(chǎn)通用大模型未來發(fā)展、中美之間差距還有多少的話題再次引人注目。
既如此且先來看看,兩會(huì)都聊了啥?或許能從中找到答案。
人工智能火爆兩會(huì)
與開展“人工智能+”行動(dòng)相呼應(yīng)的是,20多位全國人大代表或政協(xié)委員都談到了大模型相關(guān),覆蓋到從底層數(shù)據(jù)算力、模型層以及應(yīng)用層的方方面面,為當(dāng)前正面臨的挑戰(zhàn)建言獻(xiàn)策。
通用大模型又成為這其中的關(guān)鍵詞。這樣的盛況,以往并不多見。
在具體建議中,可以看到大概有三個(gè)方面:技術(shù)瓶頸、未來發(fā)展以及應(yīng)用落地。
- 技術(shù)瓶頸:數(shù)據(jù)、算力和產(chǎn)業(yè)生態(tài)
當(dāng)前國產(chǎn)大模型技術(shù)瓶頸還有哪些?包括科大訊飛董事長劉慶峰、知乎創(chuàng)始人周源、京東集團(tuán)技術(shù)委員會(huì)主席曹鵬、中科院計(jì)算機(jī)所研究員張?jiān)迫仍趦?nèi)都發(fā)表了自己的看法。
知乎創(chuàng)始人周源談到了數(shù)據(jù)方面的挑戰(zhàn),他認(rèn)為對大模型數(shù)據(jù)采集進(jìn)行監(jiān)督和審查。
京東集團(tuán)技術(shù)委員會(huì)主席曹鵬、中科院計(jì)算機(jī)所研究員張?jiān)迫?/strong>等在內(nèi)都談到了突破算力瓶頸,曹鵬鼓勵(lì)國產(chǎn)算力軟硬協(xié)同,張?jiān)迫岢隽思蠥I芯片研制、設(shè)立智能算力發(fā)展專項(xiàng)組等幾個(gè)方向的建議。
而科大訊飛董事長劉慶峰則從算力、底座平臺(tái)、源頭技術(shù)研發(fā)等維度介紹了我國發(fā)展大模型存在的短板,并建議制定國家《通用人工智能發(fā)展規(guī)劃》,來縮小中美通用人工智能產(chǎn)業(yè)的差距,打造我國的比較優(yōu)勢。
- 未來發(fā)展:教育人才和政策法規(guī)也成關(guān)注焦點(diǎn)
技術(shù)之外,教育、人才建設(shè)、政策法規(guī)等方面也成為了代表們的關(guān)注焦點(diǎn)。
小米創(chuàng)始人雷軍提出了三項(xiàng)人才相關(guān)的建議:從義務(wù)教育階段普及人工智能素養(yǎng)教育;大力推進(jìn)高校人工智能相關(guān)專業(yè)的建設(shè);支持大型科技企業(yè)和教培機(jī)構(gòu)培育人工智能應(yīng)用型人才。
還有一些法律界人士,比如金杜律師事務(wù)所高級合伙人張毅,提出推進(jìn)《人工智能法》的出臺(tái)。
- 應(yīng)用落地:如何賦能千行百業(yè)?
值得一提的是,此次還有來自影視、體育、農(nóng)村、養(yǎng)老、制造、文旅等各行業(yè)代表也都參與到對于人工智能發(fā)展的討論之中。
比如Sora對影視行業(yè)的影響,演員靳東在接受采訪時(shí)談到一些服務(wù)型的崗位可能會(huì)被替代,但短時(shí)間內(nèi),人工智能很難替代影視等創(chuàng)作行業(yè)。
還有像美的副總裁鐘錚、拈花灣文旅董事長吳國平、天能控股集團(tuán)董事長張?zhí)烊?/strong>提到了人工智能在制造業(yè)、文旅、養(yǎng)老等行業(yè)的應(yīng)用。
……
可以看到的是,大模型毫無疑問地成為此次兩會(huì)的焦點(diǎn)。在二十多位人大代表或政協(xié)委員的提案中,其實(shí)也能總結(jié)出當(dāng)前國產(chǎn)大模型的發(fā)展縮影:技術(shù)挑戰(zhàn)仍在,人才政策得跟上,應(yīng)用發(fā)展要加速。
中美差距還有多大?
ChatGPT的出現(xiàn),國內(nèi)掀起千模大戰(zhàn),部分玩家的大模型在一年時(shí)間實(shí)現(xiàn)了對標(biāo)GPT-3.5的實(shí)力,部分能力超過了GPT-4。
而Sora橫空出世,僅需通過文本即可自動(dòng)生成1分鐘視頻,給視頻生成領(lǐng)域帶來了顛覆,其展現(xiàn)的性能對同類產(chǎn)品實(shí)現(xiàn)了碾壓……
于是乎,關(guān)于中美之間的差距是否進(jìn)一步加大再次引發(fā)熱議。數(shù)據(jù)、算力、人才培養(yǎng)和投入成為這當(dāng)中討論的焦點(diǎn)。
但中美差距具體還有多大?始終沒有什么定論。
此次兩會(huì)上,科大訊飛董事長劉慶峰首次給出了定量描述——
1-2年,追平。
為什么會(huì)是這個(gè)數(shù)字?劉慶峰做了進(jìn)一步解答。
他認(rèn)為中美博弈的“主戰(zhàn)場”就是在通用底座能力上持續(xù)進(jìn)行對標(biāo)。而Sora正是基于GPT-4/4V的通用大模型底座能力所延伸出來的特定領(lǐng)域的成功實(shí)踐。
同樣延伸的還有像DALL-E3、Whisper。
他還以訊飛星火大模型為例,預(yù)計(jì)6個(gè)月內(nèi)可達(dá)到GPT4/4V當(dāng)前最好水平。但隨著GPT-5的發(fā)布,“這個(gè)差距可能會(huì)被拉到一年以上”。
因此他也強(qiáng)調(diào)稱,這也會(huì)是一個(gè)你追我趕的動(dòng)態(tài)過程。
在劉慶峰這一推論中,在人工智能領(lǐng)域,將通用大模型推至到一個(gè)高點(diǎn),成為中美之間差距的核心競爭點(diǎn)。
也有代表此次在兩會(huì)上表達(dá)了類似的觀點(diǎn):通用大模型的發(fā)展,已不是單純的科技之爭,更是國運(yùn)之爭,影響深遠(yuǎn)。
過去一年可以看到,通用大模型已然成為業(yè)內(nèi)玩家的發(fā)展共識(shí)。
在模型層,關(guān)于長文本處理、多模態(tài)、邏輯推理、數(shù)學(xué)編碼等技術(shù)突破,以全方位提升通用大模型的理解能力?;A(chǔ)設(shè)施層,自主可控算力生態(tài)也構(gòu)建開來,國產(chǎn)算力軟硬協(xié)同來支撐大模型創(chuàng)新和應(yīng)用。
當(dāng)然最明顯感知的發(fā)展變化,還是應(yīng)用層的全面開花。
來自醫(yī)療、教育、廣告營銷、制造等各個(gè)行業(yè)領(lǐng)域的傳統(tǒng)玩家,基于通用大模型底座平臺(tái)以及行業(yè)數(shù)據(jù),得以讓大模型在自身領(lǐng)域加速應(yīng)用。
千模大戰(zhàn)之中,絕大多數(shù)也都是行業(yè)和垂直領(lǐng)域大模型。而如果沒有通用底座大模型的支撐,行業(yè)大模型的成效將無法持續(xù)進(jìn)步。
因此,中國必須要有自主可控、對標(biāo)國際一流水準(zhǔn)的通用底座大模型。
這當(dāng)中最具代表的踐行者就是科大訊飛。
過去一年,他們有兩個(gè)進(jìn)展值得關(guān)注——
一個(gè)是中國首個(gè)支持萬億浮點(diǎn)參數(shù)的國產(chǎn)化算力平臺(tái)“飛星一號”,聯(lián)合華為實(shí)現(xiàn)國產(chǎn)算力的自主可控。
另一個(gè)基于該平臺(tái)發(fā)布訊飛星火V3.5,整體效果逼近GPT-4 Turbo,并初步形成大模型產(chǎn)業(yè)生態(tài)。
基于算力和持續(xù)升級迭代的通用大模型,他們在醫(yī)療、教育、工業(yè)等場景中有了深度應(yīng)用,已率先構(gòu)建出行業(yè)領(lǐng)先的大模型產(chǎn)業(yè)生態(tài)——
截至今年1月,訊飛星火純用戶2400萬,基于訊飛聽見、訊飛星火APP、訊飛輸入法等應(yīng)用,星火已累計(jì)賦能億萬用戶。大模型開發(fā)者生態(tài)積累37萬開發(fā)者數(shù)量,其中企業(yè)開發(fā)者數(shù)量為24萬……并從中以此形數(shù)據(jù)閉環(huán),自驅(qū)動(dòng)大模型的迭代和落地。
過去的發(fā)展成績表明:以科大訊飛為代表的通用人工智能國家隊(duì)在推動(dòng)大模型的落地,我們有基礎(chǔ),也有自身的場景和數(shù)據(jù)優(yōu)勢。但同樣也要客觀看到差距、正視差距,縮小中美底座大模型的差距。
全球競爭更加激烈,通用底座呼之欲出
2024年剛開年,以天為單位的AI新進(jìn)展再次讓全球無眠。
顛覆視頻生成的Sora、全面超越GPT-4的Claude 3、還有Stable Diffusion 3的發(fā)布,而在產(chǎn)業(yè)鏈上,英偉達(dá)正式突破2萬億美元震驚股市……
顯然,全球競速?zèng)]有放緩,反而更緊迫了。
但同去年ChatGPT剛出現(xiàn)時(shí)百模大戰(zhàn)千模大戰(zhàn)的各家探索不同,今年國內(nèi)卻顯得冷靜許多。因?yàn)橛嘘P(guān)技術(shù)趨勢的共識(shí)已經(jīng)再明顯不過:
- 多模態(tài)融合,包括語音、圖像、視頻等多個(gè)模態(tài)融合已成為國內(nèi)外科技大廠大模型升級和迭代重點(diǎn);
- Scaling Law反復(fù)被驗(yàn)證,大模型的不同流派走向統(tǒng)一;
- 軟硬件一體,產(chǎn)業(yè)鏈上下游共建的通用底座,更加呼之欲出。也只有通用底座,才是綜合實(shí)力、長治久安、基業(yè)長青、支撐千行百業(yè)“AI+”的基石。
有意思的是,這樣的洞察,也在兩會(huì)上也被提及出來了。
劉慶峰給出了全面系統(tǒng)的建議。
他建議在2017年《新一代人工智能發(fā)展規(guī)劃》的基礎(chǔ)上,系統(tǒng)性制定國家《通用人工智能發(fā)展規(guī)劃》,以頂層設(shè)計(jì)來推動(dòng)通用人工智能的發(fā)展。
與此同時(shí),相關(guān)工作也要同步展開,為此劉慶峰給出了九點(diǎn)建議。
首先第一點(diǎn),聚焦通用大模型“主戰(zhàn)場”,整合各方資源,持續(xù)加大投入。
比如包括以專項(xiàng)的形式在未來5年持續(xù)支持研發(fā)攻關(guān)、支持算力基礎(chǔ)設(shè)施建設(shè)、推動(dòng)工業(yè)和民生等領(lǐng)域的大模型應(yīng)用等。
隨后,就是加強(qiáng)源頭技術(shù)布局,圍繞通用人工智能相關(guān)領(lǐng)域,布局戰(zhàn)略性、前瞻性基礎(chǔ)研究,堅(jiān)持以源頭核心技術(shù)突破來推動(dòng)顛覆式創(chuàng)新的探索。
除了大模型技術(shù)外,還要加快腦科學(xué)與類腦智能、量子計(jì)算以及推動(dòng)AI for Science的發(fā)展。
更為具體的建議還有:
建議加快形成以國產(chǎn)大模型為核心的自主可控產(chǎn)業(yè)生態(tài)。
建議推動(dòng)國家級高質(zhì)量訓(xùn)練數(shù)據(jù)開放和共享,支持國家戰(zhàn)略科技力量以揭榜掛帥形式優(yōu)先、低成本使用。
建議出臺(tái)更加客觀、公正、可信的評測方法,推動(dòng)大模型在行業(yè)領(lǐng)域應(yīng)用的健康發(fā)展。
除此之外,他還強(qiáng)調(diào)了人才培養(yǎng)、法律法規(guī)以及倫理人文研究方面的重要性。
尤其是人才培養(yǎng),他不僅強(qiáng)調(diào)了頂尖的創(chuàng)新人才、應(yīng)用型人才的培養(yǎng),而且建議加快推廣人工智能通識(shí)教育,賦能基礎(chǔ)教育、職業(yè)教育和高等教育全學(xué)段,并且建議設(shè)立國家人工智能學(xué)院。
對于未來可能會(huì)被人工智能大量替代的行業(yè)和崗位,他認(rèn)為應(yīng)該研究新型人才能力素質(zhì)模型和培養(yǎng)方案。
這樣的洞察和建議,之所以系統(tǒng)和全面,一方面是訊飛本身是人工智能國家隊(duì),懂行。另一方面,常年的人工智能產(chǎn)業(yè)深耕,也讓它對產(chǎn)業(yè)需求有更深的洞察。
透過此次兩會(huì)上各位行業(yè)代表們的觀點(diǎn),可以看到社會(huì)的共識(shí)是:
通用大模型是必經(jīng)之路。
從全球發(fā)展來看,實(shí)現(xiàn)算力、產(chǎn)業(yè)生態(tài)的自主可控,才能保證大模型的持續(xù)迭代和應(yīng)用,在全球競爭態(tài)勢下才能占據(jù)一席之地,擁有話語權(quán)。
民生社會(huì)層面,以大模型為代表的新質(zhì)生產(chǎn)力,正成為支撐社會(huì)發(fā)展的新型基礎(chǔ)設(shè)施。從技術(shù)研發(fā)到商業(yè)落地,這條發(fā)展路線上一以貫之的最終目標(biāo),都是為各行各業(yè)提質(zhì)提效。
所以即便現(xiàn)在差距仍不可忽視,但包括國產(chǎn)大模型的核心玩家,已經(jīng)初步探索出了一條自主可控之路,賦能到各行業(yè),這也是大模型的真正價(jià)值所在。
從“互聯(lián)網(wǎng)+”到“人工智能+”,新質(zhì)生產(chǎn)力機(jī)遇,未來可期,中國可期。