整理 | 伊風
采訪 | 張曉楠
嘉賓 | 巴川、朱雷、肖然
出品 | 51CTO技術棧(微信號:blog51cto)
作為AIGC應用落地元年,2024開年就拋給我們一些不太好回答的問題:
- 在以探索AGI為長期目標時,我們該堅守技術信仰嗎?
- 除了復制國外GPT-4、Sora這樣的成功案例,我們該如何尋求更大發(fā)展和突破?
- 即便算力問題得以解決,算法的難題如何跨越?
- 國內(nèi)企業(yè)為什么大都部署多個大模型?為什么并非所有企業(yè)都該擁抱AIGC?
前不久51CTO全新直播欄目《AIGC實戰(zhàn)派》有幸邀請到競技世界首席數(shù)據(jù)科學家巴川,元語智能聯(lián)合創(chuàng)始人兼COO、SuperCLUE社區(qū)發(fā)起人朱雷以及Thoughtworks中國區(qū)總經(jīng)理、中關村智聯(lián)創(chuàng)新聯(lián)盟秘書長肖然,在對談中回答以上疑問。
1.“技術信仰派”還是“市場信仰派”,只是一時之爭
51CTO: 在大模型“技術信仰派”與“市場信仰派”之爭中,你們站哪一派?這背后又折射了怎樣的一種現(xiàn)實?
巴川:我思考過這個問題,但是沒能給出一個非黑即白的答案。就長期而言我傾向于技術信仰派,因為技術進步是推動生產(chǎn)力發(fā)展的關鍵因素,雖然現(xiàn)在AIGC被炒得非常熱,但其長期影響力仍然是被低估的。
但在短期內(nèi),大模型技術所能產(chǎn)生的影響又被高估了,這種誤判算是技術落地和廣泛應用的一個必經(jīng)階段。短期內(nèi),AIGC將不斷向各行各業(yè)泛化,從這點來看,市場信仰派的觀點也很有價值。
朱雷:我是堅定的技術信仰派,就目前看,我認為技術派的勝算更大,因為推動大規(guī)模數(shù)據(jù)訓練和參數(shù)量的躍升已經(jīng)是全球性的技術共識,大家都在“卷”技術、搶人才。
對于市場派的觀點,我認為技術需要服務于用戶和客戶,解決具體的業(yè)務問題,這個站位和邏輯也沒有問題。然而,在以探索AGI為長期目標時,國內(nèi)需要一些堅持技術信仰的團隊,他們以長期研究和技術突破為目標,將商業(yè)化應用作為支持研發(fā)和基礎架構試錯的一種手段。
國內(nèi)有幾家大模型公司我是很看好的,因為他們在技術層面有獨到的見解,比如做RAG搜索增強、長文本等等。但他們也沒有只做技術,也在各自的技術路線上嘗試了多種應用,如角色扮演、游戲、效率工具等。我覺得正因為他們有技術信仰,所以會在自己的應用上思考的更長遠一點。
相反,如果僅從商業(yè)化的角度出發(fā),忽視技術的成熟度,這種做法從長期看是特別危險的。我們可以看到,隨著AI技術的不斷進步,一些早期的AI應用已經(jīng)失去了競爭力。OpenAI的Sora一旦對外開放,就將“殺死”很多小的AI視頻剪輯、自動化生成工具。因此,在AGI的早期階段,一定要保持技術前瞻性,去做長期的投入和研究。
肖然:在AI技術浪潮中,真正盈利的往往是提供工具的一方,而非單純追求市場應用的一方。這些工具,如RAG、Raptor等,本質(zhì)上是技術產(chǎn)品,它們的市場價值在于支持和促進技術創(chuàng)新。
所以,技術的快速發(fā)展已經(jīng)使得所謂的市場化變得不那么重要,因為需求實現(xiàn)的過程已經(jīng)被極大程度地壓縮了。年輕一代,即使沒有深厚的計算機背景,也能在短時間內(nèi)學會構建智能應用。這表明,我們正在進入一個新時代,其中技術和市場之間的界限變得模糊。
從當前的角度來看,技術的重要性更為突出。如果你想創(chuàng)造出能夠完成更多任務的智能化產(chǎn)品,這非常依賴于底層基礎模型的發(fā)展。只有基礎模型得到提升,我們才能完成更多、更復雜的任務。
2.如果都是“市場派”邏輯,追上國外會變得更難
51CTO : 對比國外,國內(nèi)大模型會面臨哪些不同?你們對國內(nèi)大模型市場抱有哪些期待?
巴川:從算力角度來看,我們雖然在迎頭追趕,但仍然存在差距。芯片核心技術在國外手里,這直接影響了我們獲取最先進硬件的能力;另外,顯卡的采購困難和禁售帶來的價格飛漲也對我們產(chǎn)生了直接影響。
在算法方面,雖然很多人認為國內(nèi)外的算法水平?jīng)]有太大差異,但我們使用的基礎框架,如Transformer等,大多還是來自國外。盡管國內(nèi)的一些公司也在嘗試開發(fā)自己的框架,但離落地應用、甚至成為主流框架還差很多。
在數(shù)據(jù)方面,我認為國內(nèi)是有獨特優(yōu)勢的?;ヂ?lián)網(wǎng)快速發(fā)展的一二十年里,我們積累了大量數(shù)據(jù),特別是在垂直領域,一旦某個應用推廣開來,就能夠迅速覆蓋數(shù)億用戶,這是歐美尤其是歐洲難以做到的。這樣的用戶基數(shù)使得我們能夠快速積累用戶數(shù)據(jù),并在特定垂直領域快速實現(xiàn)應用的落地和迭代。
朱雷:在我看來,國內(nèi)外在大模型市場上的主要差異體現(xiàn)在發(fā)展節(jié)奏和目標上。比如OpenAI和谷歌下面的DeepMind,他們的目標更多地集中在實現(xiàn)AGI上。雖然他們也在推進商業(yè)化,但視野更為長遠,并在安全和基礎架構上進行了深入研究和探索。
相比之下,目前國內(nèi)更多地在復制國外的成功案例,如GPT-4和Sora等。不過盡管如此,國內(nèi)公司融資充足,人才儲備也具備一定水平,且具有全球化視野,這有助于我們在數(shù)據(jù)規(guī)模和質(zhì)量上進行補充。
我認為,國內(nèi)的期待在于未來五年內(nèi)能否在基礎架構上取得突破,而不是僅僅跟隨國外的技術發(fā)展。目前,國內(nèi)正在努力追趕GPT-4的水平,同時也有探索非Transformer架構的嘗試。因為Transformer架構本身存在局限性,預測下一個token,并不是真實世界的邏輯,因此這個架構并不能做出世界模型。
肖然:即便算力問題得到緩解,我們?nèi)匀幻媾R著代際算法差異的挑戰(zhàn)。目前,國內(nèi)的大模型技術多在復制和追趕國外的成就,并嘗試做成功產(chǎn)品的理解和復現(xiàn)。但真的去做一些研究,比如Transform架構的根本突破在哪里,國內(nèi)相關的討論又太少,我們需要更多的聲音和研究來探討和實現(xiàn)下一代的算法革新。
在應用層面,國內(nèi)的大模型應用多集中在企業(yè)內(nèi)部,而國外的模型精度更高,To C產(chǎn)品更為豐富。這背后的核心原因在于底層模型的成熟度差異。國內(nèi)企業(yè)被迫去做模型微調(diào)和基礎算力設施,通過這些應用手段,提升模型在特定領域的精度。
我樂觀估計,國內(nèi)的算力問題正在得到國家層面的有效解決。但同時,我擔心的是,當我們解決了算力和模型精度問題后,國際上可能出現(xiàn)新的算法突破,而科技巨頭會效仿OpenAI選擇閉源,屆時我們就會被拉大算法的代際差距。
3.AI太重要了,企業(yè)多模型部署“留后路”
51CTO: 具體到國內(nèi)企業(yè)部署和采用大模型,你們發(fā)現(xiàn)有哪些值得關注的特點,或者一些有趣的現(xiàn)象?這背后的深層原因是什么?
朱雷:我觀察到國內(nèi)企業(yè)往往會同時部署多個大模型。在與各行各業(yè)的企業(yè)接觸中,包括央企和上市公司,我發(fā)現(xiàn)他們會同時采購兩三家公司提供的大模型,并結合一些開源模型進行微調(diào)。這些企業(yè)會利用向量數(shù)據(jù)庫和增強工具,使得基于大模型構建的應用背后有多個模型支撐。
這種現(xiàn)象背后的原因可能有幾個方面。首先,AI大模型目前被認為非常重要,因此企業(yè)愿意投入較多預算。隨著開源能力的提升,大模型的部署成本已經(jīng)降低,盡管后續(xù)的數(shù)據(jù)清洗和模型推理可能成本較高,但采購模型本身已經(jīng)變得相對便宜。
其次,當前大模型的能力還比較有限,特別是在特定行業(yè)的應用上。這就導致企業(yè)在應用大模型時會部署多個模型,以期望不同模型在不同方面的能力可以互補。
最后,AI的重要性不言而喻,但企業(yè)對于國內(nèi)大模型的發(fā)展前景還不太確定,因此他們傾向于嘗試多個模型,以觀望哪個模型能夠更好地發(fā)展,以免選錯后對企業(yè)造成較大損失。
肖然:從成本來看,盡管模型本身的成本已經(jīng)降低,但與之配套的運維成本卻相對較高。企業(yè)在微調(diào)大模型時需要投入額外的資源來管理知識庫和優(yōu)化整個數(shù)據(jù)處理流程,這導致了需要額外雇傭?qū)I(yè)人員來維護和優(yōu)化這些模型。而部署的多模型,每個基礎模型相對小一些,微調(diào)后能達到專事專用的效果。
此外,大型組織更有可能部署自有模型,而小型組織則不太可能考慮這一選項。在大型企業(yè)中,各個部門可能會根據(jù)自己的需求獨立部署和使用不同的模型。這種分散的部署方式雖然短期內(nèi)看似效率不高,但實際上有助于保護組織結構擁有一定的自由空間,允許各部門根據(jù)自己的業(yè)務需求靈活調(diào)整。
最后,企業(yè)特別希望大模型的能力能夠與現(xiàn)有的工具鏈相結合,而不是完全替換現(xiàn)有的工作流程。例如,企業(yè)可能更愿意在現(xiàn)有的辦公平臺上集成模型來輔助工作,比如釘釘AI這樣的設計,而不是遷移到一個全新的系統(tǒng)中去。
51CTO:企業(yè)的模型部署、AIGC應用等等由哪個部門負責?
肖然:數(shù)字化能力強的公司可能會成立專門的人工智能中心,來負責模型和算力的相關工作,而應用則由具體實踐這些工具的相關部門負責。
在為企業(yè)部署AI能力時,負責牽頭的角色往往是CIO或CTO。然而,隨著人工智能戰(zhàn)略的重要性日益增加,一些企業(yè)包括我們自己公司開始設立CAO(Chief AI Officer)來專門負責人工智能戰(zhàn)略的制定和執(zhí)行。從長遠來看,或許越來越多的企業(yè)會設置類似CAO的崗位。
巴川:我們公司算是一個典型的中型互聯(lián)網(wǎng)游戲公司,我們有一個技術中臺,其中包括大數(shù)據(jù)、機器學習和深度學習等方向。技術中臺自然成為了大模型應用的主要推動者。同時,我們的業(yè)務部門,比如說美術部門、銷售部門,也在自下而上的擁抱技術變革。
我們也在嘗試多個模型,因為目前還不清楚哪個模型更合適。在這個過程中,我們會直接調(diào)用接口,也會對大模型進行微調(diào)。這其中涉及到成本和產(chǎn)出比的問題,業(yè)務部門會根據(jù)業(yè)務場景直接評估性價比,決定是否值得投入。
然而,技術部門在推動大模型應用時,可能會發(fā)現(xiàn)性價比并不高,這時我們的步伐就會受到限制。一些大模型,比如馬斯克最近發(fā)布的Grok開源大模型,雖然下載不難,但能運行起來的機器需要200萬成本,這就需要我們仔細考慮場景的適用性和成本效益,雖然我們自己也很好奇效果,但如何能說服管理者批預算是個難題。
對于中小公司來說,通用大模型的成本可能是難以承受的,可能需要大廠或國家意志整合資源才能實現(xiàn)。此外,我們也在思考,專注于特定業(yè)務場景的大模型是否會讓我們離AGI越來越遠。
4.“新質(zhì)生產(chǎn)力”AI+,已經(jīng)敲開了技術變革的門
51CTO:隨著大模型采購成本下降以及垂類模型的成熟,所有企業(yè)都應該擁抱大模型嗎?AIGC能在未來成為所有企業(yè)的剛需嗎?
巴川:隨著成本不斷下降,我認為中小企業(yè)完全有可能開始使用大模型。在形式上,他們可能會更多地選擇直接調(diào)用現(xiàn)有的大模型接口,利用其能力來降本增效,并在特定的市場業(yè)務場景中創(chuàng)造價值。而大型企業(yè),如百度、阿里,可能會開發(fā)自己的模型,以保持技術壁壘和市場競爭力。
從國家層面來看,整合資源開發(fā)具有自主知識產(chǎn)權的大模型也是非常重要的,這不僅是技術追求,也是社會責任的體現(xiàn)。必須有人去開發(fā)大模型這樣的基礎設施。
肖然:AIGC就屬于國家提出的“新質(zhì)生產(chǎn)力”這個概念,隨著技術的進步,未來的情況將與現(xiàn)在大不相同,盡管可能不會有像iPhone那樣的顛覆性時刻,但人工智能的應用仍會讓人眼前一亮。
從這個角度來看,并不是所有企業(yè)都需要自己部署模型。隨著問題逐漸被解決,特別是走向AGI時,企業(yè)可能不再需要自己擁有模型。正如黃仁勛所說,“打敗你的不是AI,而是使用AI的人”。
朱雷:雖然大模型和AI技術的成本正在下降,但目前大多數(shù)企業(yè)的核心業(yè)務流程還不能依賴于大模型。目前,大模型的應用主要集中在相對邊緣的業(yè)務上,成本的降低并不直接等同于可以落地實施。真正要影響企業(yè)核心業(yè)務的落地,除了成本,還需要模型在準確性和推理速度上達到可用的水平,而目前這個階段還有相當大的差距。
5.“賣鏟子”是門好生意,引領應用新趨勢是“天花板”
51CTO:如何判斷一款AIGC應用是否優(yōu)秀呢?有什么標準嗎?
巴川:我會首先考慮合規(guī)性,這對于公司的業(yè)務至關重要;其次,AIGC生成的內(nèi)容是否有C端用戶愿意買單,這是一個直接且重要的評判標準;此外,我希望能夠看到應用中有些特色,能夠把相關的數(shù)據(jù)積累用起來,形成一定的壁壘。
肖然:我認為這個時代值得做的生意就是“賣鏟子”。使用AIGC技術提供工程化支持的工具和服務——是一個有前景的事情。直接做大模型的門檻太高了,不適合一般的玩家入場。無論AIGC應用是面向C端還是B端,都需要將這些技術工程化、規(guī)?;尳M織能在內(nèi)部享受到AI技術帶來的便利。
如果涉及到直接面向消費者的應用,我會在合規(guī)的基礎上增加對高頻場景替代的考量。我喜歡那些能夠改變用戶習慣、增加用戶粘性的應用。
朱雷:從長遠來看,我認為AIGC應用在交互方面還有很大的創(chuàng)新空間。盡管目前市面上已有一些成熟的交互模式,如智能音箱和流程機器人,但未來可能會有新的交互模式出現(xiàn),特別是適合AGI的新型交互模式,我期待在國內(nèi)看到這樣的創(chuàng)新。