企業(yè)“入坑”大模型,為什么建議大廠出品?
國外GPT-3.5發(fā)布不到一年,國內(nèi)文心一言發(fā)布不到半年,國內(nèi)已經(jīng)快進(jìn)到“百模大戰(zhàn)”。入局者既有大廠,也有大量初創(chuàng)公司。然而,大模型競爭激烈,企業(yè)用戶如果沒有練就一雙“火眼金睛”,很有可能踩坑,從而造成項(xiàng)目爛尾的后果。
一些大廠的大模型,例如文心大模型、通義千問、盤古大模型等,正在逐漸拉開差距。SuperCLUE最新測評榜單顯示,文心一言已經(jīng)超越GPT-3.5turbo,GLM-130B等國產(chǎn)大模型也在榜單前列。國內(nèi)大模型從數(shù)量來看已成世界重要一極,從質(zhì)量來看也在迅速追上最先進(jìn)的GPT-4。
“百模大戰(zhàn)”的背后,業(yè)界均看好大模型技術(shù)創(chuàng)新推動產(chǎn)業(yè)數(shù)字化,創(chuàng)造萬億級的市場價(jià)值。從當(dāng)下來看,以文心一言、通義千問為代表的“大廠出品”大模型,在技術(shù)層面占據(jù)著優(yōu)勢地位,在市場層面也通過構(gòu)建產(chǎn)業(yè)生態(tài),贏得了更多項(xiàng)目合作。
為何相比初創(chuàng)公司,大廠出品的大模型更加強(qiáng)大、更受客戶青睞?在筆者看來,主要有三個原因:
首先,大模型最終要落地到行業(yè)場景應(yīng)用,不是簡單的“一錘子買賣”。大廠作為更加穩(wěn)定、安全、可靠的象征,普遍在AI技術(shù)底座方面有著充足的積累。企業(yè)客戶往往聚焦于應(yīng)用層面,不一定具備很強(qiáng)的底層AI技術(shù)積累。百度、阿里巴巴、華為等大廠已經(jīng)打造了備受實(shí)戰(zhàn)考驗(yàn)的AI底座,反觀初創(chuàng)公司,不乏技術(shù)創(chuàng)新的亮點(diǎn)于突破,但從全棧AI技術(shù)底座積累和長期、穩(wěn)定服務(wù)客戶角度來看,綜合能力于續(xù)航水平尚且存疑。
其次,大廠有更強(qiáng)的綜合實(shí)力投資大模型技術(shù)迭代開發(fā)。例如百度能夠調(diào)動全集團(tuán)之力開發(fā)文心一言,最新迭代的文心大模型3.5,相比3.0版本,推理速度提升17倍,模型效果提升超過50%。反觀風(fēng)頭最勁的初創(chuàng)公司光年之外,不到半年就選擇了“賣身”美團(tuán)。一些基于開源技術(shù)開發(fā)的大模型,缺乏足夠的底層技術(shù)積累和自主演進(jìn)能力。
據(jù)市場研究公司IDC最新發(fā)布的《AI大模型技術(shù)能力評估報(bào)告,2023》報(bào)告顯示,百度文心大模型3.5拿下12項(xiàng)指標(biāo)的7個滿分,包括“算法模型”、“行業(yè)覆蓋”兩個關(guān)鍵指標(biāo),綜合評分第一;排名第二的阿里巴巴通義大模型則在11項(xiàng)指標(biāo)中獲得6項(xiàng)滿分,是唯一一家“服務(wù)能力”滿分的廠商。
第三,大模型落地行業(yè)場景,后續(xù)的服務(wù)交付、運(yùn)維等,對大廠而言是“駕輕就熟”,對初創(chuàng)公司則是艱難挑戰(zhàn)。大廠則能夠?qū)Υ怪毙袠I(yè)、重點(diǎn)客戶配備專屬服務(wù)團(tuán)隊(duì),免除客戶擁抱新技術(shù)的后顧之憂,而初創(chuàng)公司往往缺乏服務(wù)政企客戶的經(jīng)驗(yàn)積累,基于開源技術(shù)開發(fā)的大模型產(chǎn)品應(yīng)用,要做好全流程服務(wù)是勉為其難。
綜上,大模型不僅看各種技術(shù)參數(shù),更在于行業(yè)落地應(yīng)用,看行業(yè)“Know-how”和成功經(jīng)驗(yàn)。大廠出品無論是技術(shù)開發(fā)、行業(yè)應(yīng)用和服務(wù),當(dāng)下都占據(jù)著優(yōu)勢地位。當(dāng)然,“百模大戰(zhàn)”也許不是十幾年前的“百團(tuán)大戰(zhàn)”,最后只有2個勝利者。大模型還在發(fā)展初期,后續(xù)還有更多可能性,包括超越GPT-4以及更多歐美競品的可能性。