大模型燒錢戰(zhàn)“卷”出白菜價,李開復(fù)、王小川為何拒絕入局? 原創(chuàng)
撰稿丨今日晴
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
暗流涌動的大模型圈,幾乎毫無征兆地開啟了價格戰(zhàn)。
近一周時間,字節(jié)跳動、阿里巴巴、百度、騰訊等多家廠商紛紛調(diào)整旗下大模型產(chǎn)品的定價策略,宣布面向企業(yè)市場的API價格下調(diào),動輒下調(diào)90%以上,更有甚者直接宣布免費。
值得注意的是,在這場硝煙彌漫的肉搏戰(zhàn)里,主力多是云巨頭,他們所售賣的模型服務(wù)往往是與云服務(wù)緊密綁定的。而大模型初創(chuàng)公司卻頂住了壓力,普遍并未有太多動作。零一萬物的創(chuàng)始人李開復(fù)直接對外表示,瘋狂降價是雙輸;百川智能的創(chuàng)始人王小川也回應(yīng):百川不會摻和到價格戰(zhàn)當(dāng)中。
1.字節(jié)打響大模型降價第一槍
5月15日,字節(jié)跳動豆包大模型率先打響第一槍,宣布主流大模型在企業(yè)市場的定價為0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業(yè)便宜99.3%。這一招徹底推動大模型從“以分計價”進入到了“以厘計價”階段,并聲稱已經(jīng)擊穿了大模型行業(yè)的最底價,堪稱“價格屠夫”。
不過,超低的定價并不代表實際使用的價格。從豆包大模型的官網(wǎng)價格頁來看,128k模型的0.0008元/千Tokens定價實際為模型推理服務(wù)的輸入價格,還需要為模型的輸出價格付費0.002元/千tokens。
圖片
另外,價格單中展示的價格為“后付費”模式,指企業(yè)先消耗tokens,然后為其買單。但對于模型的高并發(fā)、穩(wěn)定性有更高要求的用戶,還需要采用“預(yù)付費”的模式,獲得模型廠商的服務(wù)保障,這也會導(dǎo)致實際的使用價格比展示的定價更貴一些。
圖片
即便如此,大模型的降價潮已成定勢。
有業(yè)內(nèi)人士分析,一些大模型以開源模型為基座,本來成本就低,所以本身還存在降價空間;亦有分析認為,大模型降價主要是為了快速搶占市場,普惠市場才能真正提升使用量,才能更好地打磨出好模型,讓生態(tài)更完善。
不管實際情況如何,大家心知肚明的一點是,“只要有一家較大的廠商開始降價,其他廠商也會基于壓力開始跟隨,要不然就可能掉隊?!?/p>
2.四巨頭緊隨其后
果不其然。
21日,阿里云發(fā)布降價公告,通義千問9款模型齊降價。其中,對標GPT-4的商業(yè)化模型Qwen-Long的API輸入價格從0.02元/千Tokens降至0.0005元/千Tokens,直降97%;輸出價格降至0.002元/千Tokens,比原來定價直降90%。阿里的這一輪操作力度,被視作對市場的又一大沖擊。
圖片
同樣在21日,百度智能云緊隨其后,宣布文心大模型兩大主力模型ERNIE Speed、ERNIE Lite全面免費,立即生效。據(jù)百度有關(guān)負責(zé)人介紹,這兩款模型于今年3月推出,支持128k、8k上下文長度,是目前百度文心大模型系列中服務(wù)用戶最多的模型型號。
22日,騰訊云也放出殺招,宣布多款混元模型免費或降價。其中混元-lite模型免費,混元-standard-256k輸入價格下調(diào)87.5%至0.015元/千tokens,輸出價格下降50%至0.06元/千tokens。萬億參數(shù)模型混元-pro,API輸入價格則從0.1元/千tokens降至0.03元/千tokens。與此同時,騰訊云正式對外宣布旗下AI代碼助手全面對外開放,目前開發(fā)者、開發(fā)團隊、企業(yè)客戶可以通過騰訊云官網(wǎng)在線體驗。
圖片
同在22日,科大訊飛宣布旗下大模型訊飛星火API能力正式免費開放。其中,訊飛星火Lite API永久免費開放,訊飛星火Pro/Max API低至0.21元/萬tokens。科大訊飛表示,在訊飛星火,1Token相當(dāng)于1.5個中文漢字,因此2.1元就足夠調(diào)用“訊飛星火3.5 Max”生成一部余華《活著》的內(nèi)容量。
另外放眼國外的話,其實還可以發(fā)現(xiàn),自去年以來,OpenAI已經(jīng)進行了多次降價,13日,OpenAI發(fā)布GPT-4o,表示面向ChatGPT的所有付費和免費用戶發(fā)布,取消其他所有限制,API價格也降價50%。
3.最便宜的不一定能贏得商戰(zhàn)
面對大模型近乎白菜價的甩賣,各方人士對于其直接作用和后續(xù)影響有著不同看法。
有人說,價格戰(zhàn)實際是大模型產(chǎn)品同質(zhì)化加劇的惡果,降價成為了爭奪市場份額的最直接的獲客策略。不過也有人認為,大模型價格戰(zhàn)并非盲目以虧損換流量,有技術(shù)進步作為控制成本的底氣,以此鼓勵用戶在更多場景探索落地,先把應(yīng)用場景鋪開再談其他。
火山引擎總裁譚待在接受媒體采訪時曾表示,“用虧損換收入是不可持續(xù)的,所以豆包大模型從來不走這條路。至于為什么可以這樣降價,因為我們有很多手段把成本做得很好。大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本?!?/p>
百川智能CEO王小川也對“降價戰(zhàn)”發(fā)表了自己的看法。與移動時代的燒錢不同,王小川認為降價是技術(shù)進步的結(jié)果。“大廠也預(yù)期未來模型的成本會降低特別多,也許今天虧錢,再過一年就不虧錢。我覺得大家對模型降價本身也有推理成本的降低的預(yù)期,就是因為技術(shù)進步?!?/p>
不過,也有人覺得降價策略并不會對商業(yè)化造成實質(zhì)性影響。
Lepton AI 創(chuàng)始人、阿里巴巴原副總裁賈揚清認為,企業(yè)在使用AI的時候,并不是成本驅(qū)動。不是因為API貴才沒人用,而是因為企業(yè)首先得搞清楚怎么用來產(chǎn)生業(yè)務(wù)價值?!耙苍S不是最便宜的贏得商戰(zhàn),而是能落地的贏得利潤?!?/p>
選擇使用大模型產(chǎn)品到底能給其業(yè)務(wù)帶來多少增長,才是企業(yè)用戶最為關(guān)心的。
獵豹移動董事長兼CEO傅盛直言,“這次大降價基本宣告了大模型創(chuàng)業(yè)公司必須尋找新的商業(yè)模式。短期來看,大模型的性能遇到了瓶頸,誰也甩不開誰,誰也拿不出殺手锏,降低推理成本,降低售價成了現(xiàn)在每一家的高優(yōu)先級任務(wù)?!?/p>
他表示,本輪AI大模型降價的目標不是為了用戶更多的直接使用,而是為了吸引開發(fā)者。這輪降價對企業(yè)用戶影響有限。因為企業(yè)用戶需要A1應(yīng)用,更關(guān)心數(shù)據(jù)安全?,F(xiàn)在開源小參數(shù)大模型加應(yīng)用套件,可以滿足絕大多數(shù)的企業(yè)需求了,但套件定制的費用誰也省不掉,私有化大模型的成本已經(jīng)很低。
4.創(chuàng)業(yè)公司的另一種選擇:不卷價格,卷性能
巨頭們跟進大模型價格戰(zhàn)步履匆匆,但大模型創(chuàng)業(yè)公司對此態(tài)度不一。大模型“五小龍”之中,除了智譜AI已在此前宣布降價以外,其余幾家目前尚未對價格進行調(diào)整。李開復(fù)和王小川均于近日進行了回應(yīng),表示不會跟進降價。
這幾家創(chuàng)業(yè)公司的掌舵人似乎都傾向于:不盲目卷入價格戰(zhàn),而是要堅持在自身的模型性能上發(fā)力。
李開復(fù)近期在一次訪談中表示,對于降價這個現(xiàn)象值得關(guān)注,零一萬物也在花很大精力希望能夠讓它再降下來,并預(yù)計整個行業(yè)每年降低10倍推理成本是可以期待的。但李開復(fù)明確在大模型領(lǐng)域,自己不會玩“ofo”瘋狂降價模式的打法,“因為技術(shù)還是最重要的,如果是技術(shù)不行,就純粹靠貼錢賠錢去做生意,我們絕對不會跟這樣的一個定價來做對標,我們對自己的模型表現(xiàn)是非常自豪的?!?/p>
李開復(fù)透露,零一萬物選擇了一條“高精尖”路線,“對要求最高的,需求最高的,需要最好模型的,他們當(dāng)然用我們。100萬個token花十幾塊還是花幾塊錢有很大差別嗎?”
王小川對于價格戰(zhàn)的看法也有其自身的理解。他判斷,這一輪大廠降價的實質(zhì)是云廠商進到新戰(zhàn)場,降價不僅是這些大廠射程范圍內(nèi)的事,也是僅限于云廠商的動作。如果是針對企業(yè)端服務(wù),這場戰(zhàn)爭最后也會變成售賣整套云服務(wù)而不是模型本身。這很像曾經(jīng)發(fā)生在“AI四小龍”身上的故事。王小川稱自己并未因眼前正在發(fā)生的爭端而產(chǎn)生任何焦慮,但他建議創(chuàng)業(yè)公司不要摻和進去。
另一個有趣的現(xiàn)象,與愈演愈烈的降價大潮形成鮮明對比的是,就在前幾天,主打免費的月之暗面開始試探讓用戶付費的可能,一些使用Kimi的重度用戶在高峰時段Kimi因為算力不足,彈出一個對話框表示:“急需Kimi?‘點擊這里’給Kimi加油,高峰時期優(yōu)先使用。”
用戶在點擊鏈接后會彈出一個新的頁面,上面是包含不同價格和對應(yīng)時長的“打賞方案”,包括5.2元/4天,9.99元/8天,28.8元/23天,49.9元/40天,99元/93天,399元/365天。
這些充值方案對應(yīng)的打賞話術(shù)也比較有趣,相較普通產(chǎn)品更貼近用戶生活,強調(diào)交互感。它寫的是“送Kimi一朵花”、“給Kimi加雞腿”,以及請喝咖啡、充充電、請吃頓飯和一起登月。除了“登月”,這些場景描述對應(yīng)的消費與方案價格相匹配。
對話頁面下方的《Kimi支付協(xié)議》解釋道,在高峰時段Kimi算力不足時,產(chǎn)品將在Kimi實際可調(diào)用的推理算力范圍內(nèi),優(yōu)先保障獲得服務(wù)用戶的推理算力。這個思路有點像B端用戶的“預(yù)付費”邏輯。
圖片
5.寫在最后
大模型賽道的戰(zhàn)火延綿至今,已經(jīng)過去一年有余,大模型廠商作為掌握這項魔法的基建提供方,似乎正在來到新的賽點。移動時代的阿里、字節(jié)、百度、騰訊等當(dāng)然熟悉那個年代的商戰(zhàn)存活規(guī)則,不過大模型時代之下,似乎“燒錢”模式并非適用于今天的生長環(huán)境。我們也有理由相信,這波降價背后,離不開推理技術(shù)的進步。
此番降價大戰(zhàn),表面上看著實類似當(dāng)年的瘋狂爭搶用戶規(guī)模的打法,但熱衷于為企業(yè)內(nèi)部部署大模型的決策者們究竟會因為“API降價甚至免費”而采取更激進的決定嗎?
未必,大模型遠不止是成本的問題,技術(shù)、成本、市場、需求、安全,一個都不能少。而且在大模型賽道上,大廠有大廠的路徑,創(chuàng)業(yè)公司有創(chuàng)業(yè)公司的堅持?;蛟S降低成本是加速驗證大模型應(yīng)用價值的助推器,但歸根結(jié)底,大模型效果好不好用,能不能帶來業(yè)務(wù)增長才是制勝的關(guān)鍵。
來源: ??51CTO技術(shù)棧??作者:今日晴
