字節(jié)發(fā)布豆包大模型,以普惠AI推動企業(yè)業(yè)務(wù)創(chuàng)新
原創(chuàng)根據(jù)麥肯錫的報告顯示,到2030年,大模型推動的全球經(jīng)濟增量將達到49萬億人民幣,其中中國部分的經(jīng)濟增量將達到14萬億人民幣。這里面既包括大模型對現(xiàn)有工作效率的提升,也包括新技術(shù)所帶來的新場景和新業(yè)態(tài)。
雖然我們看到更多的企業(yè)和開發(fā)者在積極擁抱大模型,甚至有些企業(yè)已經(jīng)將大模型應(yīng)用于真實的生成環(huán)境中。然而,大模型的落地卻并不是件容易的事情。
火山引擎總裁譚待指出,企業(yè)真正做好大模型有三大關(guān)鍵挑戰(zhàn),首先是模型效果,有好的基礎(chǔ)大模型才能解決復(fù)雜的問題;其次是推理成本,只有非常低的成本服務(wù),才能讓大模廣泛應(yīng)用;第三是落地難度,企業(yè)需要更多的工具、插件、平臺和應(yīng)用,才能更加容易地將大模型在更多場景落地。
火山引擎總裁譚待
在5月15日舉辦的火山引擎原動力大會上,字節(jié)跳動正式發(fā)布豆包大模型(原云雀大模型)家族,并且通過火山引擎對外提供服務(wù)。同時,火山引擎推出火山方舟平臺2.0,以及伴隨著大模型發(fā)布推出的AI應(yīng)用和AI基礎(chǔ)設(shè)施的新產(chǎn)品,幫助企業(yè)做好AI轉(zhuǎn)型。
豆包大模型家族亮相,9款模型滿足用戶不同場景需求
譚待指出,模型效果是AI落地最關(guān)鍵的一環(huán)。因為大模型只有在真實場景中落地,用的人越多,調(diào)用量越大,才能讓模型越來越好。
去年,字節(jié)跳動就完成了自主研發(fā)大模型豆包(原名云雀),字節(jié)跳動內(nèi)部50多個業(yè)務(wù)已經(jīng)大量使用豆包大模型進行AI 創(chuàng)新,包括抖音、頭條等數(shù)億DAU產(chǎn)品。截至目前,豆包大模型日均處理1200億tokens文本、生成3000萬張圖片。
為了幫助企業(yè)做好大模型場景落地,字節(jié)跳動推出豆包大模型家族,滿足企業(yè)不同場景的關(guān)鍵需求。
豆包通用模型pro:字節(jié)跳動自研LLM模型專業(yè)版,支持128k長文本,全系列可精調(diào),具備更強的理解、生成、邏輯等綜合能力,適配問答、總結(jié)、創(chuàng)作、分類等豐富場景;
豆包通用模型lite:字節(jié)跳動自研LLM模型輕量版,對比專業(yè)版提供更低token成本、更低延遲,為企業(yè)提供靈活經(jīng)濟的模型選擇;
豆包·角色扮演模型:個性化的角色創(chuàng)作能力,更強的上下文感知和劇情推動能力,滿足靈活的角色扮演需求;
豆包·語音合成模型:提供自然生動的語音合成能力,善于表達多種情緒,演繹多種場景;
豆包·聲音復(fù)刻模型:5秒即可實現(xiàn)聲音1:1克隆,對音色相似度和自然度進行高度還原,支持聲音的跨語種遷移;
豆包·語音識別模型:更高的準確率及靈敏度,更低的語音識別延遲,支持多語種的正確識別;
豆包·文生圖模型:更精準的文字理解能力,圖文匹配更準確,畫面效果更優(yōu)美,擅長對中國文化元素的創(chuàng)作;
豆包·Function call模型:提供更加準確的功能識別和參數(shù)抽取能力,適合復(fù)雜工具調(diào)用的場景;
豆包·向量化模型:聚焦向量檢索的使用場景,為LLM知識庫提供核心理解能力,支持多語言。
值得注意的是,此次字節(jié)跳動發(fā)布的9款大模型,除了通用模型Pro和lite,其他模型更加注重企業(yè)場景化需求,幫助企業(yè)快速落地大模型。
推動AI普惠,大模型價格步入“厘時代”
落地大模型,不只是要模型效果好,而且要足夠的便宜,讓每個人、每家企業(yè)都用得起大模型。為此,豆包大模型也發(fā)布了其推理價格。
以豆包通用模型pro-32k 版為例,模型推理輸入價格僅為0.0008元/千 tokens,0.8厘就能處理1500多個漢字,比行業(yè)便宜99.3%。市面上同規(guī)格模型的定價一般為0.12元/千 tokens,是豆包模型價格的150倍。
如此低廉的價格背后,原因有兩點。譚待解釋道,“在技術(shù)方面,我們采用非常多的優(yōu)化手段,例如通過模型結(jié)構(gòu)優(yōu)化調(diào)整降低成本價格;其次是工程方面采用分布式推理,更好地利用底層算力,降低成本。”
談到為何要將價格定到如此之低,譚待表示,“創(chuàng)新的事情風(fēng)險很高,特別是AI風(fēng)險會更高,當面臨非常多的不確定性時,我們必須將試錯成本降到非常低,大家才能廣泛用起來。大模型從以分計價到以厘計價,將助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新?!?/span>
為何是豆包?
據(jù)了解,字節(jié)跳動基于豆包大模型打造了AI對話助手“豆包”、AI應(yīng)用開發(fā)平臺“扣子”、互動娛樂應(yīng)用“貓箱”,以及星繪、即夢等AI創(chuàng)作工具,并把大模型接入抖音、番茄小說、飛書、巨量引擎等50余個業(yè)務(wù),用以提升效率和優(yōu)化產(chǎn)品體驗。
字節(jié)跳動產(chǎn)品和戰(zhàn)略副總裁朱駿分享了字節(jié)跳動對于豆包產(chǎn)品的思考。
字節(jié)跳動產(chǎn)品和戰(zhàn)略副總裁朱駿
豆包,看似和大模型沒有任何關(guān)系,為何字節(jié)跳動的大模型會叫豆包呢?朱駿分享了豆包名字背后的故事。在給產(chǎn)品起名時,就定下來起名的通用原則是簡單、好讀、好記。同時,也定義了三個產(chǎn)品設(shè)計原則。
第一個設(shè)計原則是“擬人化”。朱駿表示,“擬人化”是大模型產(chǎn)品的新特性,AI 除了帶來了新的能力,也帶來了新的交互方式,用和人類對齊的交互體驗,降低使用門檻,也讓用戶在使用產(chǎn)品時感覺到產(chǎn)品有類似人的溫度。因此,內(nèi)部團隊在諸多候選中選中了豆包。
其實,用戶也給豆包賦予了全新的含義,其中有兩個解釋,一是抖音的官方bot,“抖bot”諧音就是豆包;另一個是豆包就是“都包了”,工作生活學(xué)習(xí)的需求都包了,寓意是通用助手的產(chǎn)品愿景。而用戶的創(chuàng)意解釋后來也成為了朱駿認可的解釋。
第二條設(shè)計原則是需要離用戶很近,需要隨時伴隨用戶,嵌入用戶的不同使用環(huán)境。這也就意味著,豆包應(yīng)該到用戶身邊,而不是用戶到豆包身邊。為此,用戶可以在戶外隨時隨地問豆包,更方便地在移動場景互動;還可以在電腦桌面端,利用豆包更高效地工作;同時,還可以通過豆包插件在閱讀PDF或編寫代碼時,就近解決問題。
第三條設(shè)計原則是個性化。雖然通用大模型能解決非常廣泛的任務(wù),但實際上,每個用戶都有自己個性化的需求,包括對智能體的功能定位,回答風(fēng)格、聲音、形象、記憶都有非常個性化的需求。
在智能體世界里,字節(jié)跳動認為,未來用戶大概率會有一個主要的智能體(比如豆包)做最高頻的互動,解決很多任務(wù);但是也會因為個性化、多樣化的需要,和很多其他的智能體互動。
對于那些更復(fù)雜的,需要更高階能力,甚至更異構(gòu)的交互方式的智能體,字節(jié)跳動也提供了智能體定義平臺“扣子”。除了自然語言定義外,也支持通過工作流、代碼、插件,賦予這個智能體更強、更穩(wěn)定的能力。
朱駿表示,一方面大模型技術(shù)本身在不斷進步,另一方面行業(yè)里對于應(yīng)用形態(tài)和交互方式的摸索會逐漸成熟,這樣大模型產(chǎn)品會逐漸融入更多用戶的生活和工作里。
如今,豆包的用戶規(guī)模在快速增長,已經(jīng)有超過2600萬的月活用戶,和800多萬個被大家創(chuàng)建出來的智能體。
火山引擎基礎(chǔ)設(shè)施升級,多款A(yù)I應(yīng)用發(fā)布
為了更好地幫助企業(yè)落地大模型,火山引擎還升級其基礎(chǔ)設(shè)施產(chǎn)品,并發(fā)布了多款A(yù)I應(yīng)用,提供全棧AI服務(wù)。
一站式大模型服務(wù)平臺火山方舟進行了全面升級。在插件和工具鏈上,火山方舟2.0 升級了聯(lián)網(wǎng)插件,提供頭條抖音同款搜索能力,大幅提升模型的信息獲取能力;升級內(nèi)容插件,提供頭條抖音同源海量內(nèi)容,支持多模態(tài)交互,幫助大模型深入理解、檢索和生成內(nèi)容;升級知識庫插件,提供毫秒級百億規(guī)模的高性能檢索,秒級流式知識庫索引更新,內(nèi)嵌豆包向量化模型,提高搜索的相關(guān)性和準確性。此外,火山方舟2.0也全面升級了系統(tǒng)承載能力、安全防護能力和算法服務(wù)能力,幫助企業(yè)推進大模型的價值創(chuàng)造。
除了好的模型效果、便捷的插件、強勁的系統(tǒng)性能,還需要提供簡單易用的開發(fā)平臺,才能讓所有人都能成為AI應(yīng)用的開發(fā)者。火山引擎正式發(fā)布了扣子專業(yè)版??圩訉I(yè)版在扣子可視化靈活編排智能體的能力基礎(chǔ)上,進一步提供企業(yè)級SLA和多種高級特性,使AI應(yīng)用更易落地,讓企業(yè)更專注于通過智能體創(chuàng)新,驅(qū)動業(yè)務(wù)增長。
為了讓企業(yè)數(shù)據(jù)消費更普惠、更便捷,火山引擎智能數(shù)據(jù)洞察DataWind正式發(fā)布AI助手ChatBI,用戶可通過自然語言交互生成指標,用于圖表制作、數(shù)據(jù)查詢,還可進行深度數(shù)據(jù)分析,且ChatBI支持IM交互,可多端應(yīng)用,隨時隨地自助分析,這將大幅降低數(shù)據(jù)消費門檻,提升讀數(shù)、用數(shù)效率,為數(shù)據(jù)飛輪加速運轉(zhuǎn)提供動力。
面向營銷場景,火山引擎進行了智能創(chuàng)作云2.0的升級,成為從內(nèi)容創(chuàng)作、矩陣分發(fā)、廣告投放到數(shù)據(jù)洞察一站式的企業(yè)內(nèi)容營銷增長方案;不僅提供多模態(tài)的理解與生成能力,助力視頻創(chuàng)作效率提升25倍,更上線抖音話題、POI、小程序等營銷工具,使門店頁面曝光提升600%。目前已經(jīng)有3000+企業(yè)在火山引擎開啟AIGC視頻營銷增長。
面向銷售場景,火山引擎發(fā)布了銷售AI助手Sales Copilot,能夠高效跟進客戶需求,隨時輔助銷售解答復(fù)雜的產(chǎn)品問題。此外,它還能通過角色扮演的方式模擬不同風(fēng)格的對客演練,并提供優(yōu)秀話術(shù)學(xué)習(xí),提升銷售溝通質(zhì)量。
結(jié)語
正如譚待所言,好的大模型不只是榜單第一、參數(shù)量最大,或者是在PPT中超越GPT4,而更多的應(yīng)該是大的使用量才能打磨出好模型。
如今,豆包大模型和火山方舟2.0已經(jīng)在金融、汽車、智能終端、電商零售、教育科研等多個行業(yè)實踐落地。招商銀行、海底撈火鍋、超級猩猩、攜程旅游、飛常準、獵聘等企業(yè)也已經(jīng)在扣子上搭建了智能體。復(fù)旦大學(xué)、浙江大學(xué)等名校也為課程和實驗搭建了 “AI 助教”。
相信,在大模型“厘時代”,好的大模型將會加速更多企業(yè)真正落地,借助大模型來實現(xiàn)業(yè)務(wù)創(chuàng)新。