WOT全球技術(shù)創(chuàng)新大會(huì)圓滿閉幕:在大模型、AIGC賽道持續(xù)狂奔
原創(chuàng)圖片
1.技術(shù)成就夢(mèng)想
在大會(huì)致辭中,51CTO副總裁、數(shù)字化轉(zhuǎn)型與技術(shù)力研究院院長(zhǎng)楊文飛表示:數(shù)字時(shí)代,以AI為代表的數(shù)字技術(shù)成為改變世界的革命性力量,基于數(shù)字技術(shù)的創(chuàng)新成為決定企業(yè)生存的核心動(dòng)力,而人才則是支撐創(chuàng)新的關(guān)鍵因素。數(shù)據(jù)顯示,我國(guó)數(shù)字化專業(yè)人才缺口持續(xù)擴(kuò)大,而數(shù)字化技術(shù)的半衰期卻在快速下降、崗位所需要的技能數(shù)量持續(xù)增加??梢哉f(shuō),數(shù)字技術(shù)人才的培養(yǎng),已經(jīng)成了決定數(shù)字產(chǎn)業(yè)發(fā)展的重要因素。
十九年來(lái),51CTO始終堅(jiān)持“技術(shù)成就夢(mèng)想”的理念,致力于把技術(shù)進(jìn)步的價(jià)值傳播給每個(gè)企業(yè)和個(gè)人,幫助一億數(shù)字化人才終身成長(zhǎng)。到目前為止,51CTO已經(jīng)累計(jì)培養(yǎng)超過(guò)800萬(wàn)名數(shù)字化人才,每年為數(shù)千家企業(yè)提供數(shù)字化人才咨詢、培養(yǎng)和認(rèn)證服務(wù),成為中國(guó)數(shù)字化專業(yè)人才培養(yǎng)的主力軍。
圖片
2.邁入智能信息獲取新時(shí)代
中國(guó)人民大學(xué)高瓴人工智能學(xué)院副院長(zhǎng)竇志成帶來(lái)《生成式信息檢索:邁入智能信息獲取新時(shí)代》的分享。
上世紀(jì)90年代開(kāi)始,以“搜索引擎”為代表的信息檢索技術(shù)極大地提升了人類從海量互聯(lián)網(wǎng)數(shù)據(jù)中獲取信息的效率,成為日常生活中不可或缺的工具。而近期出現(xiàn)的以ChatGPT為代表的生成式大語(yǔ)言模型則有望深刻改變?nèi)藗儷@取信息的方式,促進(jìn)信息獲取技術(shù)的更新升級(jí),進(jìn)而可能會(huì)改變或者替代掉傳統(tǒng)搜索引擎。在此背景下,生成式信息檢索(Generative Information Retrieval,GenIR)得到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。
在分享中,竇志成詳細(xì)介紹了中國(guó)人民大學(xué)高瓴人工智能學(xué)院在生成式信息檢索領(lǐng)域開(kāi)展的部分工作,包括面向信息檢索的大模型、生成式文檔檢索、以及檢索增強(qiáng)的生成,并探討未來(lái)發(fā)展方向。
圖片
3.用AI驅(qū)動(dòng)增長(zhǎng)
火山引擎大模型服務(wù)算法負(fù)責(zé)人王科帶來(lái)《火山引擎大模型服務(wù),用AI驅(qū)動(dòng)增長(zhǎng)》的分享。
王科指出,只有大的使用量,才能打磨出好模型。在字節(jié)跳動(dòng)內(nèi)部,豆包大模型的實(shí)踐極為豐富,截止今年4月,豆包大模型日均處理1,200億 tokens 文本、生成3,000萬(wàn)張圖片。豆包App、貓箱、扣子、即夢(mèng)Dreamina等都是字節(jié)跳動(dòng)內(nèi)部基于豆包大模型孵化的孵化的產(chǎn)品。這些豐富的使用場(chǎng)景為底座模型——豆包大模型帶來(lái)了正向循環(huán)效果。
通過(guò)字節(jié)跳動(dòng)內(nèi)部50+業(yè)務(wù)場(chǎng)景實(shí)踐驗(yàn)證,每日千億級(jí)tokens大使用量持續(xù)打磨,豆包大模型以優(yōu)質(zhì)的模型效果為企業(yè)打造豐富的業(yè)務(wù)體驗(yàn)。豆包大模型家族包括:豆包通用模型pro、豆包通用模型lite、豆包·角色扮演模型、豆包·語(yǔ)音合成模型、豆包·聲音復(fù)刻模型、豆包·語(yǔ)音識(shí)別模型、豆包·文生圖模型、豆包·Function call模型、豆包·向量化模型。
此外,火山引擎推出的火山方舟一站式大模型服務(wù)平臺(tái),既具備強(qiáng)大的系統(tǒng)承載力,能夠保障業(yè)務(wù)穩(wěn)定和成本可控性;同時(shí)配有全周期安全可信方案,為企業(yè)AI應(yīng)用保駕護(hù)航;同時(shí),火山方舟提供了抖音頭條同款的聯(lián)網(wǎng)插件、頭條抖音同源的內(nèi)容插件以及RAG知識(shí)庫(kù)插件,并由字節(jié)跳動(dòng)算法團(tuán)隊(duì)提供專業(yè)服務(wù),助力企業(yè)AI應(yīng)用輕松落地。
圖片
4.激發(fā)企業(yè)新質(zhì)生產(chǎn)力
騰訊云數(shù)據(jù)庫(kù)產(chǎn)品總監(jiān)劉迪帶來(lái)《云原生數(shù)據(jù)庫(kù)全面擁抱AI,激發(fā)企業(yè)新質(zhì)生產(chǎn)力》的分享。
隨著數(shù)字化轉(zhuǎn)型深入,云數(shù)據(jù)庫(kù)大規(guī)模運(yùn)營(yíng)下的可用性、成本和運(yùn)營(yíng)效率方面面臨著新的難題,數(shù)據(jù)庫(kù)也演進(jìn)為以存算分離、資源預(yù)測(cè)、異常自愈、故障預(yù)測(cè)等為特點(diǎn)的“軟件+硬件+AI”三位一體的構(gòu)建方式。
軟件方面,騰訊云持續(xù)在自研內(nèi)核 TXSQL 上不斷探索和迭代 ,TXSQL 內(nèi)核100%兼容原生 MySQL ,同時(shí)針對(duì)游戲、教育、金融、工業(yè)制造等行業(yè)的通用場(chǎng)景,研發(fā)出眾多匹配的新特性, 并在數(shù)據(jù)庫(kù)領(lǐng)域的國(guó)際頂尖學(xué)術(shù)會(huì)議 SIGMOD 中發(fā)表了多篇前沿研究成果,也向官方社區(qū)貢獻(xiàn)了眾多內(nèi)核的新特性和 Bug 修復(fù)。
硬件方面,提出了全鏈路RDMA網(wǎng)絡(luò)、編譯器優(yōu)化、三層解耦框架、基于持久化內(nèi)存的二級(jí)緩存等“軟件優(yōu)化與新硬件結(jié)合”的方法,優(yōu)化了關(guān)鍵路徑性能。
AI方面,騰訊云基于深度強(qiáng)化學(xué)習(xí)等AI方法并結(jié)合專家經(jīng)驗(yàn),推出了端到端一站式參數(shù)調(diào)優(yōu)服務(wù),無(wú)需人為介入,可以根據(jù)場(chǎng)景自動(dòng)探索優(yōu)化參數(shù),大幅縮短調(diào)優(yōu)時(shí)間。此外,還構(gòu)建了實(shí)時(shí)的多場(chǎng)景、多維度的智能異常分析能力,能夠秒級(jí)發(fā)現(xiàn)異常,異常處理時(shí)間較人工大幅縮減80%。在Serverless 架構(gòu)上, 打造 AI4DB 服務(wù),形成「AI云原生」產(chǎn)品矩陣等方面迭代。
值得一提的是,騰訊云數(shù)據(jù)庫(kù)TDSQL以同類架構(gòu)1/3的單元成本達(dá)到了創(chuàng)紀(jì)錄的8.14億的tpmC,同時(shí)在性能和性價(jià)比方面登頂TPC-C測(cè)試榜首。
經(jīng)過(guò)“軟件+硬件+AI”三位一體全面優(yōu)化融合、提升和創(chuàng)新,騰訊云數(shù)據(jù)庫(kù)TDSQL的解決方案也帶來(lái)了更為極致的場(chǎng)景體驗(yàn)。以瑞幸咖啡的實(shí)踐為例,TDSQL-C幫助瑞幸實(shí)現(xiàn)了零替換改造成本的云原生架構(gòu)升級(jí),可靈活應(yīng)對(duì)10倍的銷售流量洪峰,同時(shí)節(jié)省了大量資源和運(yùn)維成本。
圖片
5.大模型加速人工智能與產(chǎn)業(yè)數(shù)字化融合
百度智能云AI與大模型平臺(tái)總經(jīng)理忻舟帶來(lái)《大模型加速產(chǎn)業(yè)智能化轉(zhuǎn)型》的分享。
人工智能近年迎來(lái)大模型發(fā)展的窗口期,超大規(guī)模訓(xùn)練數(shù)據(jù)、復(fù)雜的深層模型和分布式并行訓(xùn)練,造就了這一正在崛起的變革力量。與此同時(shí),基于大模型的AI原生應(yīng)用開(kāi)發(fā)模式也在不斷演化,從一開(kāi)始的提示詞工程、RAG,到Copilot,再到爆火的Agent。
對(duì)此忻舟表示,我們需要甄別模型對(duì)于業(yè)務(wù)場(chǎng)景適用性,根據(jù)具體情況綜合選擇合適的應(yīng)用開(kāi)發(fā)模式。
他在分享中表示,百度智能云千帆大模型平臺(tái)致力于打造大模型服務(wù)超級(jí)工廠,提供先進(jìn)的生成式AI生產(chǎn)及應(yīng)用全流程開(kāi)發(fā)工具鏈,該平臺(tái)已經(jīng)累計(jì)有120000+用戶、20000+累計(jì)模型精調(diào)、420000+千帆應(yīng)用開(kāi)發(fā)數(shù)。
作為百度智能云推出的產(chǎn)業(yè)級(jí)AI原生應(yīng)用開(kāi)發(fā)平臺(tái),千帆AppBuilder致力于打通大模型到業(yè)務(wù)的最后一公里。同時(shí),基于百度技術(shù)積累和自有業(yè)務(wù)沉淀,百度智能云千帆大模型平臺(tái)構(gòu)建了豐富的大模型能力組件、AI能力組件、百度自有業(yè)務(wù)組件等。
圖片
6.百川智能的AGI之路實(shí)踐
百川技術(shù)聯(lián)合創(chuàng)始人謝劍帶來(lái)了關(guān)于《百川大模型技術(shù)與應(yīng)用實(shí)踐》的主題分享。
謝劍提到,2023年6月至2024年5月期間,百川發(fā)布了12款大型語(yǔ)言模型。其中,包括Baichuan-7B和Baichuan-13B在內(nèi)的開(kāi)源模型Huggingface總下載量超700萬(wàn)次;多個(gè)版本中,相較Baichuan 3,Baichuan 4能力全面提升,在SuperClue 4月份基準(zhǔn)評(píng)測(cè)中,Baichuan 4在國(guó)內(nèi)大模型中綜合排名第一。
除了致力于提升大模型性能之外,百川在Agent技術(shù)領(lǐng)域同樣進(jìn)行了深入探索。百川推出的AI助手“百小應(yīng)”“懂”搜索、“會(huì)”提問(wèn):一方面得益于專業(yè)的搜索技能,可以通過(guò)定向搜索、多輪搜索等方式逐步深入,逼近問(wèn)題的核心答案,同時(shí)結(jié)構(gòu)化呈現(xiàn)搜索結(jié)果,優(yōu)化信息布局;另一方面又能夠引導(dǎo)用戶清晰表達(dá)自身需求并精準(zhǔn)定位問(wèn)題。
面向未來(lái),謝劍認(rèn)為,技術(shù)發(fā)展值得關(guān)注的幾個(gè)重要趨勢(shì)包括大參數(shù)/窗口的擴(kuò)展、多模態(tài)和實(shí)時(shí)自然交互、普惠性、長(zhǎng)程任務(wù)規(guī)劃和完成能力以及自學(xué)習(xí)和進(jìn)化。
圖片
7.結(jié)束語(yǔ)
除主會(huì)場(chǎng)分享外,本屆大會(huì)另外設(shè)置了13場(chǎng)平行分會(huì)場(chǎng)活動(dòng)。從百度、阿里、騰訊、字節(jié)...等大模型技術(shù)大廠,到百川智能、第四范式、商湯科技...等大模型獨(dú)角獸,本屆WOT技術(shù)大會(huì)邀請(qǐng)了眾多大模型企業(yè)進(jìn)行自身實(shí)踐的集中展示。
圖片
分會(huì)場(chǎng)、展區(qū)熱況
一場(chǎng)綜合技術(shù)大會(huì),雖然需要大模型、多模態(tài)、AI Agent這樣的熱門(mén)技術(shù)話題,但是同樣需要研發(fā)效能提升、架構(gòu)演進(jìn)、大數(shù)據(jù)、技術(shù)領(lǐng)導(dǎo)力、大前端這樣技術(shù)人持續(xù)關(guān)注的話題。在本屆WOT技術(shù)大會(huì)上,我們邀請(qǐng)京東、51Talk、作業(yè)幫、方正證券、閱文集團(tuán)等企業(yè)專家,持續(xù)帶來(lái)精彩分享。
騰訊云專場(chǎng)現(xiàn)場(chǎng)
雖然2天精彩大會(huì)已經(jīng)閉幕,但是持續(xù)追蹤熱門(mén)技術(shù)趨勢(shì)的腳步不會(huì)停止,更多精彩,敬請(qǐng)期待。