加速大模型落地:火山引擎向量數(shù)據(jù)庫的實踐應(yīng)用
近兩年隨著大模型技術(shù)的快速發(fā)展,圖片、視頻、自然語言等多模態(tài)、非結(jié)構(gòu)化數(shù)據(jù)的查找需求變大,非結(jié)構(gòu)化數(shù)據(jù)的量級也遠(yuǎn)大于結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)數(shù)據(jù)庫已經(jīng)無法滿足如此多樣化數(shù)據(jù)的處理需求。向量數(shù)據(jù)庫以其海量的數(shù)據(jù)存儲規(guī)模、高效的計算查詢能力,正在成為大模型時代重要的基礎(chǔ)設(shè)施。
3 月23 日,火山引擎開發(fā)者社區(qū) Meetup 第十三期邀請到了火山引擎的三位技術(shù)專家,將從火山引擎的實踐應(yīng)用出發(fā),為大家詳解向量檢索功能的設(shè)計實現(xiàn)以及大規(guī)模云原生向量數(shù)據(jù)庫的核心技術(shù)和優(yōu)化,和大家共同探討大模型時代向量數(shù)據(jù)庫的落地實踐。
?時間:2024/03/23(周六) 14:00-17:00
地點 :北京市海淀區(qū)北三環(huán)西路甲 18 號院大鐘寺廣場 1 號樓 3F-17
形式:線下+線上同步直播

精彩議程
《VikingDB:大規(guī)模云原生向量數(shù)據(jù)庫的前沿實踐與應(yīng)用》謝劍橋|火山引擎向量數(shù)據(jù)庫高級工程師
向量數(shù)據(jù)庫是解決海量非結(jié)構(gòu)化數(shù)據(jù)檢索與分析問題的行業(yè)共識,我們從 19 年解決大規(guī)模分布式向量檢索問題,到推出云原生、AI 原生的向量數(shù)據(jù)庫,持續(xù)應(yīng)對抖音集團(tuán)內(nèi)外部業(yè)務(wù)的復(fù)雜技術(shù)挑戰(zhàn),積累了豐富實踐經(jīng)驗。本次演講將重點介紹 VikingDB 解決各類應(yīng)用中極限性能、規(guī)模、精度問題上的探索實踐,并通過落地的案例向聽眾介紹如何在多模態(tài)信息檢索、RAG 與知識庫等領(lǐng)域進(jìn)行合理的技術(shù)選型和規(guī)劃。
主要內(nèi)容:
1. AI 原生、云原生的向量數(shù)據(jù)庫是怎樣的
a. 不止RAG——AIGC 時代的向量庫應(yīng)用
b. AI 原生的能力推導(dǎo)
c. 大規(guī)模云原生架構(gòu)設(shè)計要點
2. 極端性能、規(guī)模、精度問題是怎么解決的
a. 向量數(shù)據(jù)庫的關(guān)鍵性能維度和極限案例
b. 極致性能優(yōu)化探索
c. 極端規(guī)模場景的解決之道
d. 精度:追逐相關(guān)性本質(zhì)
3. 如何用好檢索型向量數(shù)據(jù)庫
a. 從應(yīng)用場景進(jìn)行技術(shù)選擇
b. 真實業(yè)務(wù)場景的避坑指南
《解析云原生數(shù)倉 ByteHouse 如何構(gòu)建高性能向量檢索技術(shù)》田昕暉|火山引擎 ByteHouse 技術(shù)專家
向量檢索被廣泛使用于以圖搜圖、內(nèi)容推薦以及大模型推理等場景。隨著業(yè)務(wù)升級與 AI 技術(shù)的廣泛使用,用戶期望處理的向量數(shù)據(jù)規(guī)模越來越大,對向量數(shù)據(jù)庫產(chǎn)品的穩(wěn)定性、易用性與性能需求也越來越高。為此火山引擎ByteHouse 團(tuán)隊基于社區(qū) ClickHouse 進(jìn)行技術(shù)演進(jìn),提出了全新的向量檢索功能設(shè)計思路,滿足業(yè)務(wù)對向量檢索穩(wěn)定性與性能方面的需求。
主要內(nèi)容:
1. 向量檢索概念以及在 LLM 場景的應(yīng)用
2. 當(dāng)前業(yè)界向量數(shù)據(jù)庫發(fā)展情況
3. ClickHouse 結(jié)合向量檢索的優(yōu)勢,以及社區(qū)當(dāng)前向量檢索局限性與性能問題分析
4. ByteHouse 向量檢索功能設(shè)計思路介紹
5. 性能比較
《在火山引擎云搜索服務(wù)上構(gòu)建混合搜索的設(shè)計與實現(xiàn)》魯蘊鋮|火山引擎云搜索服務(wù)高級研發(fā)工程師
當(dāng)今,隨著圖片和視頻數(shù)據(jù)的爆炸式增長,人們對于多樣化數(shù)據(jù)搜索的需求也越來越迫切。多模態(tài)搜索場景已經(jīng)成為當(dāng)前搜索領(lǐng)域的主要趨勢。在這個背景下,本次演講將重點介紹字節(jié)跳動在混合搜索領(lǐng)域的探索,并探討如何在多模態(tài)數(shù)據(jù)場景下進(jìn)行海量數(shù)據(jù)搜索。
主要內(nèi)容:
1. 混合搜索的應(yīng)用場景
2. 云搜索服務(wù)在混合搜索中具備的搜索能力
a. 云搜索服務(wù)在混合搜索中的生態(tài)能力
b. 云搜索服務(wù)在混合搜索中的搜索增強能力
c. 云搜索服務(wù)在混合搜索中的排序打分增強能力
3. 云搜索的混合搜索引擎
a. 當(dāng)前不同向量引擎能力介紹
b. 多種向量引擎及優(yōu)化編碼
c. 不同場景下的向量搜索能力對比與選擇

掃碼立即報名

掃碼進(jìn)入活動群
閱讀原文鏈接:https://zjsms.com/iFdjBHb3/






























