偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

大模型又帶火的一款2萬星黑馬項(xiàng)目!

原創(chuàng) 精選
開發(fā) 項(xiàng)目管理
從最初的Milvus到2.3版本,每一次版本升級(jí)背后都離不開用戶的支持與建議。升級(jí)、迭代,每次更新過后,Milvus都會(huì)趨向于完美。

撰稿 | 王瑞平

審校 | 云昭

開源、Github標(biāo)星狂飆2萬、CVP(即,ChatGPT+VectorDB+Prompt)架構(gòu)...又一匹數(shù)據(jù)庫(kù)黑馬突出重圍。

它就是Milvus向量數(shù)據(jù)庫(kù),幾年前便在Github上開源,瞬間引爆全球,不僅完美詮釋了新興CVP架構(gòu),也成為“群模亂舞”當(dāng)下的一股清流。

圖片圖片

Milvus旨在為AI應(yīng)用程序和嵌入相似度搜索提供支持,使非結(jié)構(gòu)化數(shù)據(jù)更易于搜索和訪問,無論部署環(huán)境如何都能使用戶獲得相同的體驗(yàn)。

1、AIGC新紀(jì)元從“向量數(shù)據(jù)庫(kù)”邁入“大模型記憶體”

Milvus以4個(gè)月5000星的速度邁入Github 2萬星項(xiàng)目的隊(duì)列,越來越多開發(fā)者也正在為Milvus進(jìn)入AIGC新紀(jì)元注入更多力量。

2019年,GitHub上將Milvus的源代碼開源。彼時(shí),行業(yè)尚無“向量數(shù)據(jù)庫(kù)”一說,用戶最關(guān)心的問題是“什么是向量數(shù)據(jù)庫(kù)”。

2023年,ChatGPT 引發(fā)AIGC熱潮,在這個(gè)大模型恣意生長(zhǎng)的年份,越來越多的人關(guān)心“向量數(shù)據(jù)庫(kù)可以做什么?”

在大語言模型時(shí)代,向量數(shù)據(jù)庫(kù)必不可少,它不僅是大模型的記憶體,還能通過向量檢索讓大模型變得博聞強(qiáng)識(shí)。

在此過程中,AIGC開發(fā)者可以看到的是Milvus在2.2.9版本和中新增了JSON、動(dòng)態(tài)schema和PartitionKey三大功能,簡(jiǎn)化了開發(fā)者使用門檻,并接入了開源項(xiàng)目GPTCache,提升LLM應(yīng)用性能。

2、大模型時(shí)代,數(shù)據(jù)庫(kù)也需要跟上

我們正處在擁抱人人互聯(lián)新時(shí)代,傳輸電子郵件、社交媒體照片傳輸、蛋白質(zhì)分子結(jié)構(gòu)解析等過程中都會(huì)產(chǎn)生海量的非結(jié)構(gòu)化數(shù)據(jù)(文本文件、電子表格等)。

然而,你絕不能任由這些數(shù)據(jù)“滿天飛”!所以,它們必須被計(jì)算機(jī)定期處理!那么,如何處理呢?

首先,embedding技術(shù)可以將這些數(shù)據(jù)轉(zhuǎn)化為“向量”。隨后,Milvus會(huì)存儲(chǔ)這些“向量”并為其建立索引,這就形成了傳說中的“向量數(shù)據(jù)庫(kù)”。

與現(xiàn)有的主要可用作處理結(jié)構(gòu)化數(shù)據(jù)的關(guān)系型數(shù)據(jù)庫(kù)不同,Milvus在底層設(shè)計(jì)上就是為了處理由各種非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換而來的Embedding向量而生。

該數(shù)據(jù)庫(kù)可以對(duì)接包括圖片識(shí)別、視頻處理、聲音識(shí)別、自然語言處理等深度學(xué)習(xí)模型,從而為向量化后的非結(jié)構(gòu)數(shù)據(jù)提供搜索分析服務(wù)。

你可以使用Milvus搭建符合個(gè)人場(chǎng)景需求的向量相似度檢索系統(tǒng),具體可應(yīng)用在以圖搜圖、視頻去重、音頻檢索、文本搜索等場(chǎng)景下。

3、快速入門:安裝Milvus

絕大多數(shù)非結(jié)構(gòu)化數(shù)據(jù)的一對(duì)多檢索都可以用到Milvus,現(xiàn)在帶你快速入門...在Milvus的開源文件中,我們找到了詳細(xì)的安裝過程,在此簡(jiǎn)單介紹:

圖片圖片

你需要首先明確的是:Milvus使用Docker Compose控制服務(wù)的啟動(dòng)和暫停,過程包括:

  • 新建工作目錄,下載YAML文件
  • 啟動(dòng)Milvus容器:

sudo docker-compose up -d

  • 停止Milvus容器:

sudo docker-compose down

4、用例:以圖搜圖

Milvus官方還給出了以圖搜圖的用例,具體流程分為構(gòu)建圖像向量庫(kù)和執(zhí)行搜索:

圖片圖片

1)構(gòu)建圖像向量庫(kù)

首先準(zhǔn)備圖像數(shù)據(jù)集,使用深度學(xué)習(xí)庫(kù)提取圖像特征,獲得每張圖像的特征向量,最后將特征向量存儲(chǔ)到Milvus數(shù)據(jù)庫(kù)中。

2)執(zhí)行搜索

輸入一張待檢索圖像,經(jīng)過深度學(xué)習(xí)庫(kù)獲取圖像對(duì)應(yīng)的特征向量,然后將這個(gè)向量與Milvus中所有圖像的特征向量進(jìn)行相似度對(duì)比,從而獲得距離最近的圖像結(jié)果。

5、整體性能夠硬,生態(tài)已成氣候

從上述的安裝與使用過程中我們不難看出,Milvus作為一款云原生向量數(shù)據(jù)庫(kù),具備高可用、高性能、易拓展的特點(diǎn),可用于海量向量數(shù)據(jù)的實(shí)時(shí)召回。

圖片圖片

Github上也對(duì)其整體性能做出了完整總結(jié):

  • 高性能:性能高超,可對(duì)海量數(shù)據(jù)集進(jìn)行向量相似度檢索。
  • 簡(jiǎn)化管理:專為數(shù)據(jù)科學(xué)工作流設(shè)計(jì)的豐富API;
  • 高可用、高可靠:Milvus支持云上擴(kuò)展,其容災(zāi)能力能夠保證服務(wù)高可用;
  • 高度可擴(kuò)展和彈性:組件級(jí)可伸縮性使按需擴(kuò)展和縮減成為可能。
  • 混合查詢:Milvus支持在向量相似度檢索過程中進(jìn)行標(biāo)量字段過濾,實(shí)現(xiàn)混合查詢;
  • 開發(fā)者友好:支持多語言、多工具M(jìn)ilvus生態(tài)系統(tǒng);
  • 社區(qū)支持,行業(yè)認(rèn)可:擁有超過1000名企業(yè)用戶以及活躍的開源社區(qū)。

6、系統(tǒng)架構(gòu):四個(gè)層次

Milvus作為一款云原生向量數(shù)據(jù)庫(kù),采用存儲(chǔ)與計(jì)算分離的架構(gòu)設(shè)計(jì),所有組件均為無狀態(tài)組件,極大增強(qiáng)系統(tǒng)彈性和靈活性。

圖片圖片

整個(gè)系統(tǒng)架構(gòu)可分為四個(gè)層次:

  • 接入層:系統(tǒng)的門面,由一組無狀態(tài)proxy組成。對(duì)外提供用戶連接的endpoint,負(fù)責(zé)驗(yàn)證客戶端請(qǐng)求并合并返回結(jié)果。
  • 協(xié)調(diào)服務(wù):系統(tǒng)的大腦,負(fù)責(zé)分配任務(wù)給執(zhí)行節(jié)點(diǎn)。協(xié)調(diào)服務(wù)共有四種角色,分別為 root coord、data coord、query coord 和 index coord。
  • 執(zhí)行節(jié)點(diǎn):系統(tǒng)的四肢,負(fù)責(zé)完成協(xié)調(diào)服務(wù)下發(fā)的指令和 proxy 發(fā)起的數(shù)據(jù)操作語言(DML)命令。執(zhí)行節(jié)點(diǎn)分為三種角色,分別為 data node、query node 和 index node。
  • 存儲(chǔ)服務(wù):系統(tǒng)的骨骼,負(fù)責(zé)Milvus數(shù)據(jù)的持久化,分為元數(shù)據(jù)存儲(chǔ)(meta store)、消息存儲(chǔ)(log broker)和對(duì)象存儲(chǔ)(object storage)三個(gè)部分。

7、2.0重磅升級(jí)

在Milvus官網(wǎng)上,我們找到了Milvus1.0與2.0究竟有哪些區(qū)別,具體如下表:

圖片圖片

事實(shí)上,自Milvus升級(jí)至2.0版本以來,仍在不斷改進(jìn)優(yōu)化,推出了諸如從文件中批量導(dǎo)入數(shù)據(jù)、基于磁盤的近似最近鄰(ANN)索引算法等新功能,也提升了元數(shù)據(jù)存儲(chǔ)、批量導(dǎo)入等性能。

遠(yuǎn)的不說,從Milvus 2.2到Milvus 2.3版本都進(jìn)行了哪些變化和升級(jí)呢?

Milvus 2.2提升了向量搜索的穩(wěn)定性、搜索速度,具有靈活的擴(kuò)縮容能力,提供了一系列新的 API,用于支持從文件中更有效率地批量導(dǎo)入數(shù)據(jù)。

此外,Milvus 2.2還修復(fù)了部分bug并進(jìn)行了諸多改進(jìn)以增強(qiáng)Milvus穩(wěn)定性、可觀測(cè)性和性能。

而在2.3版本中,Milvus移除了Annoy索引,降低了維護(hù)成本,還會(huì)支持count接口,用于統(tǒng)計(jì)collection的行數(shù)。新增的count接口除了能計(jì)算collection行數(shù)外,還支持query的查詢表達(dá)式用于統(tǒng)計(jì)帶條件的行數(shù)。

8、用戶:使用Milvus,并不孤單

從最初的Milvus到2.3版本,每一次版本升級(jí)背后都離不開用戶的支持與建議。升級(jí)、迭代,每次更新過后,Milvus都會(huì)趨向于完美。

截至目前,GitHub在上已達(dá)到2.08萬星。因此,當(dāng)在活躍的開源社區(qū)中使用Milvus時(shí),你并不孤單!

參考資料:

https://www.yii666.com/blog/393941.html?actinotallow=onAll

https://github.com/milvus-io/milvus

https://blog.csdn.net/hello_dear_you/article/details/127841589

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2016-02-15 11:44:23

源碼開源項(xiàng)目watch

2017-08-09 08:18:51

數(shù)據(jù)中心模型設(shè)計(jì)

2023-10-04 19:52:33

模型論文

2021-12-23 10:35:32

SpringCloud腳手架架構(gòu)

2023-09-26 07:36:24

2019-01-02 13:34:13

Python IDEGeditEclipse

2014-08-20 10:47:58

Lime Text開源

2025-04-18 15:53:03

2019-04-25 10:31:06

WiFi密碼Android

2021-09-28 20:19:54

APKAndroid流程

2021-07-23 16:50:19

httpJava框架

2014-12-16 10:11:22

2024-08-16 08:31:05

2024-01-11 18:55:37

3D可視化AI

2018-11-14 08:14:59

工具云遷移云計(jì)算

2021-11-12 15:52:16

區(qū)塊鏈開發(fā)技術(shù)

2021-02-03 05:18:26

開源Ceph存儲(chǔ)

2014-07-17 09:19:55

Tizen三星操作系統(tǒng)

2014-07-17 10:04:56

Tizen三星
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)