偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

為實(shí)時(shí)人工智能做好準(zhǔn)備

人工智能
不斷縮小的決策窗口和更快的數(shù)據(jù)生成使得實(shí)時(shí)分析成為一種新興的熱門(mén)產(chǎn)品類(lèi)別。Rockset首席執(zhí)行官兼聯(lián)合創(chuàng)始人Venkat Venkataramani表示,現(xiàn)在,隨著大型語(yǔ)言模型(LLM)和矢量數(shù)據(jù)庫(kù)為企業(yè)人工智能鋪平了道路,我們突然進(jìn)入了實(shí)時(shí)人工智能系統(tǒng)的時(shí)代。

不斷縮小的決策窗口和更快的數(shù)據(jù)生成使得實(shí)時(shí)分析成為一種新興的熱門(mén)產(chǎn)品類(lèi)別。Rockset首席執(zhí)行官兼聯(lián)合創(chuàng)始人Venkat Venkataramani表示,現(xiàn)在,隨著大型語(yǔ)言模型(LLM)和矢量數(shù)據(jù)庫(kù)為企業(yè)人工智能鋪平了道路,我們突然進(jìn)入了實(shí)時(shí)人工智能系統(tǒng)的時(shí)代。

到目前為止,Rockset一直在開(kāi)發(fā)一個(gè)關(guān)系數(shù)據(jù)庫(kù),使用戶(hù)能夠?qū)Υ罅啃螺斎氲臄?shù)據(jù)連續(xù)運(yùn)行SQL查詢(xún)。從傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)供應(yīng)商到實(shí)時(shí)流處理器,許多大數(shù)據(jù)開(kāi)發(fā)人員一直難以做到這一點(diǎn)。

Rockset通過(guò)在其開(kāi)放的RocksDB的關(guān)鍵價(jià)值商店上構(gòu)建的一系列功能來(lái)滿(mǎn)足實(shí)時(shí)分析需求。Rockset首席技術(shù)官兼聯(lián)合創(chuàng)始人Dhruba Borthakur在Facebook幫助下創(chuàng)建了關(guān)鍵價(jià)值商店。這包括Rockset強(qiáng)大的聚合索引功能,但也包括其非結(jié)構(gòu)數(shù)據(jù)的接收、時(shí)間序列優(yōu)化、查詢(xún)規(guī)劃和基于云的架構(gòu)。

到目前為止,目標(biāo)是讓實(shí)時(shí)應(yīng)用程序能夠訪問(wèn)通過(guò)Kafka管道到達(dá)的最新數(shù)據(jù)。與其他追逐實(shí)時(shí)分析夢(mèng)想的數(shù)據(jù)庫(kù)公司(Imply、Clickhouse和StarTree)一樣,沒(méi)有任何一項(xiàng)出色的功能可以讓你突然成功地在大量傳入數(shù)據(jù)上運(yùn)行每秒數(shù)萬(wàn)次SQL查詢(xún)。相反,這是一種通過(guò)不懈的工程實(shí)現(xiàn)的能力。

但在4月份發(fā)生了變化,Rockset推出了對(duì)數(shù)據(jù)庫(kù)中矢量搜索功能的初步支持。新功能使Rockset不僅可以在其數(shù)據(jù)庫(kù)中存儲(chǔ)和索引向量嵌入,還可以將這些向量嵌入與元數(shù)據(jù)過(guò)濾、關(guān)鍵字搜索和向量相似性得分相結(jié)合。

Venkataramani表示,這些新的矢量相關(guān)功能將為客戶(hù)解鎖實(shí)時(shí)人工智能應(yīng)用,特別關(guān)注產(chǎn)品推薦、個(gè)性化和欺詐檢測(cè)。

他說(shuō):“這方面以前稱(chēng)為預(yù)測(cè)分析。能夠預(yù)測(cè)即將發(fā)生的事情。但如今,這都是實(shí)時(shí)人工智能?!?/span>

自去年年底ChatGPT出現(xiàn)以來(lái),公司開(kāi)始重新思考如何以及在哪里應(yīng)用人工智能。Venkataramani表示,基于神經(jīng)網(wǎng)絡(luò)和向量嵌入的新技術(shù)和技術(shù)正在顛覆五年前被認(rèn)為是前沿的機(jī)器學(xué)習(xí)方法。

以產(chǎn)品推薦為例,這是一個(gè)經(jīng)過(guò)時(shí)間考驗(yàn)的數(shù)據(jù)科學(xué)家應(yīng)用程序。與識(shí)別最具預(yù)測(cè)性的特征和屬性、構(gòu)建自動(dòng)提取它們的管道,然后在運(yùn)行時(shí)仔細(xì)構(gòu)建機(jī)器學(xué)習(xí)模型來(lái)推斷消費(fèi)者偏好的艱苦過(guò)程不同,隨著LLM的出現(xiàn),公司現(xiàn)在基本上可以將所有這些數(shù)據(jù)放入文本文檔中,并由神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi)。

他說(shuō):“以前,機(jī)器學(xué)習(xí)模型會(huì)試圖提取關(guān)于你的產(chǎn)品、產(chǎn)品顏色、制造商、產(chǎn)品類(lèi)別等的屬性?!薄暗F(xiàn)在,你可以給這些人工智能模型和神經(jīng)網(wǎng)絡(luò)一個(gè)BLOB(表示二進(jìn)制類(lèi)型的大對(duì)象)的文本。你可以給每個(gè)產(chǎn)品一個(gè)圖像目錄,你不需要告訴它‘去標(biāo)記這些圖像,說(shuō)這是藍(lán)色的,屬于同一類(lèi)?!?/span>

“現(xiàn)在你可以提供用戶(hù)正在觀看的所有產(chǎn)品,人工智能模型可以理解用戶(hù)的喜好和厭惡,而不必根據(jù)特定的屬性和規(guī)則進(jìn)行編碼?!薄耙虼?,你可以為用戶(hù)提供并構(gòu)建一個(gè)向量,該向量代表了他們有更高機(jī)會(huì)喜歡或購(gòu)買(mǎi)的所有潛在產(chǎn)品。”

這大大降低了在生產(chǎn)中使用人工智能的門(mén)檻,并使公司能夠利用人工智能做更多的事情。他說(shuō),理論上,這可以使一家公司對(duì)其目錄中的10萬(wàn)件商品進(jìn)行預(yù)測(cè)分析,而不是將其限制在前1000件商品。

有了人工智能,就好像一些機(jī)器人在觀察用戶(hù)的所有行為,并更深入地了解每一種產(chǎn)品,然后在用戶(hù)出現(xiàn)在網(wǎng)站上時(shí)實(shí)時(shí)構(gòu)建推薦,而不是一小時(shí)后、一天后或一周后??梢詡€(gè)性化的程度已經(jīng)達(dá)到了頂峰,因?yàn)楝F(xiàn)在可以將所有這些自動(dòng)化。

Rockset不創(chuàng)建矢量嵌入(矢量嵌入是大量非結(jié)構(gòu)化文本或圖像數(shù)據(jù)的濃縮表示)。但它確實(shí)允許用戶(hù)將向量嵌入基本上視為數(shù)據(jù)庫(kù)中的另一種數(shù)據(jù)類(lèi)型,并對(duì)其執(zhí)行操作,例如相似性搜索。

Venkataramani說(shuō): “我們不在乎你用什么模型來(lái)獲取非結(jié)構(gòu)化數(shù)據(jù)并將其轉(zhuǎn)化為向量?!?“把它想象成另一種數(shù)據(jù)類(lèi)型,你的表中的另一列。你現(xiàn)在需要對(duì)它們進(jìn)行相似性搜索。你需要說(shuō),給定一個(gè)向量,給我找到所有其他更接近我正在搜索的向量?!?/span>

假設(shè)客戶(hù)希望識(shí)別傳入數(shù)據(jù)流中所有類(lèi)似雛菊的圖像(如果應(yīng)用在公共安全而不是花園游覽,則可以將“雛菊”替換為“槍”或“刀”)。

Venkataramani解釋道:“我正在尋找的矢量是一朵雛菊,但這里是用矢量表示的所有其他圖像。” “現(xiàn)在你需要一個(gè)索引。如果你對(duì)整個(gè)庫(kù)進(jìn)行強(qiáng)力搜索,這個(gè)問(wèn)題需要10天才能得到答案。我希望在100毫秒內(nèi)完成。你是怎么做到的?”

根據(jù)向量嵌入的索引運(yùn)行機(jī)器學(xué)習(xí)算法,如K-最近鄰(KNN)或近似最近鄰(ANN),顯著加快了對(duì)輸入數(shù)據(jù)中雛菊和雛菊相鄰圖像的識(shí)別。

沒(méi)有人在數(shù)據(jù)庫(kù)中尋找這個(gè)確切的向量。他們?cè)趯ふ宜懈咏蜃罱咏南蛄?,這就是索引在數(shù)學(xué)上比根據(jù)數(shù)字、字符串、日期或時(shí)間構(gòu)建索引復(fù)雜得多的地方。這就是為什么矢量搜索是一種非常不同的功能,這也是Rockset所增加應(yīng)對(duì)實(shí)時(shí)需求的有力功能。

責(zé)任編輯:華軒 來(lái)源: 今日頭條
相關(guān)推薦

2021-05-10 15:11:58

人工智能大數(shù)據(jù)科技

2024-04-25 15:23:29

2022-02-09 10:00:08

人工智能工業(yè)物聯(lián)網(wǎng)

2023-09-06 11:41:34

數(shù)據(jù)中心人工智能

2020-10-09 11:02:31

數(shù)據(jù)中心人工智能技術(shù)

2022-05-27 08:16:35

端點(diǎn)安全人工智能網(wǎng)絡(luò)安全

2020-09-04 09:53:38

人工智能數(shù)據(jù)中心GPU

2020-05-25 10:23:05

智慧城市物聯(lián)網(wǎng)5G

2022-01-25 11:17:57

元宇宙網(wǎng)絡(luò)攻擊

2010-10-08 10:20:24

Novell用戶(hù)

2020-08-28 14:57:48

智慧城市革命數(shù)據(jù)

2022-01-19 10:50:36

災(zāi)難恢復(fù)

2021-11-12 09:00:00

管理企業(yè)技能

2019-02-15 10:05:32

人工智能自動(dòng)化革命機(jī)器人

2014-08-22 09:53:16

Windows 9

2020-03-19 11:16:31

Java云原生IT

2022-05-06 10:36:48

低代碼優(yōu)勢(shì)云原生

2011-10-20 10:20:33

惠普數(shù)據(jù)中心云計(jì)算

2012-04-11 09:42:33

DLP數(shù)據(jù)保護(hù)數(shù)據(jù)丟失防護(hù)

2017-08-23 14:21:26

微軟人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)