年終盤(pán)點(diǎn):2024年最炙手可熱的十家大數(shù)據(jù)初創(chuàng)公司
數(shù)據(jù)已經(jīng)成為很多企業(yè)和組織的寶貴資產(chǎn)。他們正在分析數(shù)據(jù)以深入了解市場(chǎng)、客戶和他們自己的運(yùn)營(yíng)情況。他們正在使用數(shù)據(jù)來(lái)推動(dòng)數(shù)字化轉(zhuǎn)型計(jì)劃,支持新的數(shù)據(jù)密集型服務(wù)。
而數(shù)據(jù)——大量的數(shù)據(jù)——是AI和機(jī)器學(xué)習(xí)計(jì)劃的關(guān)鍵組成部分。
但整理、管理和分析數(shù)據(jù)是一項(xiàng)重大挑戰(zhàn)。根據(jù)市場(chǎng)研究公司IDC的數(shù)據(jù)顯示,創(chuàng)建、捕獲、復(fù)制和使用的數(shù)據(jù)總量每年以超過(guò)20%的速度增長(zhǎng),預(yù)計(jì)到2027年將達(dá)到約291 ZB。
這就是為什么會(huì)有源源不斷的大數(shù)據(jù)初創(chuàng)公司開(kāi)發(fā)出尖端的技術(shù)來(lái)幫助企業(yè)訪問(wèn)、收集、管理、移動(dòng)、轉(zhuǎn)換、分析、理解、衡量、管理、維護(hù)和保護(hù)數(shù)據(jù)。
以下就是2024年引起了我們關(guān)注的10家大數(shù)據(jù)初創(chuàng)公司。
Ariga
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Ariel Mashraki
數(shù)據(jù)庫(kù)模式是數(shù)據(jù)在數(shù)據(jù)庫(kù)系統(tǒng)中組織和結(jié)構(gòu)的一種方式,包括了數(shù)據(jù)表以及定義不同數(shù)據(jù)元素之間關(guān)系的方式。
當(dāng)數(shù)據(jù)更新或數(shù)據(jù)庫(kù)需要支持運(yùn)行在數(shù)據(jù)庫(kù)上的應(yīng)用的新特性和功能時(shí),有時(shí)必須更改數(shù)據(jù)庫(kù)模式,這可能是一件苦差事。
Ariga開(kāi)發(fā)了一個(gè)數(shù)據(jù)庫(kù)模式即代碼平臺(tái),軟件工程師使用該平臺(tái)就可以通過(guò)代碼定義和管理數(shù)據(jù)庫(kù)模式,從而降低模式更改的復(fù)雜性并簡(jiǎn)化數(shù)據(jù)庫(kù)管理。
Ariga的產(chǎn)品包括數(shù)據(jù)庫(kù)模式即代碼工具Atlas和用于Go編程語(yǔ)言的ent.go實(shí)體框架。
Ariga公司成立于2021年,總部位于以色列特拉維夫。2023年6月,Ariga宣布在A輪融資中獲得1500萬(wàn)美元,以及此前未宣布的300萬(wàn)美元種子輪融資。
DataPelago
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Rajan Goyal
初創(chuàng)公司DataPelago在今年10月走出隱身模式,推出了該公司所謂的全球首個(gè)“通用數(shù)據(jù)處理引擎”,可以應(yīng)對(duì)當(dāng)今數(shù)據(jù)的復(fù)雜性和數(shù)量,用于所謂的“加速計(jì)算”分析和AI工作負(fù)載。
DataPelago公司首席執(zhí)行官Goyal表示,基于CPU和基本軟件架構(gòu)的傳統(tǒng)數(shù)據(jù)處理系統(tǒng)無(wú)法應(yīng)對(duì)當(dāng)今數(shù)據(jù)的復(fù)雜性和數(shù)量。
他說(shuō):“數(shù)據(jù)在變化,應(yīng)用在變化,最重要的是,[IT]基礎(chǔ)設(shè)施也在變化,當(dāng)三種不同的顛覆性趨勢(shì)匯聚在一起時(shí),你需要退后一步,看看未來(lái)會(huì)是什么樣子,數(shù)據(jù)處理平臺(tái)應(yīng)該是什么樣子?!?/p>
為了解決這個(gè)問(wèn)題,Goyal在2021年宣布推出了DataPelago,并組建了一支“多學(xué)科團(tuán)隊(duì)”,由在系統(tǒng)架構(gòu)、數(shù)據(jù)分析、云、SaaS、開(kāi)源開(kāi)發(fā)和其他技術(shù)領(lǐng)域擁有專業(yè)知識(shí)的人員組成。
DataPelago的通用數(shù)據(jù)處理引擎正在被一些客戶以試點(diǎn)或者預(yù)覽的方式使用,旨在克服當(dāng)前IT系統(tǒng)的性能、成本和可擴(kuò)展性限制。該系統(tǒng)是從零開(kāi)始構(gòu)建的,采用硬件和軟件協(xié)同設(shè)計(jì)的方法,支持生成式AI和數(shù)據(jù)湖屋分析工作負(fù)載。
DataPelago總部位于美國(guó)加利福尼亞州山景城,目前已經(jīng)累計(jì)從投資方Eclipse、Taiwania Capital、Qualcomm Ventures、Alter Venture Partners、Nautilus Venture Partners和First Citizens Bank旗下Silicon Valley Back那里獲得了4700萬(wàn)美元的種子輪和A輪融資。
DeasyLabs
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Reece Griffiths
AI模型的好壞取決于輸入的數(shù)據(jù)。DeasyLabs表示,該公司的使命是提供數(shù)據(jù)治理,以確保大型語(yǔ)言模型僅運(yùn)行在安全的、相關(guān)的、高質(zhì)量的數(shù)據(jù)上。
這家初創(chuàng)公司開(kāi)發(fā)了一個(gè)元數(shù)據(jù)編排平臺(tái),用于創(chuàng)建高質(zhì)量、定制的元數(shù)據(jù)并將其嵌入到他們的AI工作流中,包括檢索增強(qiáng)生成和代理框架。
DeasyLabs公司成立于2023年,總部位于紐約,在2023年獲得了300萬(wàn)美元的種子資金,并得到了Y Combinator的支持,資金來(lái)自General Catalyst、RTP Global和J12等投資方。
Diliko
首席執(zhí)行官:Dave Albano
Diliko公司在11月7日剛剛走出隱身模式,它開(kāi)發(fā)了一個(gè)具有自動(dòng)數(shù)據(jù)管理和治理功能的代理AI平臺(tái),并表示這可以降低運(yùn)營(yíng)復(fù)雜性和成本。
Diliko總部位于美國(guó)弗吉尼亞州雷斯頓,主要面向數(shù)據(jù)密集型醫(yī)療、金融和物流行業(yè)的中型企業(yè)。該公司表示,其服務(wù)為CIO、CFO和CDO等C級(jí)高管以及數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師等數(shù)據(jù)相關(guān)人員帶來(lái)了好處。
基于云的Diliko平臺(tái)優(yōu)化了數(shù)據(jù)管理性能,無(wú)需部署和管理昂貴的基礎(chǔ)設(shè)施。該服務(wù)使用按需數(shù)據(jù)集成、ETL(提取、轉(zhuǎn)換、加載)和編排來(lái)實(shí)現(xiàn)復(fù)雜數(shù)據(jù)管理工作流程的自動(dòng)化,并可在內(nèi)部系統(tǒng)和外部系統(tǒng)之間實(shí)時(shí)同步數(shù)據(jù)。
Diliko平臺(tái)還通過(guò)零信任架構(gòu)、端到端加密和多因素身份驗(yàn)證等云原生安全功能確保數(shù)據(jù)治理和安全。
Dymium
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Denzil Wessel
Dymium開(kāi)發(fā)了一個(gè)數(shù)據(jù)訪問(wèn)管理平臺(tái),可以在“數(shù)據(jù)所在位置”提供對(duì)數(shù)據(jù)的安全訪問(wèn),從而消除了將數(shù)據(jù)移動(dòng)到數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖以進(jìn)行分析和AI任務(wù)的相關(guān)成本和復(fù)雜性。
“通過(guò)復(fù)制數(shù)據(jù)向團(tuán)隊(duì)提供各種格式數(shù)據(jù)的做法,每種格式都有不同的訪問(wèn)控制、策略和安全要求,這就導(dǎo)致了前所未有的復(fù)雜性,阻礙了創(chuàng)新并破壞了安全和治理,”Wessel說(shuō)。
Dymium平臺(tái)可以幫助組織以經(jīng)濟(jì)高效的方式管理快速增長(zhǎng)的數(shù)據(jù)源中的數(shù)據(jù)訪問(wèn)要求,增強(qiáng)其安全態(tài)勢(shì)并幫助他們遵守監(jiān)管要求。
該系統(tǒng)結(jié)合了零信任架構(gòu)、集中訪問(wèn)策略、實(shí)時(shí)數(shù)據(jù)轉(zhuǎn)換服務(wù)、AI和機(jī)器學(xué)習(xí),以正確的格式向正確的用戶提供正確的數(shù)據(jù)。
Dymium公司成立于2022年,總部位于美國(guó)加利福尼亞州洛斯加托斯,在今年3月走出隱身模式并獲得700萬(wàn)美元的融資。
Mind
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Eran Barak
初創(chuàng)公司Mind開(kāi)發(fā)了下一代數(shù)據(jù)丟失預(yù)防技術(shù),并且剛剛走出隱身模式,獲得來(lái)自YL Ventures的1100萬(wàn)美元種子資金。該公司總部位于美國(guó)西雅圖。
Mind的平臺(tái)結(jié)合了AI和“智能自動(dòng)化”來(lái)監(jiān)控?cái)?shù)據(jù)事件,識(shí)別、檢測(cè)和防止數(shù)據(jù)泄露。該系統(tǒng)發(fā)現(xiàn)并分類眾多IT工作負(fù)載中的敏感數(shù)據(jù)(包括靜態(tài)的、動(dòng)態(tài)的和使用中的數(shù)據(jù)),覆蓋了SaaS、生成式AI應(yīng)用、端點(diǎn)、本地系統(tǒng)和電子郵件。
Mind AI系統(tǒng)的核心是由數(shù)百種定制算法和專有AI引擎組成的,用于對(duì)敏感的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分類和歸類,了解上下文感知業(yè)務(wù)視圖以確定風(fēng)險(xiǎn)嚴(yán)重性,并在需要時(shí)采取自動(dòng)預(yù)防和補(bǔ)救措施。
Mind公司是由Eran Barak在2023年共同創(chuàng)立的,之前他創(chuàng)立了Hexadite公司,后來(lái)該公司被微軟收購(gòu)。他和其他聯(lián)合創(chuàng)始人之前曾在以色列軍事情報(bào)局8200部門(mén)擔(dān)任領(lǐng)導(dǎo)職務(wù)。
MotherDuck
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Jordan Tigani
初創(chuàng)公司MotherDuck在2023年6月推出了無(wú)服務(wù)器的MotherDuck Cloud Analytics Platform平臺(tái)首個(gè)版本,該平臺(tái)結(jié)合了云和嵌入式數(shù)據(jù)庫(kù)技術(shù),無(wú)論數(shù)據(jù)位于何處,都可以輕松地對(duì)其進(jìn)行分析。
MotherDuck的軟件基于MotherDuck的DuckDB開(kāi)源嵌入式數(shù)據(jù)庫(kù)。據(jù)稱,這個(gè)云系統(tǒng)通過(guò)將進(jìn)程內(nèi)數(shù)據(jù)庫(kù)的速度與云的可擴(kuò)展性相結(jié)合,簡(jiǎn)化了對(duì)任何規(guī)模數(shù)據(jù)的分析。
MotherDuck認(rèn)為,近年來(lái)數(shù)據(jù)分析的大多數(shù)進(jìn)步都是針對(duì)擁有超過(guò)1PB數(shù)據(jù)的大型企業(yè)和組織,而忽略了擁有類似規(guī)模數(shù)據(jù)量的中小型企業(yè)。
總部位于美國(guó)西雅圖的MotherDuck是由Google BigQuery創(chuàng)始工程師Tigani在2022年共同創(chuàng)立的。2023年9月,該公司在B輪融資中獲得了5250萬(wàn)美元,總?cè)谫Y金額達(dá)到1億美元。
Onehouse
首席執(zhí)行官:Vinoth Chandar
Onehouse公司提供了云原生、完全托管的通用數(shù)據(jù)湖屋服務(wù),并表示,該服務(wù)旨在從任何來(lái)源提取數(shù)據(jù),并可以支持所有查詢引擎。該系統(tǒng)是基于Apache Hudi開(kāi)源數(shù)據(jù)湖平臺(tái)的。
Onehouse希望幫助企業(yè)和組織解決數(shù)據(jù)分散和孤立的問(wèn)題——數(shù)據(jù)分散在本地和云端的數(shù)據(jù)存儲(chǔ)系統(tǒng)、運(yùn)營(yíng)數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中。
今年6月,Onehouse公司推出了產(chǎn)品線的新增產(chǎn)品LakeView,這是面向開(kāi)源社區(qū)的Lakehouse可觀察性工具,以及用于Lakehouse自動(dòng)優(yōu)化的Table Optimizer。8月,Onehouse推出了一個(gè)向量嵌入生成器,用于嵌入管道自動(dòng)化,作為Onehouse管理中ELT(提取、性能和加載)云服務(wù)的一個(gè)組成部分。
Onehouse公司成立于2021年,總部位于美國(guó)加利福尼亞州門(mén)洛帕克,今年6月在由Craft Ventures領(lǐng)投的B輪融資中獲得了3500萬(wàn)美元,早期投資方Addition和Greylock Partners也參與其中。
Scoop Analytics
聯(lián)合創(chuàng)始人、首席執(zhí)行官:Brad Peters
初創(chuàng)公司Scoop Analytics在今年6月憑借其用于自動(dòng)化報(bào)告流程和開(kāi)發(fā)AI驅(qū)動(dòng)的商業(yè)智能演示文稿和報(bào)告軟件脫穎而出。
據(jù)Scoop Analytics稱,該軟件使任何具有電子表格技能的人都可以從任何應(yīng)用中收集數(shù)據(jù),混合來(lái)自不同來(lái)源的數(shù)據(jù),通過(guò)基于實(shí)時(shí)數(shù)據(jù)的幻燈片演示來(lái)創(chuàng)建“視覺(jué)上引人注目的數(shù)據(jù)故事”。
Peters表示,Scoop的使命是“以不需要數(shù)據(jù)團(tuán)隊(duì)的形式提供數(shù)據(jù)分析”,并實(shí)現(xiàn)真正的自助式商業(yè)智能的長(zhǎng)期目標(biāo)。
總部位于美國(guó)舊金山的Scoop Analytics公司是由Peters和其他曾在商業(yè)分析軟件開(kāi)發(fā)商Birst工作的人創(chuàng)立。該公司于6月18日正式成立,獲得了來(lái)自Ridge Ventures、Industry Ventures和Engineering Capital的350萬(wàn)美元種子資金。
Unstructured
創(chuàng)始人、首席執(zhí)行官:Brian Raymond
Unstructured因其用于訪問(wèn)、準(zhǔn)備和轉(zhuǎn)換數(shù)據(jù)(尤其是文檔和圖像等非結(jié)構(gòu)化數(shù)據(jù))的技術(shù)而受到關(guān)注,這些技術(shù)可用于為AI和生成式AI應(yīng)用提供支持的大型語(yǔ)言模型。
在AI發(fā)展的浪潮中,各種組織正在努力清理和準(zhǔn)備大量數(shù)據(jù),尤其是文檔和圖像等非結(jié)構(gòu)化數(shù)據(jù)。Unstructured公司表示,超過(guò)80%的企業(yè)數(shù)據(jù)都存儲(chǔ)在文檔和其他非結(jié)構(gòu)化文件中。
Unstructured的平臺(tái)和開(kāi)發(fā)工具可以將非結(jié)構(gòu)化或“自然語(yǔ)言”數(shù)據(jù)轉(zhuǎn)換為可用于大型語(yǔ)言模型、矢量數(shù)據(jù)庫(kù)和LangChain的格式。Unstructured的系統(tǒng)適用于一系列難以使用的文件類型和格式,包括HTML、PDF、CSV、PNG、PPTX等。
今年7月,總部位于美國(guó)加利福尼亞州薩克拉門(mén)托的Unstructured分別在由Bain Capital Ventures和Madrona領(lǐng)投的種子輪和A輪融資中獲得了2500萬(wàn)美元資金。