用于收集大量數(shù)據(jù)的十個(gè)強(qiáng)大的企業(yè)級(jí)ELT工具
譯文【51CTO.com快譯】很多企業(yè)每天都在處理海量數(shù)據(jù)。調(diào)研機(jī)構(gòu)Global Data Fabric公司發(fā)布的一份市場(chǎng)分析報(bào)告指出,“到2021年底,全球各地的企業(yè)使用數(shù)據(jù)獲取洞察力獲得的收入高達(dá)1.8萬億美元。”由于數(shù)據(jù)量如此之大,以至于企業(yè)對(duì)收集到的數(shù)據(jù)進(jìn)行維護(hù)和分類變得越來越困難。此外,人工處理數(shù)據(jù)將會(huì)變得更加耗時(shí)和單調(diào)。
隨著技術(shù)的快速進(jìn)步,很多企業(yè)正在想方設(shè)法獲得更大的優(yōu)勢(shì),致力在市場(chǎng)競爭中獲勝。因此,企業(yè)采用正確的ELT(提取、加載和轉(zhuǎn)換)工具和平臺(tái)可以極大地提高生產(chǎn)力。ELT工具可以收集數(shù)據(jù),根據(jù)共同特征篩選數(shù)據(jù),并提供所收集數(shù)據(jù)的清晰見解。
以下是行業(yè)專家對(duì)于評(píng)分高于4分(滿分為5分)的10種企業(yè)級(jí)ELT工具。這些工具可以為采用它們的企業(yè)提供巨大的優(yōu)勢(shì)。
1.K2View
與傳統(tǒng)的ELT工具依賴于對(duì)數(shù)據(jù)庫進(jìn)行復(fù)雜、嚴(yán)格和計(jì)算量大的轉(zhuǎn)換以將干凈的數(shù)據(jù)交付到湖泊和數(shù)據(jù)倉庫中。K2View數(shù)據(jù)準(zhǔn)備中心按業(yè)務(wù)實(shí)體對(duì)數(shù)據(jù)進(jìn)行管道化處理。其聲明如下:“我們獲得專利的基于實(shí)體的ETL(eETL)技術(shù)確保高速數(shù)據(jù)管道具有數(shù)據(jù)完整性、低計(jì)算和網(wǎng)絡(luò)帶寬消耗以及在幾分鐘內(nèi)適應(yīng)管道的敏捷性。
數(shù)據(jù)工程師使用產(chǎn)品的無代碼工具來創(chuàng)建、測(cè)試和部署數(shù)據(jù)準(zhǔn)備流程。每個(gè)數(shù)據(jù)準(zhǔn)備流程都通過集成實(shí)體集成、清理、豐富、匿名化、轉(zhuǎn)換和管道數(shù)據(jù)——在數(shù)據(jù)湖中實(shí)現(xiàn)快速查詢,而無需在數(shù)據(jù)庫之間進(jìn)行復(fù)雜的計(jì)算密集型連接。
由于數(shù)據(jù)由業(yè)務(wù)實(shí)體持續(xù)收集和處理,因此還可以同時(shí)將其實(shí)時(shí)交付到運(yùn)營系統(tǒng),以支持客戶、運(yùn)營智能和其他運(yùn)營工作負(fù)載。”
評(píng)級(jí):4.7/5
網(wǎng)站:K2view
2.Datarobot/Paxata
Datarobot通過提供用于構(gòu)建、實(shí)施和管理機(jī)器學(xué)習(xí)模型的端到端自動(dòng)化,使數(shù)據(jù)科學(xué)適用于各個(gè)行業(yè)。Datarobot的優(yōu)勢(shì)在于它可以大規(guī)模交付人工智能,同時(shí)在整個(gè)生命周期內(nèi)提高其性能。自動(dòng)化解決方案有助于更好的數(shù)據(jù)分析和通過機(jī)器學(xué)習(xí)改進(jìn)現(xiàn)有流程的方法。Datarobot提供多種連接方法,例如簡單的CSV上傳或HDFS路徑。
評(píng)分:4.4/5
網(wǎng)站:Datarobot
3.Talend
Talend是一個(gè)開源的ELT數(shù)據(jù)集成平臺(tái),兼容內(nèi)部部署和基于云計(jì)算的數(shù)據(jù)資源。Talend數(shù)據(jù)集成平臺(tái)還提供了大量預(yù)構(gòu)建的集成。該平臺(tái)有開源和訂閱兩種方式。雖然發(fā)現(xiàn)開源版本非常有效,但用戶更喜歡采用付費(fèi)版本。Talend數(shù)據(jù)集成平臺(tái)的付費(fèi)版本為設(shè)計(jì)、生產(chǎn)力、管理和數(shù)據(jù)治理提供了額外的工具。
評(píng)分:4.0/5
網(wǎng)站:Talend
4.Fivetran
Fivetran是一種基于云計(jì)算的ELT解決方案,支持與Azure和Redshift等各種數(shù)據(jù)倉庫的數(shù)據(jù)集成。Fivetran能夠?yàn)槠湄S富的數(shù)據(jù)源陣列添加自定義集成。該工具以其簡單易用而著稱。Fivetran沒有任何數(shù)據(jù)限制,因此可用于集中企業(yè)數(shù)據(jù)并將所有資源整合到一個(gè)地方。這將有助于確定企業(yè)的關(guān)鍵績效指標(biāo)。
評(píng)分:4.3/5
網(wǎng)站:Fivetran
5.Altair
Altair是一家軟件解決方案提供商,主要專注于數(shù)據(jù)分析、產(chǎn)品設(shè)計(jì)、高性能計(jì)算和物聯(lián)網(wǎng)(IoT)等業(yè)務(wù)。Monarch是Altair公司的數(shù)據(jù)分析解決方案,是一種自助式數(shù)據(jù)準(zhǔn)備工具。該平臺(tái)具有提取、清理和轉(zhuǎn)換數(shù)據(jù)的能力,具有80多個(gè)預(yù)構(gòu)建的數(shù)據(jù)準(zhǔn)備功能。Altair的Monarch可以從PDF文件中提取數(shù)據(jù)并將其轉(zhuǎn)換為PNG、文本文件和結(jié)構(gòu)源。Monarch的主要優(yōu)點(diǎn)之一是它不需要編碼能力。
評(píng)分:4.5/5
網(wǎng)站:Altair
6.Xplenty
Xplenty是一個(gè)基于云計(jì)算的ELT數(shù)據(jù)集成平臺(tái),可以無縫整合多個(gè)數(shù)據(jù)源。用于跨多個(gè)源和目標(biāo)構(gòu)建數(shù)據(jù)管道的簡單可視化界面,使Xpleenty高度用戶友好。Xpleenty可以輕松與各種數(shù)據(jù)源集成,如MongoDB、MYSQL、Postgre SQL、Google Cloud、AWS、Salesforce等。Xplenty數(shù)據(jù)集成平臺(tái)還提供出色的客戶支持、安全性和可擴(kuò)展性。用戶還可以利用Xpleenty的“字段級(jí)加密”來使用自己的私鑰對(duì)數(shù)據(jù)進(jìn)行加密和解密。
評(píng)分:4.4/5
網(wǎng)站:Xplenty
7.Informatica
Informatica是提供ELT解決方案的主要公司之一。Informatica為ELT工作負(fù)載開發(fā)的功能豐富的數(shù)據(jù)集成平臺(tái)的名稱為“Informatica PowerCenter”。PowerCenter是一種企業(yè)級(jí)解決方案,因其與各種數(shù)據(jù)源(SQL和非SQL)的兼容性而享有盛譽(yù)。Informatica的解決方案被大型企業(yè)廣泛采用,而對(duì)于小型企業(yè)來說,其學(xué)習(xí)曲線可能有挑戰(zhàn)性。
評(píng)分:4.3/5
網(wǎng)站:Informatica
8.Alteryx
Alteryx是分析過程自動(dòng)化(APA)的領(lǐng)先平臺(tái)之一。他們的ELT產(chǎn)品將數(shù)據(jù)分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)與業(yè)務(wù)流程自動(dòng)化(BPA)相結(jié)合,構(gòu)建了一個(gè)可以加速數(shù)字化轉(zhuǎn)型的平臺(tái)。該平臺(tái)提供了一個(gè)無代碼界面,可以滿足各種技術(shù)專長的用戶的需求。對(duì)于高級(jí)用戶,它還支持可以幫助用戶處理重復(fù)性任務(wù)的宏。
評(píng)分:4.5/5
網(wǎng)站:Alteryx
9.Tamr
Tamr提供有關(guān)云原生、內(nèi)部部署和混合部署的數(shù)據(jù)掌握解決方案,這使其成為市場(chǎng)上獨(dú)一無二的產(chǎn)品。Tamr借助平臺(tái)提供的分析幫助企業(yè)對(duì)其業(yè)務(wù)流程做出明智的決策,這些分析已經(jīng)針對(duì)數(shù)據(jù)分析程序進(jìn)行了清理、更新和策劃。他們的機(jī)器學(xué)習(xí)通過反饋工作流推動(dòng)數(shù)據(jù)分類和轉(zhuǎn)換,讓數(shù)據(jù)專家不斷改進(jìn)他們的機(jī)器學(xué)習(xí)模型。Tamr還提供了一個(gè)開放的架構(gòu)和API,可以輕松地與包括傳統(tǒng)管道在內(nèi)的數(shù)據(jù)管道集成。
評(píng)分:4.1/5
網(wǎng)站:Tamr
10.Denodo
Denodo為廣泛的大數(shù)據(jù)、企業(yè)、非結(jié)構(gòu)化、實(shí)時(shí)和云計(jì)算數(shù)據(jù)服務(wù)提供高性能數(shù)據(jù)集成和抽象平臺(tái)。Denodo為商業(yè)智能、分析等提供統(tǒng)一的業(yè)務(wù)數(shù)據(jù)。Denodo平臺(tái)連接支持?jǐn)?shù)據(jù)庫、遺留數(shù)據(jù)、平面文件、打包應(yīng)用程序和新興數(shù)據(jù)類型(Hadoop)。Denodo是唯一一個(gè)在AWS市場(chǎng)上被配置為虛擬映像的數(shù)據(jù)可視化平臺(tái)。使用Denodo,用戶可以訪問和保護(hù)多種格式的數(shù)據(jù),例如REST、SOAP和OData。
評(píng)分:4.1/5
網(wǎng)站:Denodo
結(jié)語
上述所有ELT工具有助于業(yè)務(wù)流程自動(dòng)化(BPA),可以顯著提高生產(chǎn)率。通過使用這些工具,企業(yè)可以在有必要人工干預(yù)的情況下啟用其勞動(dòng)力,同時(shí)自動(dòng)化執(zhí)行重復(fù)且耗時(shí)的任務(wù)。
原文標(biāo)題:10 Robust Enterprise-Grade ELT Tools To Collect Loads of Data,作者:Mouli Srini
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】


2015-04-22 09:36:27




