16個(gè)用于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的頂級平臺
調(diào)研機(jī)構(gòu)Gartner公司將數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺定義為“具有凝聚力的軟件應(yīng)用程序,它提供了創(chuàng)建多種數(shù)據(jù)科學(xué)解決方案以及將這些解決方案合并到業(yè)務(wù)流程、周圍基礎(chǔ)設(shè)施和產(chǎn)品中所必需的基本構(gòu)建塊的混合體。”
平臺" title="16個(gè)用于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的平臺" width="auto" height="auto" border="0">
這樣的平臺支持?jǐn)?shù)據(jù)科學(xué)家在整個(gè)數(shù)據(jù)和分析管道中執(zhí)行任務(wù)。這些任務(wù)包括與數(shù)據(jù)訪問和接收、數(shù)據(jù)準(zhǔn)備、交互式探索和可視化、功能工程、高級建模、測試、培訓(xùn)、部署和性能工程相關(guān)的任務(wù)??紤]到這一點(diǎn),Gartner公司發(fā)布了一份魔力象限報(bào)告,其中介紹了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)這一領(lǐng)域的16個(gè)領(lǐng)先廠商和平臺。
領(lǐng)導(dǎo)者
Gartner公司分析師寫道:“魔力象限中的領(lǐng)導(dǎo)者在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)市場中擁有強(qiáng)大的影響力和重要的知識分享能力。他們在整個(gè)探索、模型開發(fā)和實(shí)施過程中展示了深度和廣度的優(yōu)勢。在提供出色服務(wù)和支持的同時(shí),領(lǐng)導(dǎo)者也能靈活應(yīng)對瞬息萬變的市場環(huán)境。熟練使用領(lǐng)導(dǎo)者平臺的數(shù)據(jù)科學(xué)家專業(yè)人員數(shù)量巨大并且不斷增長。領(lǐng)導(dǎo)者在影響市場增長和方向方面處于最有利的地位。它們涉及所有行業(yè)、地理位置、數(shù)據(jù)域和用例,因此,對該市場有著扎實(shí)的理解和戰(zhàn)略。他們不僅能夠根據(jù)當(dāng)前的市場條件,專注于有效地執(zhí)行,而且他們還擁有堅(jiān)實(shí)和強(qiáng)大的路線圖,以利用這一快速轉(zhuǎn)型行業(yè)的新發(fā)展和先進(jìn)技術(shù)。他們提供思想領(lǐng)導(dǎo)和創(chuàng)新差異化,經(jīng)常在實(shí)施過程中顛覆市場。”
(1)Alteryx公司
Alteryx公司總部位于加利福尼亞州歐文市。Gartner公司分析師表示,“Alteryx公司提供統(tǒng)一的機(jī)器學(xué)習(xí)平臺Alteryx Analytics,使公民數(shù)據(jù)科學(xué)家能夠在單一工作流程中構(gòu)建模型。2017年中期,Alteryx公司收購了專注于模型部署和管理的數(shù)據(jù)科學(xué)供應(yīng)商Yhat公司。Alteryx公司于2017年初在紐約證券交易所發(fā)行首次公開募股(IPO),加強(qiáng)了其投資擴(kuò)展和增強(qiáng)其平臺的能力。Alteryx公司已經(jīng)從挑戰(zhàn)者象限發(fā)展到領(lǐng)導(dǎo)者象限。這得益于強(qiáng)大的執(zhí)行力(在收入增長和客戶獲取方面),其具有令人印象深刻的客戶滿意度,以及專注于幫助組織灌輸數(shù)據(jù)和分析文化。”
(2)H20.ai公司
H2O.ai公司總部位于加州山景城。Gartner公司分析師表示,“H2O.ai公司提供了一個(gè)開源的機(jī)器學(xué)習(xí)平臺,對于這個(gè)魔力象限,我們評估了核心組件H2O Flow,H2O Steam;用于Spark集成H2O Sparkling Water;以及提供深度學(xué)習(xí)能力的H2O Deep Water。H2O.ai已從先前魔力象限的夢想者發(fā)展為領(lǐng)導(dǎo)者。它通過重大的商業(yè)擴(kuò)張繼續(xù)取得進(jìn)展,并鞏固了其作為思想領(lǐng)袖和創(chuàng)新者的地位。”
(3)KNIME公司
KNIME公司總部位于瑞士蘇黎世。Gartner公司表示,“KNIME公司提供完全開源的KNIME分析平臺,全球有超過100,000人使用。KNIME提供商業(yè)支持和商業(yè)擴(kuò)展,以促進(jìn)企業(yè)部署的協(xié)作、安全性和性能。在過去的一年中,KNIME公司為AWS和Microsoft Azure引入了其云平臺版本,更加注重?cái)?shù)據(jù)質(zhì)量,擴(kuò)展了其深度學(xué)習(xí)功能,并將其部分商業(yè)功能轉(zhuǎn)換為開源。KNIME正在加速其產(chǎn)品開發(fā)和客戶獲取工作。KNIME的平臺被大多數(shù)行業(yè)和世界上大多數(shù)地區(qū)使用。該供應(yīng)商展示了對市場的深刻理解,強(qiáng)大的產(chǎn)品戰(zhàn)略和所有用例的優(yōu)勢。這些屬性共同鞏固了其作為領(lǐng)導(dǎo)者的地位。”
(4)RapidMiner公司
RapidMiner公司總部位于馬薩諸塞州波士頓。Gartner公司分析師表示,“RapidMiner公司的平臺包括RapidMiner Studio、RapidMiner Server和RapidMiner Radoop。RapidMiner Studio是模型開發(fā)工具,提供免費(fèi)版和商業(yè)版;它的價(jià)格取決于邏輯處理器的數(shù)量和模型使用的數(shù)據(jù)量。通過采用免費(fèi)版,客戶可以獲得一個(gè)邏輯處理器和10,000行數(shù)據(jù)。 RapidMiner Server旨在共享、協(xié)作和維護(hù)模型。RapidMiner Radoop將RapidMiner的執(zhí)行直接擴(kuò)展到Hadoop環(huán)境中。RapidMiner公司仍然是一個(gè)領(lǐng)導(dǎo)者,為全方位的數(shù)據(jù)科學(xué)家和數(shù)據(jù)科學(xué)團(tuán)隊(duì)提供全面且易于使用的平臺。RapidMiner通過引入新的生產(chǎn)力和性能能力,繼續(xù)強(qiáng)調(diào)核心數(shù)據(jù)科學(xué)以及模型開發(fā)和執(zhí)行的速度。”
(5)SAS公司
SAS公司總部位于北卡羅來納州卡里市。Gartner公司分析師表示,“SAS公司為分析和數(shù)據(jù)科學(xué)提供了許多軟件產(chǎn)品。對于這個(gè)Magic Quadrant,我們評估了SAS Enterprise Miner(EM)和SAS Visual Analytics產(chǎn)品套件,其中包括Visual Statistics和Visual Data Mining以及Machine Learning。SAS仍然是領(lǐng)導(dǎo)者,但在視覺完整性和執(zhí)行能力方面已經(jīng)失去了一些基礎(chǔ)。Visual Analytics套件因其Viya云就緒架構(gòu)而顯示出發(fā)展前景,該架構(gòu)比以前的SAS架構(gòu)更加開放,并且使得廣泛的用戶更容易訪問分析。然而,其令人困惑的多產(chǎn)品策略影響了SAS的視覺完整性,并且高許可成本的感知削弱了其執(zhí)行能力。隨著市場焦點(diǎn)轉(zhuǎn)向開源軟件和靈活性,SAS公司提供有凝聚力的開放平臺的速度緩慢,并已經(jīng)為此付出了代價(jià)。”
挑戰(zhàn)者
Gartner公司分析師表示,“挑戰(zhàn)者擁有穩(wěn)固的存在、可信度、可行性和強(qiáng)大的產(chǎn)品能力。然而,他們可能不會像領(lǐng)導(dǎo)者那樣展示思想領(lǐng)導(dǎo)力和創(chuàng)新能力。挑戰(zhàn)者主要有兩種類型。長期建立的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)供應(yīng)商,因其穩(wěn)定性、可預(yù)測性和長期客戶關(guān)系而取得成功。他們需要振興發(fā)展愿景,以便與市場發(fā)展保持同步,并變得更具影響力和創(chuàng)新性。如果他們繼續(xù)做一直在做的事情,其業(yè)務(wù)增長和市場存在可能會受到損害。在相關(guān)市場中建立良好基礎(chǔ)的供應(yīng)商,正在進(jìn)入數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)市場,其解決方案可擴(kuò)展現(xiàn)有客戶的現(xiàn)有平臺,但對許多潛在新客戶而言也是合理的選擇。由于這些供應(yīng)商證明他們可以影響這個(gè)市場,并提供明確的方向和愿景,他們可能會發(fā)展成領(lǐng)導(dǎo)者。”
(1)MathWorks公司
MathWorks公司是一家總部位于馬薩諸塞州內(nèi)蒂克的私營公司。Gartner公司分析師表示,“Mathwork的兩個(gè)主要產(chǎn)品是MATLAB和Simulink,但只有MATLAB符合此魔力象限的入選標(biāo)準(zhǔn)。MathWorks公司仍然是挑戰(zhàn)者。它的執(zhí)行能力得益于其在一般高級分析領(lǐng)域的持續(xù)可見性,重要的安裝基礎(chǔ)和強(qiáng)大的客戶關(guān)系,但受到參考客戶對關(guān)鍵能力的平均分?jǐn)?shù)的影響。其完整的愿景受限于其對工程和高端財(cái)務(wù)用例的關(guān)注。”
(2)TIBCO Software公司
TIBCO Software公司位于加利福尼亞州的帕洛阿爾托。Gartner公司分析師表示,“基于其在分析和商務(wù)智能領(lǐng)域的地位,TIBCO公司于2017年6月從Quest Software收購了成熟的Statistica平臺,進(jìn)入了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)市場。此外,2017年11月,TIBCO宣布收購Alpine Data,這是之前魔力象限的遠(yuǎn)見者。在執(zhí)行能力方面,此魔力象限僅評估TIBCO公司在Statistica平臺上的能力。 TIBCO的其他收購僅對其完整性有所貢獻(xiàn)。 TIBCO作為挑戰(zhàn)者進(jìn)入這個(gè)魔力象限。Statistica平臺擁有龐大而成熟的客戶群,并在三個(gè)最典型的用例中獲得高分:業(yè)務(wù)探索、高級原型設(shè)計(jì)和生產(chǎn)改進(jìn)。”
遠(yuǎn)見者
Gartner公司表示,“遠(yuǎn)見者通常是規(guī)模較小的供應(yīng)商或代表正在塑造或有可能影響市場的趨勢的新進(jìn)入者。然而,可能會擔(dān)心這些供應(yīng)商能夠有效地繼續(xù)執(zhí)行并隨著他們的成長而擴(kuò)展。它們通常在市場上并不為人所知,因此相對于挑戰(zhàn)者和領(lǐng)導(dǎo)者而言,它們的領(lǐng)導(dǎo)力往往較低。遠(yuǎn)見者有強(qiáng)烈的愿景和支持路線圖。他們在解決市場需求方面具有創(chuàng)新精神。雖然他們提供的功能通常具有創(chuàng)新性和可靠性,但在產(chǎn)品的完整性和廣度上往往存在差距。”
遠(yuǎn)見者值得考慮,因?yàn)樗麄兛赡埽?/p>
- 提供啟動創(chuàng)新計(jì)劃的機(jī)會。
- 提供一些引人注目的差異化功能,作為現(xiàn)有解決方案的補(bǔ)充或替代,并提供競爭優(yōu)勢。
- 更容易受到產(chǎn)品路線圖和方法的影響。
(1)Databricks公司
Databricks公司總部位于加利福尼亞州舊金山。Gartner公司分析師表示,“Databricks公司在云中提供基于Apache Spark的Databricks統(tǒng)一分析平臺。除Spark外,它還為Amazon Web Services(AWS)提供安全性、可靠性、操作性、性能和實(shí)時(shí)支持的專有功能。Databricks公司于2017年11月宣布推出一款Microsoft Azure Databricks平臺,該平臺未在此魔力象限中考慮,因?yàn)樗谠u估時(shí)通常不可用。Databricks公司是這個(gè)魔力象限的新進(jìn)入者。作為遠(yuǎn)見者,它利用開源社區(qū)和自己的Spark專業(yè)知識,提供一個(gè)易于訪問且熟悉的平臺。除數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)外,Databricks公司還專注于數(shù)據(jù)工程。2017年D輪融資額為1.4億美元,為Databricks公司提供了大量資源,可以擴(kuò)展其部署選項(xiàng)并實(shí)現(xiàn)其愿景。”
(2)Dataiku
Dataiku公司總部位于紐約市,在法國巴黎設(shè)有總部。Gartner分析師表示,“Dataiku公司提供的數(shù)據(jù)科學(xué)工作室(DSS)專注于跨學(xué)科協(xié)作和易用性,通過使用戶能夠快速啟動機(jī)器學(xué)習(xí)項(xiàng)目,Dataiku仍然是一個(gè)遠(yuǎn)見者,并且是許多數(shù)據(jù)科學(xué)需求的熱門選擇。它的完整性愿景是由于其合作和開源支持,這也是其產(chǎn)品路線圖的重點(diǎn)。由于用例方面的廣度相對較差以及自動化和數(shù)據(jù)流的不足,其整體視覺分?jǐn)?shù)低于之前的魔力象限。由于操作和擴(kuò)展機(jī)器學(xué)習(xí)模型的一些困難,Dataiku公司的執(zhí)行能力也有所下降。”
(3)Domino公司
Domino公司(Domino Data Lab)總部位于加利福尼亞州舊金山。Gartner公司分析師表示,“Domino公司提供了Domino數(shù)據(jù)科學(xué)平臺。這是專家數(shù)據(jù)科學(xué)團(tuán)隊(duì)的端到端解決方案。該平臺專注于集成開源和專有工具生態(tài)系統(tǒng)的工具,協(xié)作、可重復(fù)性以及模型開發(fā)和部署的集中化。Domino公司成立于2013年,是該市場知名廠商,并繼續(xù)在數(shù)據(jù)科學(xué)家中獲得知名度。Domino公司堅(jiān)持其作為遠(yuǎn)見者的地位。它的執(zhí)行能力雖然得到了改進(jìn),但在機(jī)器學(xué)習(xí)生命周期(數(shù)據(jù)訪問、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)探索和可視化)開始時(shí)功能較弱仍然受到阻礙。然而,在過去一年中,多米諾已經(jīng)證明了在競爭激烈的市場中贏得新用戶并獲得領(lǐng)導(dǎo)力的能力。”
(4)IBM公司
IBM公司總部位于紐約阿蒙克。Gartner分析師表示,“IBM提供了許多分析解決方案。對于這個(gè)魔力象限,我們評估了SPSS,其中包括SPSS Modeler和SPSS Statistics。數(shù)據(jù)科學(xué)體驗(yàn)(DSX)是第二個(gè)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)產(chǎn)品,不符合我們對執(zhí)行能力軸的評估標(biāo)準(zhǔn),但確實(shí)有助于IBM的完整性。IBM現(xiàn)在是一個(gè)遠(yuǎn)見者,相對于其他供應(yīng)商而言,在遠(yuǎn)見者的完整性和執(zhí)行能力方面已經(jīng)失去了優(yōu)勢。然而,IBM公司的DSX產(chǎn)品有可能激發(fā)更全面和創(chuàng)新的愿景。IBM公司已宣布計(jì)劃在2018年為其SPSS產(chǎn)品提供新接口,該接口將SPSS Modeler完全集成到DSX中。”
(5)微軟公司
微軟公司總部位于華盛頓州雷德蒙市。Gartner公司分析師表示,“微軟為數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)提供了許多軟件產(chǎn)品。在云端,它提供Azure機(jī)器學(xué)習(xí)(包括Azure機(jī)器學(xué)習(xí)工作室),Azure數(shù)據(jù)工廠、Azure流分析、Azure HDInsight、Azure數(shù)據(jù)湖和Power BI。對于本地工作負(fù)載,微軟公司提供帶有機(jī)器學(xué)習(xí)服務(wù)的SQL Server,該服務(wù)于2017年9月發(fā)布。在此魔力象限的截止日期之后。只有Azure機(jī)器學(xué)習(xí)工作室符合此魔力象限的納入標(biāo)準(zhǔn),盡管微軟公司具有更廣泛的高級分析產(chǎn)品確實(shí)影響了我們對其完整性的評估。但微軟公司仍然是一個(gè)遠(yuǎn)見者。它獲得這個(gè)地位主要是因?yàn)槠涫袌鲰憫?yīng)能力和產(chǎn)品可行性得分較低,因?yàn)锳zure機(jī)器學(xué)習(xí)工作室的純云特性限制了它在許多需要內(nèi)部部署選項(xiàng)的高級分析用例中的可用性。”
利基企業(yè)
Gartner公司分析師解釋說:“利基公司在特定行業(yè)或方法中表現(xiàn)出優(yōu)勢,或與特定技術(shù)堆棧結(jié)合。一些利基公司表現(xiàn)出一定程度的遠(yuǎn)見,這表明他們有可能成為遠(yuǎn)見者。然而,相對于市場上的其他公司,他們往往難以讓自己的愿景引人注目,也可能在努力創(chuàng)造創(chuàng)新和思想領(lǐng)導(dǎo)的歷史記錄,從而使他們成為遠(yuǎn)見者。如果其他利基企業(yè)繼續(xù)以增強(qiáng)其在市場中的勢頭和吸引力的方式執(zhí)行任務(wù),他們可能會成為挑戰(zhàn)者。”
(1)Anaconda公司
Anaconda公司前身為Continuum Analytics,該公司總部位于德克薩斯州奧斯汀市。Gartner分析師解釋說,“Anaconda公司銷售Anaconda Enterprise 5.0,這是一個(gè)基于交互式筆記本概念的開源開發(fā)環(huán)境。它還提供了一個(gè)松散耦合的分發(fā)環(huán)境,可以訪問各種開源開發(fā)環(huán)境和開源庫,主要是基于Python。Anaconda公司的優(yōu)勢在于它能夠聯(lián)合并為大量不斷構(gòu)建機(jī)器學(xué)習(xí)功能的Python開發(fā)人員提供中央訪問點(diǎn)。然而,Anaconda公司對這些開發(fā)人員在質(zhì)量、可靠性和可持續(xù)性方面的努力幾乎沒有控制權(quán)。 Anaconda通過Anaconda Cloud培育廣泛的開發(fā)者社區(qū)。Anaconda作為利基公司的地位反映了它對于熟練掌握Python的經(jīng)驗(yàn)豐富的數(shù)據(jù)科學(xué)家的適用性。”
(2)Angoss公司
總部位于加拿大多倫多的Angoss公司于2018年1月被Datawatch公司收購。Gartner公司分析師表示,“由于收購的延遲,相對于魔力象限流程,以及不確定的影響,它在文檔中的名稱仍為Angoss公司。此評估涵蓋以下產(chǎn)品:該公司最基本的產(chǎn)品KnowledgeSEEKER,主要針對桌面環(huán)境中的公民數(shù)據(jù)科學(xué)家;KnowledgeSTUDIO,包含比KnowledgeSEEKER更多的模型和功能;以及新推出的KnowledgeENTERPRISE,這是一款包含全系列功能的旗艦產(chǎn)品。 Angoss公司與銀行客戶有著長期的合作經(jīng)驗(yàn)。這有助于向銀行業(yè)和其他具有類似數(shù)據(jù)和分析需求的行業(yè)提供服務(wù),例如保險(xiǎn)、運(yùn)輸和公用事業(yè)。”
(3)SAP公司
SAP總部位于德國瓦爾多夫。Gartner公司分析師表示,“SAP公司再次將其平臺重新命名為:SAP Business Objects Predictive Analytics。該平臺具有許多組件,例如用于數(shù)據(jù)集準(zhǔn)備和特征工程的Data Manager,用于公民數(shù)據(jù)科學(xué)家的Automated Modeler,用于更復(fù)雜機(jī)器學(xué)習(xí)的Predictive Composer以及用于操作的Predictive Factory。SAP Leonardo機(jī)器學(xué)習(xí)和SAP Leonardo生態(tài)系統(tǒng)的其他組件對SAP在此魔力象限中的執(zhí)行能力沒有貢獻(xiàn)。在過去的一年中,SAP公司在幾個(gè)方面取得了很好的進(jìn)展,但在其他方面仍然落后。它是一個(gè)利基企業(yè),因?yàn)橄鄬τ谄渌緛碚f,其客戶滿意度低,缺乏思想共享。”
(4)Teradata公司
Teradata公司總部位于加利福尼亞州圣地亞哥。Gartner公司分析師表示,“Teradata公司統(tǒng)一數(shù)據(jù)架構(gòu)(UDA)是一個(gè)企業(yè)分析生態(tài)系統(tǒng),它結(jié)合了開源和商業(yè)技術(shù),提供分析功能。UDA包括Aster Analytics、Teradata數(shù)據(jù)庫、Hadoop和數(shù)據(jù)管理工具。盡管Teradata公司具有強(qiáng)大的運(yùn)營能力,但它仍然缺乏統(tǒng)一的端到端技術(shù)平臺。Teradata公司保持了其內(nèi)在的性能和可靠性優(yōu)勢,但其在數(shù)據(jù)科學(xué)開發(fā)方面缺乏凝聚力和易用性,削弱了其執(zhí)行能力和在視覺完整性方面取得的進(jìn)展。它仍然是一個(gè)利基企業(yè)。”






