偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

阿里為什么要拿下Flink?

新聞 大數(shù)據(jù)
據(jù)歐洲外媒 Deutsche Startups 報(bào)道,阿里巴巴集團(tuán)以 1.033 億美元(9000 萬歐元)的價(jià)格收購了總部位于柏林的初創(chuàng)公司 Data Artisans。此消息之后得到了多家媒體從阿里處的證實(shí)。

  如果這不是因?yàn)榘⒗镄履晗M(fèi)的大單,更多人知道 Flink 或許還會(huì)晚一點(diǎn)。據(jù)歐洲外媒 Deutsche Startups 報(bào)道,阿里巴巴集團(tuán)以 1.033 億美元(9000 萬歐元)的價(jià)格收購了總部位于柏林的初創(chuàng)公司 Data Artisans。此消息之后得到了多家媒體從阿里處的證實(shí)。

  由于 Data Artisans 擁有著一種代表當(dāng)今大數(shù)據(jù)流處理引擎的前沿技術(shù),讓阿里這一收購舉動(dòng)引起了相關(guān)業(yè)界不小的反響。尤其是,在阿里集團(tuán)剛剛進(jìn)行一次大規(guī)模組織架構(gòu)調(diào)整后,需要依靠更加智能化的云計(jì)算技術(shù)融合到阿里系更為多元化的發(fā)展格局中,收購 Data Artisans 不失為面向新戰(zhàn)略的一次有力布局。

[[255422]]

  阿里的 Flink 血液

  不熟悉的 Data Artisans 的讀者,會(huì)很容易錯(cuò)過那些因標(biāo)題為“阿里巴巴收購德國數(shù)據(jù)公司”這種平淡表述下的很多信息。即使那約 1 億美元的收購額表述,在有著近 4000 多億美元體量的的阿里賣賣賣的歷程中,對比之前收購餓了么的 95 億美元、36.7 億美元拿下優(yōu)酷土豆等等,也實(shí)在是難入法眼。

  但其實(shí),Data Artisans 手里握著一項(xiàng)當(dāng)今大數(shù)據(jù)流處理引擎為數(shù)不多的前沿技術(shù),叫做 Flink。Flink 核心是一個(gè)流式的數(shù)據(jù)流執(zhí)行引擎,其針對數(shù)據(jù)流的分布式計(jì)算提供了數(shù)據(jù)分布、數(shù)據(jù)通信以及容錯(cuò)機(jī)制等功能。企業(yè)依托 Flink 技術(shù)體系建立的大數(shù)據(jù)流處理引擎解決方案,可以更合理更快速地獲得計(jì)算結(jié)果投入到企業(yè)決策。Data Artisans 在 2015 年初將 Flink 貢獻(xiàn)給 Apache 社區(qū)并成為該社區(qū)的項(xiàng)目,Data Artisans 此后持有多個(gè)并行流的 data Artisans Platform 成為 Flink 的商業(yè)版本。

  據(jù) Data Artisans 官網(wǎng)介紹,其 dA 平臺(tái)由 Apache Flink 和 dA Application Manager 組成,“包括與容器編排、持續(xù)集成/持續(xù)交付(CI/CD)、日志記錄、度量指標(biāo)和狀態(tài)存儲(chǔ)整合的隨時(shí)可用的功能,為公司客戶提供了單一視圖,以便了解所有的數(shù)據(jù)流處理應(yīng)用。”其客戶包括阿里巴巴、荷蘭國際集團(tuán)(ING)、Netflix、優(yōu)步、Lyft、、eBay、yelp、華為和 Capital One 等。

  在 Data Artisans 的客戶名單里我們輕而易舉的發(fā)現(xiàn)了阿里,其中他每年雙十一時(shí)讓我們在阿里總部盯著的那個(gè)大屏幕上顯示實(shí)時(shí)成交數(shù)字,其背后就是依賴 Flink 技術(shù)。那塊屏幕顯示的數(shù)字,需要通過巨大的網(wǎng)絡(luò)流量匯總各個(gè)地方的報(bào)表、數(shù)據(jù)庫等的數(shù)據(jù),并需要在毫秒級別的時(shí)間延遲之內(nèi)進(jìn)行計(jì)算,并將計(jì)算結(jié)果匯總為單一的視圖,即我們可以通過一塊屏幕觀察到的結(jié)果,這樣的技術(shù)實(shí)現(xiàn)正是大數(shù)據(jù)流處理引擎技術(shù)在當(dāng)今成為 AI 時(shí)代頂梁柱的核心原因。

  如果說 Flink 建立的技術(shù)體系對 AI 時(shí)代是強(qiáng)需求,對阿里就是核心需求。為此,阿里在 Flink 引入內(nèi)部團(tuán)隊(duì)后打造了 Blink。據(jù)透露,目前阿里巴巴所有的業(yè)務(wù),包括阿里巴巴所有子公司都采用了基于 Flink 搭建的實(shí)時(shí)計(jì)算平臺(tái)。另外,阿里巴巴集團(tuán)副總裁周靖人之前宣布,阿里巴巴內(nèi)部 Flink 版本 Blink 將于 2019 年 1 月正式開源,這就意味著阿里未來將會(huì)主要以 Blink 的身份來投入 Flink 的社區(qū)貢獻(xiàn)了。

[[255423]]

阿里巴巴集團(tuán)副總裁周靖人

  可以說,一路下來,對 Flink 的投入,阿里已經(jīng)證明了自己在大數(shù)據(jù)計(jì)算領(lǐng)域的戰(zhàn)略眼光。

  首先,阿里較早地看到了業(yè)務(wù)發(fā)展需要在大數(shù)據(jù)時(shí)代里需求解決方案。有著十年服務(wù)中國企業(yè)云計(jì)算從業(yè)歷史的阿里,已經(jīng)到了大數(shù)據(jù)量爆發(fā)帶給企業(yè)的業(yè)務(wù)壓力,需要有高吞吐、低延遲的大數(shù)據(jù)計(jì)算解決方案服務(wù)自己的大規(guī)模數(shù)據(jù)業(yè)務(wù)場景。早在 2004 的時(shí)候,谷歌自己就放棄了自己創(chuàng)立的大數(shù)據(jù)離線計(jì)算鼻祖,PB 規(guī)模數(shù)據(jù)同時(shí)計(jì)算是 MapReduce 難以逾越的瓶頸。此后 Spark 發(fā)展至今,用批處理方式將大數(shù)據(jù)計(jì)算帶入分鐘級的反應(yīng)延遲。如今,流式主導(dǎo)的分布式計(jì)算正在主導(dǎo)大數(shù)據(jù)計(jì)算引擎將企業(yè)帶入近乎實(shí)時(shí)數(shù)據(jù)環(huán)境。為此,阿里巴巴計(jì)算平臺(tái)事業(yè)部資深技術(shù)專家莫問在云棲大會(huì)上指出,2014 年 Flink 憑借高吞吐、低延遲等其它高級功能而在開源大數(shù)據(jù)引擎界展露頭角,在 2015 年則將 Flink 引入團(tuán)隊(duì)研發(fā),期望將來可服務(wù)于自己的超大規(guī)模數(shù)據(jù)業(yè)務(wù)場景。

  第二,阿里認(rèn)識(shí)到 Flink 的開源技術(shù)基因與自己業(yè)務(wù)融合的落地空間。作為 Apache 的大數(shù)據(jù)流式計(jì)算引擎,F(xiàn)link 并不孤獨(dú)。這兩年谷歌支持的 Beam、DataTorrent 支持 Apache Apex 都成了開源在這領(lǐng)域里的佼佼者。同時(shí),來自 twitter 的 Storm、LinkedIn 的 Samza 也憑借獨(dú)特的優(yōu)勢各領(lǐng)風(fēng)騷。對此,阿里看到了其可以在 Flink 上發(fā)展的“非共識(shí)”空間,莫問認(rèn)為用戶需要有一套統(tǒng)一的大數(shù)據(jù)引擎技術(shù),只需要根據(jù)自己的業(yè)務(wù)邏輯開發(fā)一套代碼,在各種不同的場景下,不管是全量數(shù)據(jù)還是增量數(shù)據(jù),亦或者實(shí)時(shí)處理,一套方案即可全部支持。“這就是阿里選擇 Flink 的背景和初衷。”莫問表示。

  第三,將 Flink 引入阿里全線業(yè)務(wù),從而用場景優(yōu)勢拓展了 Flink 技術(shù)棧前進(jìn)空間。Flink的成就顯然是以其在阿里的應(yīng)用為布局的。關(guān)于 Flink 在阿里巴巴的大規(guī)模應(yīng)用,莫問披露,F(xiàn)link 最初上線阿里巴巴只有數(shù)百臺(tái)服務(wù)器,目前規(guī)模已達(dá)上萬臺(tái);基于 Flink,內(nèi)部積累起來的狀態(tài)數(shù)據(jù)已經(jīng)是 PB 級別規(guī)模;如今每天在 Flink 的計(jì)算平臺(tái)上,處理的數(shù)據(jù)已經(jīng)超過萬億條;在峰值期間可以承擔(dān)每秒超過 4.72 億次的訪問,最典型的應(yīng)用場景是阿里巴巴雙 11 大屏。

Flink 技術(shù)支持了阿里雙十一購物節(jié)大屏顯示的海量實(shí)時(shí)計(jì)算結(jié)果

  第四,阿里將 Flink 帶到前沿戰(zhàn)場,創(chuàng)新聚焦在真正變革上。在阿里著手改造 Flink 之前,F(xiàn)link 針對“一套統(tǒng)一的大數(shù)據(jù)引擎技術(shù)”已經(jīng)初露端倪。大數(shù)據(jù)計(jì)算引擎在批處理與流式計(jì)算之間,不在于數(shù)據(jù)進(jìn)入計(jì)算引擎后,駐留緩存的時(shí)間方式的不同,批處理取決于駐慢緩存空間之后落地長期存儲(chǔ),而流式計(jì)算旨在規(guī)定的時(shí)間或是容量內(nèi)會(huì)將數(shù)據(jù)發(fā)送到下一節(jié)點(diǎn)。Flink 較同期方案,如 Spark、Storm 等,優(yōu)勢就在于可以同時(shí)兼顧兩種方案計(jì)算于一套計(jì)算引擎,但無法“統(tǒng)一”為一個(gè)堆棧。為此,阿里巴巴在 Flink 上提出了新的統(tǒng)一 API 架構(gòu),采用 DAG(有限無環(huán)圖)API。“整個(gè)拓?fù)涫强梢匀诤吓鹘y(tǒng)一的語義表達(dá),整個(gè)計(jì)算無需區(qū)分是流計(jì)算還是批計(jì)算,只需要表達(dá)自己的需求。”

  Flink 的未來,已經(jīng)決定這阿里的技術(shù)基因走向。莫問在云棲大會(huì)上提出了 Flink 的未來三個(gè)方向:首先,讓 Flink 在更多的場景下落地,成為一種主流的批計(jì)算引擎。然后進(jìn)一步在流和批之間進(jìn)行無縫的切換,流和批的界限越來越模糊。其次,讓 Flink 的生態(tài)上有更多語言的支持,不僅僅是 Java,Scala 語言,甚至是機(jī)器學(xué)習(xí)下用的 Python,Go 語言。還有,完善上層 Flink 的 Machine Learning 算法庫,同時(shí) Flink 往上層也會(huì)向成熟的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)場景集成。

  不難看出,F(xiàn)link 的技術(shù)優(yōu)勢讓阿里看到了符合自己大規(guī)模業(yè)務(wù)場景支持的預(yù)期,未來深度學(xué)習(xí)場景的構(gòu)建需要從現(xiàn)有批流融合,發(fā)展為更加開放和智能的落地場景,不斷拓展 Flink 的生態(tài)。

  阿里需要拓寬技術(shù)護(hù)城河

  Flink 項(xiàng)目是大數(shù)據(jù)處理領(lǐng)域最近冉冉升起的一顆新星。有關(guān)其技術(shù)優(yōu)勢我們在《程序員》雜志的《深入理解 Flink 核心技術(shù)》,以及阿里團(tuán)隊(duì)發(fā)表在其云棲社區(qū)的兩篇文章《Flink 已經(jīng)足夠強(qiáng)大了嗎?阿里巴巴說:還不夠》和《阿里巴巴為什么選擇 Apache Flink?》中已經(jīng)有了非常詳盡的解讀。

  總結(jié)來看,F(xiàn)link 在 2015 年之前穩(wěn)定性、安全性方面廣受質(zhì)疑,阿里投入研發(fā)后,通過架構(gòu)變革、創(chuàng)新中間業(yè)務(wù)層、整合計(jì)算流程、開發(fā)融合適配接口等等,F(xiàn)link 可以說迎來脫胎換骨的巨大發(fā)展優(yōu)勢。

  完成對 Data Artisans 的收購,阿里無疑可以進(jìn)一步整合 Flink 的整個(gè)生態(tài)資源,作出更有利于 Flink 發(fā)展的規(guī)劃。不過,隨著 Flink 的一些競爭對手也陸續(xù)實(shí)現(xiàn)了阿里在技術(shù)上的領(lǐng)先優(yōu)勢,F(xiàn)link 在帶給阿里未來強(qiáng)化大數(shù)據(jù)事實(shí)計(jì)算領(lǐng)先地位上,也充滿諸多未知數(shù)。

[[255424]]

  首先,收購前 Flink 有獨(dú)立供應(yīng)商 Data Artisans 支持,開源貢獻(xiàn)使其技術(shù)發(fā)展路線容易符合更廣大用戶的預(yù)期。收購后阿里對 Flink 發(fā)展的擁有絕對權(quán),其對社區(qū)貢獻(xiàn)的參與積極性或相對減弱。

  我們看到,這幾年 Samza 在 LinkedIn 開源后缺乏重量級用戶的加持而發(fā)展的舉步維艱。早在 2014 年成為 Apache 流處理框架項(xiàng)目的它,在久前才進(jìn)入自己的 1.0 階段,而此時(shí) Flink 已經(jīng)歷多次迭代到了 1.8 版本。LinkedIn 的 Sam Samza 團(tuán)隊(duì)負(fù)責(zé)人 Samarth Shetty 為此在 Samza 1.0 的發(fā)布會(huì)上表示,當(dāng)他們找尋流處理時(shí),現(xiàn)有的流處理框架很少能夠處理他們在 LinkedIn 上的規(guī)?;蚣夹g(shù)問題,“例如,我們必須在 Samza 中構(gòu)建增量檢查點(diǎn)和主機(jī)關(guān)聯(lián)性等功能。當(dāng)時(shí)在 Apache Flink 等框架中無法使用這些功能。”顯然,阿里在 Apache Flink 社區(qū)貢獻(xiàn)已經(jīng)改變了這一局面。如今,阿里掌控 Flink 一家獨(dú)大,對于平衡 Flink 的商業(yè)版和社區(qū)之間的貢獻(xiàn),或許會(huì)有新的變化。

  再者,當(dāng)下大數(shù)據(jù)流式計(jì)算技術(shù)突破競爭過于聚焦,阿里的技術(shù)護(hù)城河還需要有新的突破。例如,即使阿里當(dāng)前得益于自己已經(jīng)在 YARN 上實(shí)現(xiàn)了 API 的連接得以將其運(yùn)行在資源管理器上,Samza 則直接作為庫嵌入到應(yīng)用程序中并在任何資源管理器上運(yùn)行,從而讓計(jì)算引擎相對底層服務(wù)更加透明。除此之外,SQL 支持現(xiàn)在成為流媒體的主戰(zhàn)場,Kafka 和 Spark 都有了,致力于支持用 SQL 創(chuàng)建交互式 shell。

  第三,隨著大數(shù)據(jù)流式計(jì)算可以提供更快的數(shù)據(jù)決策,用戶針對傳統(tǒng)批處理模式正在加速向?qū)崟r(shí)數(shù)據(jù)場景遷移,為此流式計(jì)算技術(shù)在做好創(chuàng)新架構(gòu)突破的同時(shí)也要注意對傳統(tǒng)數(shù)據(jù)資產(chǎn)的有效銜接。諸如,F(xiàn)link 已經(jīng)在其分布式的流式計(jì)算框架中實(shí)現(xiàn)了事物的 ACID 操作,有效解決的事物的分布式存儲(chǔ)環(huán)境的緩存一致性和分布式鎖的概念。Data Artisans 聯(lián)合創(chuàng)始人兼CEO Kostas Tzoumas 表示,他們正為這一技術(shù)申請專利,“我們允許公司擺脫他們真正昂貴和復(fù)雜的 Oracle 數(shù)據(jù)庫,這些數(shù)據(jù)庫目前為他們提供 ACID 交易,并轉(zhuǎn)向允許您擴(kuò)展的新技術(shù),允許您實(shí)施自定義代碼,”他同時(shí)表示:“但存在一些明顯的局限性,例如 Flink 與 Oracle 數(shù)據(jù)庫不兼容 API。”

  在這方面,Spark 因?yàn)槲茨芗皶r(shí)支持 Spark 結(jié)構(gòu)流和高級會(huì)話處理的新 API,從而讓 Netflix 的高級數(shù)據(jù)工程師 Arora 決定 Netflix 批量作業(yè)遷移選擇了 Apache Flink 的流式操作。

  第四,阿里在獲得 Flink 商業(yè)所有權(quán)后,需要更為清晰且落地的 Flink 商業(yè)規(guī)劃。在這方面,Apex 似乎是個(gè)很好的例子。DataTorrent 將其 RTS 平臺(tái)的核心處理引擎在兩年前開放給 Apache,當(dāng)時(shí)其已經(jīng)可以利用 YARN 實(shí)現(xiàn)按需規(guī)模伸縮且通過 HDFS 實(shí)現(xiàn)容錯(cuò)能力。那是的 Flink 依舊顯得稚嫩呢。不過在隨后的發(fā)展中,DataTorrent 表越來越激進(jìn),諸如 DataTorrent CEO Guy Churchward 宣布 DataTorrent 標(biāo)記的主要新功能包括通過與 Druid 集成擴(kuò)展支持 SQL 和分析,通過 Python 和 PMML 實(shí)現(xiàn)更多機(jī)器學(xué)習(xí)和 AI 功能,通過與 Drools 集成支持復(fù)雜事件處理規(guī)則,以及存儲(chǔ)和重放以記錄和重放來自一個(gè)時(shí)間點(diǎn)等諸多功能,從平臺(tái)方向到應(yīng)用軟件的創(chuàng)新讓 DataTorrent 的發(fā)展陷入一種混亂。在 2018 年 2 月,在 Guy Churchward 宣布其將提供流媒體數(shù)據(jù)應(yīng)用程序來實(shí)現(xiàn)顛覆性技術(shù)和顛覆性商業(yè)模式的 90 天后,DataTorrent 破產(chǎn)了。顯然,由于流式計(jì)算和批處理在當(dāng)下依然有著較為明確的作用場景,阿里極力致力于批流一體化的實(shí)現(xiàn)還需要有明確的場景支撐才會(huì)更有說服力。

  第五,作為阿里云最為有利的兩個(gè)競爭對手,Amazon 或是微軟早已經(jīng)實(shí)現(xiàn)托管的高速實(shí)時(shí)流分析服務(wù),顯然阿里云的流式計(jì)算堆棧 Flink 還需進(jìn)一步完善。例如 Amazon Kinesis 可以從前端的應(yīng)用服務(wù)器(例如 Web 服務(wù)器)或者移動(dòng)的客戶端(手機(jī)等移動(dòng)設(shè)備或者 IoT 設(shè)備)直接注入流式數(shù)據(jù),數(shù)據(jù)可以通過 EMR 進(jìn)行流式處理和計(jì)算(例如基于 Spark Stream 的 EMR 計(jì)算框架),并將數(shù)據(jù)存儲(chǔ)于 Amazon DynamoDB 或者對象存儲(chǔ) S3 之上。

  根據(jù) MarketInsightsReports 的數(shù)據(jù),預(yù)計(jì)到 2025 年全球流媒體分析市場將達(dá)到 477.5 億美元,從 2017 年到 2025 年將增長 34.98%。而在 IDC 在一份新白皮書中表示,到 2025 年,將近 30% 的所謂“全球數(shù)據(jù)球”將成為實(shí)時(shí)信息。而當(dāng)下,大數(shù)據(jù)、AI、物理網(wǎng)正在加速推動(dòng)流式計(jì)算集成到機(jī)器學(xué)習(xí)、人工智能框架中。阿里巴巴基于 Flink 搭建的平臺(tái)于 2016 年正式上線,并從阿里巴巴的搜索和推薦這兩大場景開始實(shí)現(xiàn)。目前阿里巴巴所有的業(yè)務(wù),包括阿里巴巴所有子公司都采用了基于 Flink 搭建的實(shí)時(shí)計(jì)算平臺(tái)??梢韵嘈牛酉聛?, Flink 將在阿里豐富的場景下,有著更快的發(fā)展。

  去年的時(shí)候,馬云在談到傳位于 CEO 張勇的時(shí)候,馬云期望張勇可以帶給阿里更多技術(shù)基因,讓整個(gè)阿里在人們心中的定位更多有技術(shù)商業(yè)化的色彩。

  對此,一直對這方面技術(shù)和投資動(dòng)態(tài)有深入研究的國科嘉和基金執(zhí)行董事吳一洲認(rèn)為,這次并購是阿里在技術(shù)上的一個(gè)認(rèn)真的思考和布局,批流結(jié)合有其特定場景,公有云或者私有云都可以打包 flink 作為批/流平臺(tái),能看出阿里對技術(shù)儲(chǔ)備的戰(zhàn)略意圖。同時(shí),吳一洲也認(rèn)為,這次并購更深遠(yuǎn)的影響可能在于,之前公有云廠商薅開源羊毛,若持續(xù)吸收控制開源平臺(tái),那么未來開源軟件在公有云上的授權(quán)策略可能會(huì)發(fā)生變化。第三,再看遠(yuǎn)一點(diǎn),她認(rèn)為很可能是大平臺(tái)儲(chǔ)備技術(shù)籌碼的開始,對未來云服務(wù)的生態(tài)和格局會(huì)帶來影響。

 

責(zé)任編輯:張燕妮 來源: 鈦媒體
相關(guān)推薦

2018-10-16 15:34:17

阿里巴巴Apache Flin大數(shù)據(jù)

2021-06-17 06:19:20

存儲(chǔ)SQL數(shù)據(jù)庫

2019-11-13 14:38:34

Executors阿里線程池

2021-10-27 20:54:24

分庫分表高并發(fā)

2013-03-12 14:30:09

Ubuntu操作系統(tǒng)

2015-08-06 10:14:15

造輪子facebook

2022-08-15 08:27:02

基站網(wǎng)絡(luò)

2018-05-23 00:20:29

2019-09-30 07:50:51

ITOps云端ITOM

2019-12-26 14:52:31

微軟CortanaAndroid

2016-08-19 16:27:52

數(shù)據(jù)庫Mongo DB開發(fā)

2017-04-05 18:10:05

R語言開發(fā)Ross

2021-03-16 08:35:14

Kubernetes Docker容器

2022-03-30 08:21:57

合并HTTP

2012-06-18 14:51:09

Python

2022-11-28 09:58:58

C++開發(fā)

2009-12-17 15:18:47

2024-08-28 10:49:47

2014-08-25 10:00:18

開源

2015-05-12 11:04:42

Java EE學(xué)習(xí)Java EE
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號