偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

EMR on ACK 全新發(fā)布,助力企業(yè)高效構(gòu)建大數(shù)據(jù)平臺

網(wǎng)絡(luò)
阿里云 EMR on ACK 為用戶提供了全新的構(gòu)建大數(shù)據(jù)平臺的方式,用戶可以將開源大數(shù)據(jù)服務(wù)部署在阿里云容器服務(wù)(ACK)上。利用 ACK 在服務(wù)部署和對高性能可伸縮的容器應(yīng)用管理的能力優(yōu)勢,用戶只需要專注在大數(shù)據(jù)作業(yè)本身。

阿里云 EMR on ACK 為用戶提供了全新的構(gòu)建大數(shù)據(jù)平臺的方式,用戶可以將開源大數(shù)據(jù)服務(wù)部署在阿里云容器服務(wù)(ACK)上。利用 ACK 在服務(wù)部署和對高性能可伸縮的容器應(yīng)用管理的能力優(yōu)勢,用戶只需要專注在大數(shù)據(jù)作業(yè)本身。用戶可以便捷地將 Spark、Presto、Flink 作業(yè)執(zhí)行在 ACK 集群上,100%兼容開源,性能優(yōu)于開源。

一、背景介紹

技術(shù)趨勢

存儲與計算分離,向云原生演進(jìn)
在線業(yè)務(wù)、AI、大數(shù)據(jù)統(tǒng)一接入 ACK 集群,錯峰調(diào)度,離線在線混部,提升機(jī)器利用率
統(tǒng)一運(yùn)維入口,統(tǒng)一運(yùn)維工具鏈,統(tǒng)一監(jiān)控體系
以集群為中心->以作業(yè)為中心
多版本支持,例如可以同時跑 Spark2.x、Spark3.x

云原生面臨挑戰(zhàn)

計算與存儲分離:如何構(gòu)建以對象存儲 OSS 為底座的 HCFS 文件系統(tǒng)

需要完全兼容現(xiàn)有的 HDFS

性能對標(biāo) HDFS,成本降低

計算引擎 shuffle 數(shù)據(jù)存算分離:如何解決 ACK 混合異構(gòu)機(jī)型

異構(gòu)機(jī)型沒有本地盤

社區(qū)[ Spark-25299]討論,支持 Spark 動態(tài)資源,成為業(yè)界共識

ACK 調(diào)度能力:如何解決調(diào)度性能瓶頸

性能對標(biāo) Yarn

多級隊列管理

錯峰調(diào)度

借助 K8s 操作系統(tǒng)能力,編排組織各種業(yè)務(wù)的波峰波谷

EMR on ACK 優(yōu)勢

Remote Shuffle Service 提供中間 shuffle 數(shù)據(jù)的存儲計算分離方案

可以使計算節(jié)點無需本地盤和云盤

支持打開 Spark 動態(tài)資源功能,Spark-25299 終極方案

JindoFS 針對 OSS 存儲提供湖加速解決方案

Block 模式1TB TPCDS 場景下有15%以上的性能提升

調(diào)度層面支持 Scheduler Framework V2

調(diào)度性能比社區(qū)提升3x以上

提供多級隊列管理

引擎能力增強(qiáng)

10TB TPCDS Benchmark 場景下,EMR Spark 比社區(qū)有3x性能提升

Hudi、DeltaLake 比社區(qū)功能性能增強(qiáng)

完整的錯峰調(diào)度方案

二、EMR 容器化架構(gòu)

EMR on ACK 架構(gòu)

輕量化管控,對接已有數(shù)據(jù)平臺
通過數(shù)據(jù)開發(fā)集群/調(diào)度平臺提交到不同的執(zhí)行平臺
錯峰調(diào)度,根據(jù)業(yè)務(wù)高峰低峰策略調(diào)整
云原生數(shù)據(jù)湖架構(gòu),ACK 彈性擴(kuò)縮容能力強(qiáng)
ACK 管理異構(gòu)機(jī)型集群,靈活性好

三、產(chǎn)品介紹

產(chǎn)品首頁

參考鏈接:https://www.aliyun.com/product/emapreduce

新建集群

地域:目前開放杭州、上海、北京、深圳等地域(持續(xù)開放中)
集群類型:Spark 、Shuffle Service、Presto
Spark — 通用的分布式大數(shù)據(jù)處理引擎
提供了 ETL、離線批處理、數(shù)據(jù)建模等能力

Shuffle Service — 針對 EMR 計算引擎提供優(yōu)化的 Shuffle 服務(wù)
解決 Kubernetes 下對本地盤的依賴問題

解決大規(guī)模計算集群的網(wǎng)絡(luò)和磁盤的 IO 瓶頸

支持計算與存儲分離的架構(gòu),可服務(wù)多個 EMR 集群

Presto — 基于內(nèi)存的分布式 SQL 交互式查詢引擎
支持多種數(shù)據(jù)源

適合 PB 級海量數(shù)據(jù)的復(fù)雜分析,以及跨數(shù)據(jù)源的查詢

組件版本:Spark (3.1.1)
專屬節(jié)點:
現(xiàn)有 ACK 集群,share 部分節(jié)點給到 EMR

新建 ACK 集群,可選擇整個集群為專屬節(jié)點

OSS Bucket:用于存儲作業(yè)、日志、jar 包等信息

集群管理

集群 ID/名稱:點擊進(jìn)入作業(yè)管理

集群狀態(tài):檢測集群是否可用
所屬 ACK 集群:可關(guān)聯(lián)到現(xiàn)有 ACK 集群
配置:Spark 作業(yè)配置
釋放:釋放空間

 

責(zé)任編輯:梁菲 來源: 阿里云云棲號
相關(guān)推薦

2013-06-06 13:35:33

Google Maps

2015-08-24 14:37:01

ALEIYE 2.0實時大數(shù)據(jù)RET功能

2021-04-26 18:12:50

戴爾

2021-06-08 09:45:46

大數(shù)據(jù)云原生EMR Spark o

2016-10-25 18:18:03

京東云數(shù)加大數(shù)據(jù)

2017-11-29 10:34:38

2020-05-06 13:47:56

IBM存儲IBM多云

2020-03-21 14:46:47

數(shù)據(jù)倉庫架構(gòu)數(shù)據(jù)平臺

2022-02-14 06:24:30

網(wǎng)絡(luò)安全Fortinet防火墻

2012-11-22 14:01:11

IBM企業(yè)

2014-01-22 09:20:13

統(tǒng)一威脅管理防火墻UTMFortinet

2010-04-28 13:43:47

思科CleanAir

2018-02-09 16:58:03

華為

2023-08-25 15:13:16

大數(shù)據(jù)云計算

2019-11-25 12:06:35

IBM存儲IBM多云

2013-09-02 17:42:28

大數(shù)據(jù)分析FusionInsig華為

2014-09-22 09:41:17

聯(lián)想ThinkServer云計算
點贊
收藏

51CTO技術(shù)棧公眾號