偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

^{<blockquote id="gui1t"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

美團點評基于 Flink 的實時數(shù)倉建設實踐

作者：黃偉倫徐陽喻燦劉強 2018-10-19 14:16:09

大數(shù)據(jù)

近些年，企業(yè)對數(shù)據(jù)服務實時化服務的需求日益增多。本文整理了常見實時數(shù)據(jù)組件的性能特點和適用場景，介紹了美團如何通過 Flink 引擎構建實時數(shù)據(jù)倉庫，從而提供高效、穩(wěn)健的實時數(shù)據(jù)服務。本文主要闡述使用 Flink 在實際數(shù)據(jù)生產上的經驗。

引言

近些年，企業(yè)對數(shù)據(jù)服務實時化服務的需求日益增多。本文整理了常見實時數(shù)據(jù)組件的性能特點和適用場景，介紹了美團如何通過 Flink 引擎構建實時數(shù)據(jù)倉庫，從而提供高效、穩(wěn)健的實時數(shù)據(jù)服務。本文主要闡述使用 Flink 在實際數(shù)據(jù)生產上的經驗。

實時平臺初期架構

在實時數(shù)據(jù)系統(tǒng)建設初期，由于對實時數(shù)據(jù)的需求較少，形成不了完整的數(shù)據(jù)體系。我們采用的是“一路到底”的開發(fā)模式：通過在實時計算平臺上部署 Storm 作業(yè)處理實時數(shù)據(jù)隊列來提取數(shù)據(jù)指標，直接推送到實時應用服務中。

圖1 初期實時數(shù)據(jù)架構

但是，隨著產品和業(yè)務人員對實時數(shù)據(jù)需求的不斷增多，新的挑戰(zhàn)也隨之發(fā)生。

數(shù)據(jù)指標越來越多，“煙囪式”的開發(fā)導致代碼耦合問題嚴重。
需求越來越多，有的需要明細數(shù)據(jù)，有的需要 OLAP 分析。單一的開發(fā)模式難以應付多種需求。
缺少完善的監(jiān)控系統(tǒng)，無法在對業(yè)務產生影響之前發(fā)現(xiàn)并修復問題。

實時數(shù)據(jù)倉庫的構建

為解決以上問題，我們根據(jù)生產離線數(shù)據(jù)的經驗，選擇使用分層設計方案來建設實時數(shù)據(jù)倉庫，其分層架構如下圖所示：

圖2 實時數(shù)倉數(shù)據(jù)分層架構

該方案由以下四層構成：

ODS 層：Binlog 和流量日志以及各業(yè)務實時隊列。
數(shù)據(jù)明細層：業(yè)務領域整合提取事實數(shù)據(jù)，離線全量和實時變化數(shù)據(jù)構建實時維度數(shù)據(jù)。
數(shù)據(jù)匯總層：使用寬表模型對明細數(shù)據(jù)補充維度數(shù)據(jù)，對共性指標進行匯總。
App 層：為了具體需求而構建的應用層，通過 RPC 框架對外提供服務。

通過多層設計我們可以將處理數(shù)據(jù)的流程沉淀在各層完成。比如在數(shù)據(jù)明細層統(tǒng)一完成數(shù)據(jù)的過濾、清洗、規(guī)范、脫敏流程;在數(shù)據(jù)匯總層加工共性的多維指標匯總數(shù)據(jù)。提高了代碼的復用率和整體生產效率。同時各層級處理的任務類型相似，可以采用統(tǒng)一的技術方案優(yōu)化性能，使數(shù)倉技術架構更簡潔。

技術選型

1.存儲引擎的調研

實時數(shù)倉在設計中不同于離線數(shù)倉在各層級使用同種儲存方案，比如都存儲在 Hive 、DB 中的策略。首先對中間過程的表，采用將結構化的數(shù)據(jù)通過消息隊列存儲和高速 KV 存儲混合的方案。實時計算引擎可以通過監(jiān)聽消息消費消息隊列內的數(shù)據(jù)，進行實時計算。而在高速 KV 存儲上的數(shù)據(jù)則可以用于快速關聯(lián)計算，比如維度數(shù)據(jù)。其次在應用層上，針對數(shù)據(jù)使用特點配置存儲方案直接寫入。避免了離線數(shù)倉應用層同步數(shù)據(jù)流程帶來的處理延遲。為了解決不同類型的實時數(shù)據(jù)需求，合理的設計各層級存儲方案，我們調研了美團內部使用比較廣泛的幾種存儲方案。

表1 存儲方案列表

根據(jù)不同業(yè)務場景，實時數(shù)倉各個模型層次使用的存儲方案大致如下：

圖3 實時數(shù)倉存儲分層架構

數(shù)據(jù)明細層 對于維度數(shù)據(jù)部分場景下關聯(lián)的頻率可達 10w+ TPS，我們選擇 Cellar(美團內部存儲系統(tǒng)) 作為存儲，封裝維度服務為實時數(shù)倉提供維度數(shù)據(jù)。
數(shù)據(jù)匯總層 對于通用的匯總指標，需要進行歷史數(shù)據(jù)關聯(lián)的數(shù)據(jù)，采用和維度數(shù)據(jù)一樣的方案通過 Cellar 作為存儲，用服務的方式進行關聯(lián)操作。
數(shù)據(jù)應用層 應用層設計相對復雜，再對比了幾種不同存儲方案后。我們制定了以數(shù)據(jù)讀寫頻率 1000 QPS 為分界的判斷依據(jù)。對于讀寫平均頻率高于 1000 QPS 但查詢不太復雜的實時應用，比如商戶實時的經營數(shù)據(jù)。采用 Cellar 為存儲，提供實時數(shù)據(jù)服務。對于一些查詢復雜的和需要明細列表的應用，使用 Elasticsearch 作為存儲則更為合適。而一些查詢頻率低，比如一些內部運營的數(shù)據(jù)。 Druid 通過實時處理消息構建索引，并通過預聚合可以快速的提供實時數(shù)據(jù) OLAP 分析功能。對于一些歷史版本的數(shù)據(jù)產品進行實時化改造時，也可以使用 MySQL 存儲便于產品迭代。

2.計算引擎的調研

在實時平臺建設初期我們使用 Storm 引擎來進行實時數(shù)據(jù)處理。Storm 引擎雖然在靈活性和性能上都表現(xiàn)不錯。但是由于 API 過于底層，在數(shù)據(jù)開發(fā)過程中需要對一些常用的數(shù)據(jù)操作進行功能實現(xiàn)。比如表關聯(lián)、聚合等，產生了很多額外的開發(fā)工作，不僅引入了很多外部依賴比如緩存，而且實際使用時性能也不是很理想。同時 Storm 內的數(shù)據(jù)對象 Tuple 支持的功能也很簡單，通常需要將其轉換為 Java 對象來處理。對于這種基于代碼定義的數(shù)據(jù)模型，通常我們只能通過文檔來進行維護。不僅需要額外的維護工作，同時在增改字段時也很麻煩。綜合來看使用 Storm 引擎構建實時數(shù)倉難度較大。我們需要一個新的實時處理方案，要能夠實現(xiàn)：

提供高級 API，支持常見的數(shù)據(jù)操作比如關聯(lián)聚合，***是能支持 SQL。
具有狀態(tài)管理和自動支持久化方案，減少對存儲的依賴。
便于接入元數(shù)據(jù)服務，避免通過代碼管理數(shù)據(jù)結構。
處理性能至少要和 Storm 一致。

我們對主要的實時計算引擎進行了技術調研?？偨Y了各類引擎特性如下表所示：

表2 實時計算方案列表

從調研結果來看，F(xiàn)link 和 Spark Streaming 的 API 、容錯機制與狀態(tài)持久化機制都可以解決一部分我們目前使用 Storm 中遇到的問題。但 Flink 在數(shù)據(jù)延遲上和 Storm 更接近，對現(xiàn)有應用影響最小。而且在公司內部的測試中 Flink 的吞吐性能對比 Storm 有十倍左右提升。綜合考量我們選定 Flink 引擎作為實時數(shù)倉的開發(fā)引擎。

更加引起我們注意的是，F(xiàn)link 的 Table 抽象和 SQL 支持。雖然使用 Strom 引擎也可以處理結構化數(shù)據(jù)。但畢竟依舊是基于消息的處理 API ，在代碼層層面上不能完全享受操作結構化數(shù)據(jù)的便利。而 Flink 不僅支持了大量常用的 SQL 語句，基本覆蓋了我們的開發(fā)場景。而且 Flink 的 Table 可以通過 TableSchema 進行管理，支持豐富的數(shù)據(jù)類型和數(shù)據(jù)結構以及數(shù)據(jù)源?？梢院苋菀椎暮同F(xiàn)有的元數(shù)據(jù)管理系統(tǒng)或配置管理系統(tǒng)結合。通過下圖我們可以清晰的看出 Storm 和 Flink 在開發(fā)統(tǒng)過程中的區(qū)別。

圖4 Flink - Storm 對比圖

在使用 Storm 開發(fā)時處理邏輯與實現(xiàn)需要固化在 Bolt 的代碼。Flink 則可以通過 SQL 進行開發(fā)，代碼可讀性更高，邏輯的實現(xiàn)由開源框架來保證可靠高效，對特定場景的優(yōu)化只要修改 Flink SQL 優(yōu)化器功能實現(xiàn)即可，而不影響邏輯代碼。使我們可以把更多的精力放到到數(shù)據(jù)開發(fā)中，而不是邏輯的實現(xiàn)。當需要離線數(shù)據(jù)和實時數(shù)據(jù)口徑統(tǒng)一的場景時，我們只需對離線口徑的 SQL 腳本稍加改造即可，極大地提高了開發(fā)效率。同時對比圖中 Flink 和 Storm 使用的數(shù)據(jù)模型，Storm 需要通過一個 Java 的 Class 去定義數(shù)據(jù)結構，F(xiàn)link Table 則可以通過元數(shù)據(jù)來定義。可以很好的和數(shù)據(jù)開發(fā)中的元數(shù)據(jù)，數(shù)據(jù)治理等系統(tǒng)結合，提高開發(fā)效率。

Flink使用心得

在利用 Flink-Table 構建實時數(shù)據(jù)倉庫過程中。我們針對一些構建數(shù)據(jù)倉庫的常用操作，比如數(shù)據(jù)指標的維度擴充，數(shù)據(jù)按主題關聯(lián)，以及數(shù)據(jù)的聚合運算通過 Flink 來實現(xiàn)總結了一些使用心得。

1.維度擴充

數(shù)據(jù)指標的維度擴充，我們采用的是通過維度服務獲取維度信息。雖然基于 Cellar 的維度服務通常的響應延遲可以在 1ms 以下。但是為了進一步優(yōu)化 Flink 的吞吐，我們對維度數(shù)據(jù)的關聯(lián)全部采用了異步接口訪問的方式，避免了使用 RPC 調用影響數(shù)據(jù)吞吐。

對于一些數(shù)據(jù)量很大的流，比如流量日志數(shù)據(jù)量在 10W 條/秒這個量級。在關聯(lián) UDF 的時候內置了緩存機制，可以根據(jù)***率和時間對緩存進行淘汰，配合用關聯(lián)的 Key 值進行分區(qū)，顯著減少了對外部服務的請求次數(shù)，有效的減少了處理延遲和對外部系統(tǒng)的壓力。

2.數(shù)據(jù)關聯(lián)

數(shù)據(jù)主題合并，本質上就是多個數(shù)據(jù)源的關聯(lián)，簡單的來說就是 Join 操作。Flink 的 Table 是建立在***流這個概念上的。在進行 Join 操作時并不能像離線數(shù)據(jù)一樣對兩個完整的表進行關聯(lián)。采用的是在窗口時間內對數(shù)據(jù)進行關聯(lián)的方案，相當于從兩個數(shù)據(jù)流中各自截取一段時間的數(shù)據(jù)進行 Join 操作。有點類似于離線數(shù)據(jù)通過限制分區(qū)來進行關聯(lián)。同時需要注意 Flink 關聯(lián)表時必須有至少一個“等于”關聯(lián)條件，因為等號兩邊的值會用來分組。

由于 Flink 會緩存窗口內的全部數(shù)據(jù)來進行關聯(lián)，緩存的數(shù)據(jù)量和關聯(lián)的窗口大小成正比。因此 Flink 的關聯(lián)查詢，更適合處理一些可以通過業(yè)務規(guī)則限制關聯(lián)數(shù)據(jù)時間范圍的場景。比如關聯(lián)下單用戶購買之前 30 分鐘內的瀏覽日志。過大的窗口不僅會消耗更多的內存，同時會產生更大的 Checkpoint ，導致吞吐下降或 Checkpoint 超時。在實際生產中可以使用 RocksDB 和啟用增量保存點模式，減少 Checkpoint 過程對吞吐產生影響。對于一些需要關聯(lián)窗口期很長的場景，比如關聯(lián)的數(shù)據(jù)可能是幾天以前的數(shù)據(jù)。對于這些歷史數(shù)據(jù)，我們可以將其理解為是一種已經固定不變的"維度"?？梢詫⑿枰魂P聯(lián)的歷史數(shù)據(jù)采用和維度數(shù)據(jù)一致的處理方法："緩存 + 離線"數(shù)據(jù)方式存儲，用接口的方式進行關聯(lián)。另外需要注意 Flink 對多表關聯(lián)是直接順序鏈接的，因此需要注意先進行結果集小的關聯(lián)。

3.聚合運算

使用聚合運算時，F(xiàn)link 對常見的聚合運算如求和、極值、均值等都有支持。美中不足的是對于 Distinct 的支持，F(xiàn)link-1.6 之前的采用的方案是通過先對去重字段進行分組再聚合實現(xiàn)。對于需要對多個字段去重聚合的場景，只能分別計算再進行關聯(lián)處理效率很低。為此我們開發(fā)了自定義的 UDAF，實現(xiàn)了 MapView 精確去重、BloomFilter 非精確去重、 HyperLogLog 超低內存去重方案應對各種實時去重場景。但是在使用自定義的 UDAF 時，需要注意 RocksDBStateBackend 模式對于較大的 Key 進行更新操作時序列化和反序列化耗時很多?？梢钥紤]使用 FsStateBackend 模式替代。另外要注意的一點 Flink 框架在計算比如 Rank 這樣的分析函數(shù)時，需要緩存每個分組窗口下的全部數(shù)據(jù)才能進行排序，會消耗大量內存。建議在這種場景下優(yōu)先轉換為 TopN 的邏輯，看是否可以解決需求。

下圖展示一個完整的使用 Flink 引擎生產一張實時數(shù)據(jù)表的過程：

圖5 實時計算流程圖

實時數(shù)倉成果

通過使用實時數(shù)倉代替原有流程，我們將數(shù)據(jù)生產中的各個流程抽象到實時數(shù)倉的各層當中。實現(xiàn)了全部實時數(shù)據(jù)應用的數(shù)據(jù)源統(tǒng)一，保證了應用數(shù)據(jù)指標、維度的口徑的一致。在幾次數(shù)據(jù)口徑發(fā)生修改的場景中，我們通過對倉庫明細和匯總進行改造，在完全不用修改應用代碼的情況下就完成全部應用的口徑切換。在開發(fā)過程中通過嚴格的把控數(shù)據(jù)分層、主題域劃分、內容組織標準規(guī)范和命名規(guī)則。使數(shù)據(jù)開發(fā)的鏈路更為清晰，減少了代碼的耦合。再配合上使用 Flink SQL 進行開發(fā)，代碼加簡潔。單個作業(yè)的代碼量從平均 300+ 行的 JAVA 代碼，縮減到幾十行的 SQL 腳本。項目的開發(fā)時長也大幅減短，一人日開發(fā)多個實時數(shù)據(jù)指標情況也不少見。

除此以外我們通過針對數(shù)倉各層級工作內容的不同特點，可以進行針對性的性能優(yōu)化和參數(shù)配置。比如 ODS 層主要進行數(shù)據(jù)的解析、過濾等操作，不需要 RPC 調用和聚合運算。我們針對數(shù)據(jù)解析過程進行優(yōu)化，減少不必要的 JSON 字段解析，并使用更高效的 JSON 包。在資源分配上，單個 CPU 只配置 1GB 的內存即可滿需求。而匯總層主要則主要進行聚合與關聯(lián)運算，可以通過優(yōu)化聚合算法、內外存共同運算來提高性能、減少成本。資源配置上也會分配更多的內存，避免內存溢出。通過這些優(yōu)化手段，雖然相比原有流程實時數(shù)倉的生產鏈路更長，但數(shù)據(jù)延遲并沒有明顯增加。同時實時數(shù)據(jù)應用所使用的計算資源也有明顯減少。

展望

我們的目標是將實時倉庫建設成可以和離線倉庫數(shù)據(jù)準確性，一致性媲美的數(shù)據(jù)系統(tǒng)。為商家，業(yè)務人員以及美團用戶提供及時可靠的數(shù)據(jù)服務。同時作為到餐實時數(shù)據(jù)的統(tǒng)一出口，為集團其他業(yè)務部門助力。未來我們將更加關注在數(shù)據(jù)可靠性和實時數(shù)據(jù)指標管理。建立完善的數(shù)據(jù)監(jiān)控，數(shù)據(jù)血緣檢測，交叉檢查機制。及時對異常數(shù)據(jù)或數(shù)據(jù)延遲進行監(jiān)控和預警。同時優(yōu)化開發(fā)流程，降低開發(fā)實時數(shù)據(jù)學習成本。讓更多有實時數(shù)據(jù)需求的人，可以自己動手解決問題。

責任編輯：未麗燕來源：美團技術團隊

Flink 數(shù)據(jù)倉庫數(shù)據(jù)系統(tǒng)

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

^{<ruby id="g5bfh"></ruby>}