微服務架構下的分布式數(shù)據(jù)管理
1.1 分布式數(shù)據(jù)管理之痛點
為了確保微服務之間松耦合,每個服務都有自己的數(shù)據(jù)庫, 有的是關系型數(shù)據(jù)庫(SQL),有的是非關系型數(shù)據(jù)庫(NoSQL)。
開發(fā)企業(yè)事務往往牽涉到多個服務,要想做到多個服務數(shù)據(jù)的一致性并非易事,同樣,在多個服務之間進行數(shù)據(jù)查詢也充滿挑戰(zhàn)。
我們以一個在線B2B商店為例,客戶服務 包括了客戶的各種信息,例如可用信用等。
管理訂單,提供訂單服務,則需要驗證某個新訂單與客戶的信用限制沒有沖突。
在單體應用中,訂單服務只需要使用傳統(tǒng)事務交易就可以一次性檢查可用信用和創(chuàng)建訂單。
相反微服務架構下,訂單和客戶表分別是相應服務的私有表,如下圖所示:
訂單服務不能直接訪問客戶表,只能通過客戶服務發(fā)布的API來訪問或者使用分布式事務, 也就是眾所周知的兩階段提交 (2PC)來訪問客戶表,2PC意義圖如下所示:
這里存在兩個挑戰(zhàn),***個挑戰(zhàn)是2PC除要求數(shù)據(jù)庫本身支持外,還要求服務的數(shù)據(jù)庫類型需要保持一致。
但是現(xiàn)在的微服務架構中,每個服務的數(shù)據(jù)庫類型可能是不一樣的,有的可能是MySQL數(shù)據(jù)庫,有的也可能是NoSQL數(shù)據(jù)庫;
第二個挑戰(zhàn)是如何實現(xiàn)從多個服務中查詢數(shù)據(jù)。假設應用程序需要顯示一個客戶和他最近的訂單。如果訂單服務提供用于檢索客戶訂單的API,那么應用程序端可以通過JOIN方式來檢索此數(shù)據(jù),即應用程序***從客戶服務檢索客戶,并從訂單服務檢索客戶的訂單。
然而,如果訂單服務僅支持通過其主鍵查找訂單(也許它使用僅支持基于主鍵的檢索的NoSQL數(shù)據(jù)庫), 在這種情況下,就沒有方法來檢索查詢所需的數(shù)據(jù)。
為解決這兩大痛點,就需要我們使用到分步式數(shù)據(jù)管理了。
1.2 分布式數(shù)據(jù)管理之舉措
在介紹分布式數(shù)據(jù)管理(CRUD)解決方案之前,有必要介紹下CAP原理和最終一致性相關概念。
1.2.1 CAP原理和最終一致性
1.2.1.1 CAP原理(CAP Theorem)
在足球比賽里,一個球員在一場比賽中進三個球,稱之為帽子戲法(Hat-trick)。在分布式數(shù)據(jù)系統(tǒng)中,也有一個帽子原理(CAP Theorem),不過此帽子非彼帽子。CAP原理中,有三個要素:
1)一致性(C onsistency)
2)可用性(A vailability)
3)分區(qū)容忍性(P artition tolerance)
CAP原理指的是,這三個要素最多只能同時實現(xiàn)兩點,不可能三者兼顧。
因此在進行分布式架構設計時,必須做出取舍。而對于分布式數(shù)據(jù)系統(tǒng),分區(qū)容忍性是基本要求 ,否則就失去了價值,因此設計分布式數(shù)據(jù)系統(tǒng),就是在一致性和可用性之間取一個平衡。
對于大多數(shù)web應 用,其實并不需要強一致性,因此犧牲一致性而換取高可用性,是目前多數(shù)分布式數(shù)據(jù)庫產(chǎn)品的方向。
當然,犧牲一致性,并不是完全不管數(shù)據(jù)的一致性,否則數(shù)據(jù)是混亂的,那么系統(tǒng)可用性再高分布式再好也沒有了價值。
犧牲一致性,只是不再要求關系型數(shù) 據(jù)庫中的強一致性,而是只要系統(tǒng)能達到最終一致性即可,考慮到客戶體驗,這個最終一致的時間窗口,要盡可能的對用戶透明,也就是需要保障“用戶感知到的一致性”。
通常是通過數(shù)據(jù)的多份異步復制來實現(xiàn)系統(tǒng)的高可用和數(shù)據(jù)的最終一致性的,“用戶感知到的一致性”的時間窗口則 取決于數(shù)據(jù)復制到一致狀態(tài)的時間。
1.2.1.2 最終一致性(eventually consistent)
對于一致性,可以分為從客戶端和服務端兩個不同的視角。
從客戶端來看,一致性主要指的是多并發(fā)訪問時更新過的數(shù)據(jù)如何獲取的問題。
從服務端來看,則是更新如何復制分布到整個系統(tǒng),以保證數(shù)據(jù)最終一致。
一致性是因為有并發(fā)讀寫才有的問題,因此在理解一致性的問題時,一定要注意結合考慮并發(fā)讀寫的場景。
從客戶端角度,多進程并發(fā)訪問時,更新過的數(shù)據(jù)在不同進程如何獲取的不同策略,決定了不同的一致性。
對于關系型數(shù)據(jù)庫,要求更新過的數(shù)據(jù)能被后續(xù)的 訪問都能看到,這是強一致性 ;如果能容忍后續(xù)的部分或者全部訪問不到,則是弱一致性 ; 如果經(jīng)過一段時間后要求能訪問到更新后的數(shù)據(jù),則是最終一致性。
從服務端角度,如何盡快將更新后的數(shù)據(jù)分布到整個系統(tǒng),降低達到最終一致性的時間窗口,是提高系統(tǒng)的可用度和用戶體驗非常重要的方面。
那么問題來了,如何實現(xiàn)數(shù)據(jù)的最終一致性呢?答案就在事件驅動架構。
1.2.2 事件驅動架構簡介
Chris Richardson作為微服務架構設計領域的權威,給出了分布式數(shù)據(jù)管理的***解決方案。
對于大多數(shù)應用而言,要實現(xiàn)微服務的分布式數(shù)據(jù)管理,需要采用事件驅動架構(event-driven architecture)。
在事件驅動架構中,當某件重要事情發(fā)生時,微服務會發(fā)布一個事件,例如更新一個業(yè)務實體。
當訂閱這些事件的微服務接收此事件時,就可以更新自己的業(yè)務實體,也可能會引發(fā)更多的事件發(fā)布,讓其他相關服務進行數(shù)據(jù)更新,最終實現(xiàn)分布式數(shù)據(jù)最終一致性。
可以使用事件來實現(xiàn)跨多服務的業(yè)務交易。交易一般由一系列步驟構成,每一步驟都由一個更新業(yè)務實體的微服務和發(fā)布激活下一步驟的事件構成。
1.2.2.1 事件驅動示例1
下圖展現(xiàn)如何使用事件驅動方法,在創(chuàng)建訂單時檢查信用可用度,微服務之間通過消息代理(Messsage Broker)來交換事件。
1. 訂單服務創(chuàng)建一個帶有NEW狀態(tài)的Order (訂單),發(fā)布了一個“Order Created Event(創(chuàng)建訂單)”的事件。
2. 客戶服務 消費Order Created Event事件,為此訂單預留信用,發(fā)布“Credit Reserved Event(信用預留)”事件。
3. 訂單服務消費Credit Reserved Event,改變訂單的狀態(tài)為OPEN。
1.2.2.2 事件驅動示例2
下圖展現(xiàn)如何使用事件驅動方法,在創(chuàng)建訂單時觸發(fā)支付業(yè)務的數(shù)據(jù)更新,微服務之間通過消息代理(Messsage Broker)來交換事件。
1. 訂單服務創(chuàng)建一個待支付的訂單,發(fā)布一個“創(chuàng)建訂單”的事件。
2. 支付服務消費“創(chuàng)建訂單”事件,支付完成后發(fā)布一個“支付完成”事件。
3. 訂單服務消費“支付完成”事件,訂單狀態(tài)更新為待出庫。
1.2.3 事件驅動架構之分布式數(shù)據(jù)更新
上節(jié)通過示例概要介紹了通過事件驅動方式,實現(xiàn)了分布式數(shù)據(jù)最終一致性保證。縱觀微服務架構下的事件驅動業(yè)務處理邏輯,其核心要點在于,可靠的事件投遞和避免事件的重復消費。
可靠事件投遞有以下兩個特性:
1) 每個服務原子性的完成業(yè)務操作和發(fā)布事件;
2) 消息代理確保事件投遞至少一次(at least once);
而避免事件重復消費則要求消費事件的服務實現(xiàn)冪等性,比如支付服務不能因為重復收到事件而多次支付。
BTW:當前流行的消息隊列如Kafka等,都已經(jīng)實現(xiàn)了事件的持久化和at least once的投遞模式,所以可靠事件投遞的第二條特性已經(jīng)滿足,這里就不展開。接下來章節(jié)講重點講述如何實現(xiàn)可靠事件投遞的***條特性和避免事件重復消費,即服務的業(yè)務操作和發(fā)布事件的原子性和避免消費者重復消費事件要求服務實現(xiàn)冪等性。
1.2.3.1 如何實現(xiàn)事件投遞操作原子性?
事件驅動架構會碰到數(shù)據(jù)庫更新和發(fā)布事件原子性問題。例如,訂單服務必須向ORDER表插入一行,然后發(fā)布Order Created event,這兩個操作需要原子性。比如更新數(shù)據(jù)庫后,服務癱了(crashes)造成事件未能發(fā)布,系統(tǒng)變成不一致狀態(tài)。那么如何實現(xiàn)服務的業(yè)務操作和發(fā)布事件的原子性呢?
1.2.3.1.1 使用本地事務發(fā)布事件
獲得原子性的一個方法是將服務的業(yè)務操作和發(fā)布事件放在一個本地數(shù)據(jù)庫事務里,也就是說,需要在本地建立一個EVENT表,此表在存儲業(yè)務實體數(shù)據(jù)庫中起到消息列表功能。當應用發(fā)起一個(本地)數(shù)據(jù)庫交易,更新業(yè)務實體狀態(tài)時,會向EVENT表中插入一個事件,然后提交此次交易。另外一個獨立應用進程或者線程查詢此EVENT表,向消息代理發(fā)布事件,然后使用本地交易標志此事件為已發(fā)布,如下圖所示:
訂單服務向ORDER表插入一行,然后向EVENT表中插入Order Created event,事件發(fā)布線程或者進程查詢EVENT表,請求未發(fā)布事件,發(fā)布他們,然后更新EVENT表標志此事件為已發(fā)布。
此方法也是優(yōu)缺點都有。優(yōu)點是可以確保事件發(fā)布不依賴于2PC,應用發(fā)布業(yè)務層級事件而不需要推斷他們發(fā)生了什么;而缺點在于此方法由于開發(fā)人員必須牢記發(fā)布事件,因此有可能出現(xiàn)錯誤。
1.2.3.1.2 使用事件源
Event sourcing (事件源)通過使用以事件中心的數(shù)據(jù)存儲方式來保證業(yè)務實體的一致性。事件源保存了每個業(yè)務實體所有狀態(tài)變化的事件,而不是存儲實體當前的狀態(tài)。應用可以通過重放事件來重建實體現(xiàn)在的狀態(tài)。只要業(yè)務實體發(fā)生變化,新事件就會添加到事件表中。因為保存事件是單一操作,因此肯定是原子性的。
為了理解事件源工作方式,考慮以事件實體作為一個例子說明。傳統(tǒng)方式中,每個訂單映射為ORDER表中一行。但是對于事件源方式,訂單服務以事件狀態(tài)改變方式存儲一個訂單:創(chuàng)建的,已批準的,已發(fā)貨的,取消的;每個事件包括足夠信息來重建訂單的狀態(tài)。
事件源方法有很多優(yōu)點:解決了事件驅動架構關鍵問題,使得業(yè)務實體更新和事件發(fā)布原子化,但是也存在缺點,因為是持久化事件而不是對象,導致數(shù)據(jù)查詢時,必須使用 Command Query Responsibility Segregation (CQRS) 來完成查詢業(yè)務,從開發(fā)角度看,存在一定挑戰(zhàn)。
1.2.3.2 如何避免事件重復消費?
要避免事件重復消費,需要消費事件的服務實現(xiàn)服務冪等,因為存在重試和錯誤補償機制,不可避免的在系統(tǒng)中存在重復收到消息的場景,服務冪等能提高數(shù)據(jù)的一致性。在編程中,一個冪等操作的特點是其任意多次執(zhí)行所產(chǎn)生的影響均與一次執(zhí)行的影響相同,因此需要開發(fā)人員在功能設計實現(xiàn)時,需要特別注意服務的冪等性。
1.2.4 事件驅動架構之分布式數(shù)據(jù)查詢
微服務架構下,由于分布式數(shù)據(jù)庫的存在,導致在執(zhí)行用戶業(yè)務數(shù)據(jù)查詢時,通常需要跨多個微服務數(shù)據(jù)庫進行數(shù)據(jù)查詢,也就是分布式數(shù)據(jù)查詢。那么問題來了,由于每個微服務的數(shù)據(jù)都是私有化的,只能通過各自的REST接口獲取,如果負責業(yè)務查詢的功能模塊,通過調(diào)用各個微服務的REST接口來分別獲取基礎數(shù)據(jù),然后在內(nèi)存中再進行業(yè)務數(shù)據(jù)拼裝后,再返回給用戶。該方法無論從程序設計或是查詢性能角度看,都不是一個很好的方法。那么如何解決微服務架構下的分布式數(shù)據(jù)查詢問題呢? 在給出解決方案之前,需要讀者首先了解下物化視圖和命令查詢職責分離等相關概念。
1.2.4.1 什么是物化視圖(merialized views)?
物化視圖是包括一個查詢結果的數(shù)據(jù)庫對像,它是遠程數(shù)據(jù)的的本地副本,或者用來生成基于數(shù)據(jù)表求和的匯總表。物化視圖存儲基于遠程表的數(shù)據(jù),也可以稱為快照。這個基本上就說出了物化視圖的本質(zhì),它是一組查詢的結果,這樣勢必為將來再次需要這組數(shù)據(jù)時大大提高查詢性能。物化視圖有兩種刷新模式ON DEMAND和ON COMMIT,用戶可根據(jù)實際情況進行設置。
物化視圖對于應用層是透明的,不需要有任何的改動,終端用戶甚至都感覺不到底層是用的物化視圖??傊?,使用物化視圖的目的一個是提高查詢性能,另一個是由于物化視圖包含的數(shù)據(jù)是遠程數(shù)據(jù)庫的數(shù)據(jù)快照或拷貝,微服務可通過物化視圖和命令查詢職責分離(CQRS)技術(參見以下章節(jié))實現(xiàn)分布式數(shù)據(jù)查詢。
1.2.4.2 什么是命令查詢職責分離(CQRS)?
在常用的單體應用架構中,通常都是通過數(shù)據(jù)訪問層來修改或者查詢數(shù)據(jù),一般修改和查詢使用的是相同的實體。在一些業(yè)務邏輯簡單的系統(tǒng)中可能沒有什么問題,但是隨著系統(tǒng)邏輯變得復雜,用戶增多,這種設計就會出現(xiàn)一些性能問題;另外更重要的是,在微服務架構下,通常需要跨多個微服務數(shù)據(jù)庫來查詢數(shù)據(jù),此時,我們可借助命令查詢職責分離(CQRS)來有效解決這些問題。
CQRS使用分離的接口將數(shù)據(jù)查詢操作(Queries)和數(shù)據(jù)修改操作(Commands)分離開來,這也意味著在查詢和更新過程中使用的數(shù)據(jù)模型也是不一樣的。這樣讀和寫邏輯就隔離開來了。使用CQRS分離了讀寫職責之后,可以對數(shù)據(jù)進行讀寫分離操作來改進性能,同時提高可擴展性和安全。如下圖:
主數(shù)據(jù)庫處理CUD,從庫處理R,從庫的的結構可以和主庫的結構完全一樣,也可以不一樣,從庫主要用來進行只讀的查詢操作。在數(shù)量上從庫的個數(shù)也可以根據(jù)查詢的規(guī)模進行擴展,在業(yè)務邏輯上,也可以根據(jù)專題從主庫中劃分出不同的從庫。從庫也可以實現(xiàn)成ReportingDatabase,根據(jù)查詢的業(yè)務需求,從主庫中抽取一些必要的數(shù)據(jù)生成一系列查詢報表來存儲。
使用ReportingDatabase的一些優(yōu)點通??梢允沟貌樵冏兊酶雍唵胃咝В?/p>
· ReportingDatabase的結構和數(shù)據(jù)表會針對常用的查詢請求進行設計。
· ReportingDatabase數(shù)據(jù)庫通常會去正規(guī)化,存儲一些冗余而減少必要的Join等聯(lián)合查詢操作,使得查詢簡化和高效,一些在主數(shù)據(jù)庫中用不到的數(shù)據(jù)信息,在ReportingDatabase可以不用存儲。
· 可以對ReportingDatabase重構優(yōu)化,而不用去改變操作數(shù)據(jù)庫。
· 對ReportingDatabase數(shù)據(jù)庫的查詢不會給操作數(shù)據(jù)庫帶來任何壓力。
· 可以針對不同的查詢請求建立不同的ReportingDatabase庫。
1.2.4.3 如何實現(xiàn)事件驅動架構下的數(shù)據(jù)查詢服務?
事件驅動不僅可以用于分布式數(shù)據(jù)一致性保證,還可以借助物化視圖和命令查詢職責分離技術,使用事件來維護不同微服務擁有數(shù)據(jù)預連接(pre-join)的物化視圖,從而實現(xiàn)微服務架構下的分布式數(shù)據(jù)查詢。維護物化視圖的服務訂閱了相關事件并在事件發(fā)生時更新物化視圖。例如,客戶訂單視圖更新服務(維護客戶訂單視圖)會訂閱由客戶服務和訂單服務發(fā)布的事件(您還可以使用事件來維護由多個微服務擁有的數(shù)據(jù)組成的物化視圖。
例如上圖中間的 “客戶訂單視圖更新”服務,主要負責客戶訂單視圖的更新。該服務訂閱了客戶服務和訂單服務發(fā)布的事件。當“客戶訂單視圖更新”服務收到了上圖左側的客戶或者訂單更新事件,則會觸發(fā)更新客戶訂單物化視圖數(shù)據(jù)集。這里可以使用文檔數(shù)據(jù)庫(例如MongoDB)來實現(xiàn)客戶訂單視圖,為每個用戶存儲一個文檔。而上圖右側的客戶訂單視圖查詢服務負責響應對客戶以及最近訂單(通過查詢客戶訂單視圖數(shù)據(jù)集)的查詢。
總之,上圖所示業(yè)務邏輯,用到了事件驅動、物化視圖和命令查詢職責分離等技術,有效解決了微服務架構下分布式數(shù)據(jù)查詢的問題。
1.2.5 事件驅動架構優(yōu)缺點
事件驅動架構既有優(yōu)點也有缺點,此架構可以實現(xiàn)跨多個服務的事務實現(xiàn),且提供最終數(shù)據(jù)一致性,并且使得服務能夠自動維護查詢視圖;而缺點在于編程模式比傳統(tǒng)基于事務的交易模式更加復雜,必須實現(xiàn)補償事務以便從應用程序級故障中恢復,例如,如果信用檢查不成功則必須取消訂單;另外,應用必須應對不一致的數(shù)據(jù),比如當應用讀取未更新的最終視圖時也會遇見數(shù)據(jù)不一致問題。另外一個缺點在于訂閱者必須檢測和忽略冗余事件,避免事件重復消費。
1.3 總結
在微服務架構中,每個微服務都有自己私有的數(shù)據(jù)集。不同微服務可能使用不同的SQL或者NoSQL數(shù)據(jù)庫。盡管數(shù)據(jù)庫架構有很強的優(yōu)勢,但是也面對數(shù)據(jù)分布式管理的挑戰(zhàn)。***個挑戰(zhàn)就是如何在多服務之間維護業(yè)務數(shù)據(jù)一致性;第二個挑戰(zhàn)是如何從多服務環(huán)境中獲取一致性數(shù)據(jù)。
***解決辦法是采用事件驅動架構。其中碰到的一個挑戰(zhàn)是如何原子性的更新狀態(tài)和發(fā)布事件。有幾種方法可以解決此問題,包括將數(shù)據(jù)庫視為消息隊列和事件源等。
從目前技術應用范圍和成熟度看,推薦使用***種方式(本地事務發(fā)布事件),來實現(xiàn)事件投遞原子化,即可靠事件投遞。
需要提醒:!!!數(shù)據(jù)一致性是微服務架構設計中唯恐避之不及卻又不得不考慮的話題。通過保證事件驅動實現(xiàn)最終數(shù)據(jù)的一致性,此方案的優(yōu)劣,也不能簡單的一言而概之,而是應該根據(jù)場景定奪,適合的才是***的。另外,我們在對微服務進行業(yè)務劃分的時候就盡可能的避免“可能會產(chǎn)生一致性問題”的設計。如果這種設計過多,也許是時候考慮改改設計了。








































