session一致性架構(gòu)設(shè)計實踐
一、緣起
1. 什么是session?
服務器為每個用戶創(chuàng)建一個會話,存儲用戶的相關(guān)信息,以便多次請求能夠定位到同一個上下文。
Web開發(fā)中,web-server可以自動為同一個瀏覽器的訪問用戶自動創(chuàng)建session,提供數(shù)據(jù)存儲功能。最常見的,會把用戶的登錄信息、用戶信息存儲在session中,以保持登錄狀態(tài)。
2. 什么是session一致性問題?
只要用戶不重啟瀏覽器,每次http短連接請求,理論上服務端都能定位到session,保持會話。
當只有一臺web-server提供服務時,每次http短連接請求,都能夠正確路由到存儲session的對應web-server(廢話,因為只有一臺)。
此時的web-server是無法保證高可用的,采用“冗余+故障轉(zhuǎn)移”的多臺web-server來保證高可用時,每次http短連接請求就不一定能路由到正確的session了。
如上圖,假設(shè)用戶包含登錄信息的session都記錄在第一臺web-server上,反向代理如果將請求路由到另一臺web-server上,可能就找不到相關(guān)信息,而導致用戶需要重新登錄。
在web-server高可用時,如何保證session路由的一致性,是今天將要討論的問題。
二、session同步法
思路:多個web-server之間相互同步session,這樣每個web-server之間都包含全部的session
優(yōu)點:web-server支持的功能,應用程序不需要修改代碼
不足:
- session的同步需要數(shù)據(jù)傳輸,占內(nèi)網(wǎng)帶寬,有時延
- 所有web-server都包含所有session數(shù)據(jù),數(shù)據(jù)量受內(nèi)存限制,無法水平擴展
- 有更多web-server時要歇菜
三、客戶端存儲法
思路:服務端存儲所有用戶的session,內(nèi)存占用較大,可以將session存儲到瀏覽器cookie中,每個端只要存儲一個用戶的數(shù)據(jù)了
優(yōu)點:服務端不需要存儲
缺點:
- 每次http請求都攜帶session,占外網(wǎng)帶寬
- 數(shù)據(jù)存儲在端上,并在網(wǎng)絡傳輸,存在泄漏、篡改、竊取等安全隱患
- session存儲的數(shù)據(jù)大小受cookie限制
“端存儲”的方案雖然不常用,但確實是一種思路。
三、反向代理hash一致性
思路:web-server為了保證高可用,有多臺冗余,反向代理層能不能做一些事情,讓同一個用戶的請求保證落在一臺web-server上呢?
方案一:四層代理hash
反向代理層使用用戶ip來做hash,以保證同一個ip的請求落在同一個web-server上
方案二:七層代理hash
反向代理使用http協(xié)議中的某些業(yè)務屬性來做hash,例如sid,city_id,user_id等,能夠更加靈活的實施hash策略,以保證同一個瀏覽器用戶的請求落在同一個web-server上
優(yōu)點:
- 只需要改nginx配置,不需要修改應用代碼
- 負載均衡,只要hash屬性是均勻的,多臺web-server的負載是均衡的
- 可以支持web-server水平擴展(session同步法是不行的,受內(nèi)存限制)
不足:
- 如果web-server重啟,一部分session會丟失,產(chǎn)生業(yè)務影響,例如部分用戶重新登錄
- 如果web-server水平擴展,rehash后session重新分布,也會有一部分用戶路由不到正確的session
session一般是有有效期的,所有不足中的兩點,可以認為等同于部分session失效,一般問題不大。
對于四層hash還是七層hash,個人推薦前者:讓專業(yè)的軟件做專業(yè)的事情,反向代理就負責轉(zhuǎn)發(fā),盡量不要引入應用層業(yè)務屬性,除非不得不這么做(例如,有時候多機房多活需要按照業(yè)務屬性路由到不同機房的web-server)。
四、后端統(tǒng)一存儲
思路:將session存儲在web-server后端的存儲層,數(shù)據(jù)庫或者緩存
優(yōu)點:
- 沒有安全隱患
- 可以水平擴展,數(shù)據(jù)庫/緩存水平切分即可
- web-server重啟或者擴容都不會有session丟失
不足:增加了一次網(wǎng)絡調(diào)用,并且需要修改應用代碼
對于db存儲還是cache,個人推薦后者:session讀取的頻率會很高,數(shù)據(jù)庫壓力會比較大。如果有session高可用需求,cache可以做高可用,但大部分情況下session可以丟失,一般也不需要考慮高可用。
五、總結(jié)
保證session一致性的架構(gòu)設(shè)計常見方法:
- session同步法:多臺web-server相互同步數(shù)據(jù)
- 客戶端存儲法:一個用戶只存儲自己的數(shù)據(jù)
- 反向代理hash一致性:四層hash和七層hash都可以做,保證一個用戶的請求落在一臺web-server上
- 后端統(tǒng)一存儲:web-server重啟和擴容,session也不會丟失
對于方案3和方案4,個人建議推薦后者:
- web層、service層無狀態(tài)是大規(guī)模分布式系統(tǒng)設(shè)計原則之一,session屬于狀態(tài),不宜放在web層
- 讓專業(yè)的軟件做專業(yè)的事情,web-server存session?還是讓cache去做這樣的事情吧!
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】