王者榮耀高并發(fā)背后的故事
摘要
堪稱中國(guó)最火爆的手機(jī)游戲“王者榮耀”,擁有億級(jí)用戶體量,***日活用戶,如何快速、低成本地保障業(yè)務(wù)突發(fā)?本文從該問題出發(fā),論述了問題對(duì)應(yīng)的解決方案,并對(duì)其效果做出總結(jié)。
背景
“王者榮耀”是一款國(guó)民級(jí)手機(jī)游戲,用戶體量巨大,而且一直保持著較高的更新頻率。這種業(yè)務(wù)場(chǎng)景下,突發(fā)也變得非常頻繁,然而業(yè)務(wù)體驗(yàn)是至關(guān)重要的,使用CDN必不可少。類似地,經(jīng)常有帶寬突發(fā)的場(chǎng)景,比如新聞爆點(diǎn)視頻、大型直播活動(dòng)、熱門影視劇上線、熱門游戲等應(yīng)用發(fā)布。同時(shí),由于家庭帶寬和移動(dòng)網(wǎng)絡(luò)的快速升級(jí),突發(fā)帶寬量級(jí)越來越大,經(jīng)常達(dá)到Tb級(jí),甚至10Tb 。如何快速、低成本地保障業(yè)務(wù)突發(fā),成為CDN的一大挑戰(zhàn)。
2007年,騰訊自建CDN啟用,接入了***個(gè)業(yè)務(wù)騰訊網(wǎng)。到現(xiàn)在CDN帶寬量級(jí),從最早的數(shù)十Gb,發(fā)展到現(xiàn)在的數(shù)十Tb;單業(yè)務(wù)的帶寬也越來越大,大部分業(yè)務(wù)常量帶寬在幾百Gb,部分突發(fā)業(yè)務(wù)達(dá)到了10Tb。網(wǎng)絡(luò)的快速升級(jí),移動(dòng)用戶爆發(fā)式增長(zhǎng),以及視頻類業(yè)務(wù)包括點(diǎn)播和直播的興起,使得業(yè)務(wù)突發(fā)越來越頻繁,突發(fā)帶寬越來越高,對(duì)CDN的要求也越來越高。
自建CDN得益于騰訊業(yè)務(wù)的蓬勃發(fā)展,先后支持了游戲下載、流媒體視頻加速、春節(jié)紅包等騰訊內(nèi)部業(yè)務(wù);2014年騰訊將CDN全面能力開放,成為騰訊云CDN產(chǎn)品,除承載內(nèi)部業(yè)務(wù)外,也開始接入第三方客戶,比如快手點(diǎn)播、斗魚直播等。以上各種業(yè)務(wù)都有突發(fā)場(chǎng)景,也有很強(qiáng)的成本訴求,在如何低成本地保障業(yè)務(wù)突發(fā),騰訊CDN積累了豐富的經(jīng)驗(yàn)。接下來就挑戰(zhàn)和問題、解決方案、效果三個(gè)方面來解析。
一、挑戰(zhàn)和問題
下面將從業(yè)務(wù)特點(diǎn)開始,分析目前存在的挑戰(zhàn)和問題。
1、 業(yè)務(wù)特點(diǎn)和挑戰(zhàn)
CDN多樣化的場(chǎng)景,注定了突發(fā)業(yè)務(wù)充滿挑戰(zhàn)。突發(fā)業(yè)務(wù)具有體量大、場(chǎng)景多樣化、 無規(guī)律等特點(diǎn)。
a) 體量大:突發(fā)業(yè)務(wù)帶寬大部分都超過Tb,部分甚至達(dá)到了10T ;
b) 場(chǎng)景多樣化:點(diǎn)播中的熱劇和新聞爆點(diǎn);直播中的LOL/KPL/DOTA2等游戲直播,NBA/世界杯等體育直播,演唱會(huì)等綜藝直播;應(yīng)用下載中的王者榮耀等游戲下載;靜態(tài)網(wǎng)頁加速中的紅包活動(dòng)、電商促銷等;
c) 無規(guī)律:部分突發(fā)活動(dòng)無法預(yù)知,活動(dòng)快要開始或已經(jīng)開始了才知道,比如新聞爆點(diǎn)。
體量大,需要準(zhǔn)備更多的資源;場(chǎng)景多樣化,需要滿足不同的資源需求;無規(guī)律性則對(duì)我們的擴(kuò)容效率提了很高的要求。
2、 目前存在的問題
僅僅為了滿足業(yè)務(wù)突發(fā)需求而儲(chǔ)備大量的資源,成本太高,會(huì)造成資源極大的浪費(fèi)。所以一般會(huì)通過復(fù)用資源來應(yīng)對(duì)業(yè)務(wù)突發(fā)。但是直接復(fù)用資源,存在兩個(gè)問題:
a) 只能復(fù)用部分資源:CDN業(yè)務(wù),一般按業(yè)務(wù)類型來區(qū)分平臺(tái)和資源使用,主要原因是不同業(yè)務(wù)類型對(duì)資源需求不同,比如點(diǎn)播類需要更多的存儲(chǔ);有較多https請(qǐng)求的靜態(tài)頁面類,則需要更多CPU資源。這種限制使得資源無法充分利用,加大了資源準(zhǔn)備的難度。比如視頻突發(fā)主要使用視頻Buffer,而下載類和網(wǎng)頁類Buffer無法直接使用,這限制了Buffer的大小。即使復(fù)用同類型資源,因?yàn)樯婕岸鄠€(gè)業(yè)務(wù)資源的協(xié)調(diào),準(zhǔn)備時(shí)間一般會(huì)超過兩天,無法應(yīng)對(duì)臨時(shí)突發(fā);
b) 無法降低成本:另外針對(duì)部分突發(fā)業(yè)務(wù),比如游戲應(yīng)用下載,帶寬高峰期在上午和中午,如果只使用本平臺(tái)資源,會(huì)導(dǎo)致結(jié)算帶寬明顯上漲,從而增加成本。無法利用同其他業(yè)務(wù)錯(cuò)峰的特點(diǎn)來降低結(jié)算帶寬。
二、解決方案
騰訊云CDN通過虛擬化復(fù)用現(xiàn)有資源,搭建全業(yè)務(wù)通用的突發(fā)池,所有平臺(tái)共享Buffer。 突發(fā)池中的設(shè)備為Docker虛擬機(jī),虛擬機(jī)有不同的規(guī)格,只要業(yè)務(wù)有需求,都可以按需使用。突發(fā)池中的帶寬儲(chǔ)備達(dá)到了10Tb,基本能滿足所有業(yè)務(wù)突發(fā)需求 。任何業(yè)務(wù)有突發(fā)需求,配合自動(dòng)化上架接口,可在10分鐘完成10Tb突發(fā)池的擴(kuò)容。
1、 突發(fā)池系統(tǒng)架構(gòu)
突發(fā)池系統(tǒng)架構(gòu)見圖1:
a) 突發(fā)池:在各平臺(tái)物理機(jī)的上層,由Docker虛擬機(jī)組成的資源池,對(duì)CPU/內(nèi)存/磁盤等使用進(jìn)行了限制,防止對(duì)物理機(jī)造成影響。原有業(yè)務(wù)依然部署在物理機(jī)上,不用調(diào)整。
b) 自動(dòng)化部署和監(jiān)控系統(tǒng): 能根據(jù)業(yè)務(wù)實(shí)際需求,自動(dòng)預(yù)測(cè)需求并擴(kuò)容 。所有的突發(fā)需求,都能在10分鐘內(nèi)擴(kuò)容完成。針對(duì)點(diǎn)播/下載業(yè)務(wù),自動(dòng)分發(fā)熱點(diǎn)文件,降低回源帶寬。
c) 調(diào)度系統(tǒng):突發(fā)業(yè)務(wù)的突發(fā)性和體量大兩個(gè)特點(diǎn),使得相比域名調(diào)度系統(tǒng),直通車更占優(yōu)勢(shì)。直通車調(diào)度更靈活,生效時(shí)間快,能達(dá)到分鐘級(jí)。
虛擬機(jī)和物理機(jī)部署了上報(bào)Agent,業(yè)務(wù)信息和服務(wù)器負(fù)載每分鐘都會(huì)上報(bào)到監(jiān)控系統(tǒng)。監(jiān)控系統(tǒng)會(huì)根據(jù)歷史帶寬預(yù)測(cè)一個(gè)值,并與當(dāng)前帶寬比較,如果當(dāng)前帶寬超過預(yù)測(cè)值的50%,則認(rèn)為有突發(fā)。根據(jù)帶寬上漲的比例,系統(tǒng)會(huì)自動(dòng)從突發(fā)池中擴(kuò)容相應(yīng)數(shù)據(jù)的設(shè)備。針對(duì)提前準(zhǔn)備的突發(fā)活動(dòng),運(yùn)維可以指定帶寬需求量,之后系統(tǒng)便會(huì)自動(dòng)計(jì)算設(shè)備需求并擴(kuò)容。
分鐘粒度上報(bào)的服務(wù)器負(fù)載信息則為監(jiān)控系統(tǒng)做調(diào)度決策提供了依據(jù)。系統(tǒng)會(huì)依據(jù)機(jī)房剩余帶寬、服務(wù)器帶寬、CPU、IO等綜合信息決定虛擬機(jī)是否需要從直通車中啟用或者禁用。用戶訪問時(shí)先請(qǐng)求直通車調(diào)度系統(tǒng),直通車會(huì)根據(jù)調(diào)度策略返回一個(gè)302地址,302地址中為實(shí)際CDN資源地址。用戶跳轉(zhuǎn)到302地址,并獲取實(shí)際內(nèi)容。
2、技術(shù)優(yōu)化
使用虛擬化技術(shù)復(fù)用資源的重要前提是,不影響現(xiàn)有業(yè)務(wù)。這就要求對(duì)資源有充分的隔離,比如CPU/磁盤,以及對(duì)帶寬的使用。下面是實(shí)現(xiàn)過程中存在的幾個(gè)問題及解決方案:
- 精準(zhǔn)控制單機(jī)負(fù)載:負(fù)載過高會(huì)影響業(yè)務(wù)質(zhì)量,需要對(duì)單機(jī)負(fù)載進(jìn)行精準(zhǔn)的控制。
解決方案:
a) 配額系統(tǒng):直通車中有配額系統(tǒng),對(duì)每個(gè)虛擬機(jī)可使用的資源做了限制,包括CPU/IO和帶寬。監(jiān)控系統(tǒng)中上報(bào)的信息,結(jié)合配額系統(tǒng),可以確保服務(wù)器負(fù)載被限定在制定的范圍內(nèi),粒度為分鐘級(jí)。
b) 部分請(qǐng)求返回302:對(duì)CPU/帶寬/IO等做了限制后,應(yīng)用程序能根據(jù)母機(jī)當(dāng)前負(fù)載,實(shí)時(shí)判斷是否處理一個(gè)請(qǐng)求。如果負(fù)載在限制范圍內(nèi),直接處理;如果負(fù)載超出限制,則返回302,使用戶跳轉(zhuǎn)到直通車的調(diào)度地址,這樣能在盡量不影響業(yè)務(wù)質(zhì)量的情況對(duì)負(fù)載做精準(zhǔn)控制。程序?qū)用鎸?duì)負(fù)載的實(shí)時(shí)控制,是配額系統(tǒng)的有效補(bǔ)充。
c) 網(wǎng)卡流量控制:在極端情況下,業(yè)務(wù)帶寬超過設(shè)定閾值,這時(shí)虛擬網(wǎng)卡會(huì)主動(dòng)丟包,避免對(duì)母機(jī)造成影響。
- 限制磁盤大小:Docker在ext3/ext4文件系統(tǒng)中無法對(duì)文件/目錄級(jí)別進(jìn)行磁盤大小限制。
解決方案:
由于騰訊云CDN業(yè)務(wù)基本都是使用ext3/ext4文件系統(tǒng),這種情況下Docker只能對(duì)根據(jù)用戶或用戶組對(duì)磁盤進(jìn)行限制,但現(xiàn)網(wǎng)業(yè)務(wù)都是直接在root環(huán)境下使用。這里我們使用loop device來解決磁盤大小限制問題。虛擬機(jī)中突發(fā)業(yè)務(wù)使用掛載在loop device上的目錄,這樣就可以間接限制磁盤大小,防止使用太多磁盤影響其他業(yè)務(wù)。
- CPU綁定:默認(rèn)是綁定所有CPU,部分單CPU負(fù)載高會(huì)影響母機(jī)業(yè)務(wù)。
解決方案:
通過腳本每分鐘采集一次系統(tǒng)所有單CPU負(fù)載,為避免頻繁調(diào)整和受毛刺數(shù)據(jù)影響,取15分鐘的均值。***選取負(fù)載較低的部分核,并通過配置文件cpuset.cpus來動(dòng)態(tài)綁定,將虛擬機(jī)對(duì)母機(jī)業(yè)務(wù)影響降低到最小,并且能充分利用資源。
效果
突發(fā)池上線后,高效支持了王者榮耀下載、NBA直播、KPL/LPL游戲直播等多次大型突發(fā)活動(dòng),節(jié)約成本2000萬。通過共享buffer,搭建突發(fā)池能顯著提高突發(fā)能力和降低成本。
總結(jié)
騰訊云CDN通過Docker技術(shù)復(fù)用資源,搭建Tb級(jí)別突發(fā)池,能支持直播、點(diǎn)播、靜態(tài)等各種業(yè)務(wù)突發(fā),能自動(dòng)檢測(cè)到業(yè)務(wù)突發(fā)需求并在10分鐘內(nèi)完成資源擴(kuò)容,具有發(fā)布快,成本低等特點(diǎn)。資源復(fù)用能提高資源利用率,為業(yè)務(wù)提供極大的突發(fā)池,但要注意復(fù)用業(yè)務(wù)之間不能相互影響,這需要對(duì)服務(wù)器進(jìn)行實(shí)時(shí)的監(jiān)控和及時(shí)的調(diào)度。另外還有一些待改進(jìn)的地方,比如內(nèi)核參數(shù)基于容器隔離,方便不同業(yè)務(wù)調(diào)優(yōu);部分業(yè)務(wù)客戶端不支持302跳轉(zhuǎn),調(diào)度系統(tǒng)需要支持域名調(diào)度方式。