單機(jī)百萬TPM!用得起的iOe?
2016戴爾科技峰會(huì)精彩搶先看之一↓↓
現(xiàn)場真機(jī)實(shí)測show
12月14日大會(huì)當(dāng)天,邀請專業(yè)評(píng)測機(jī)構(gòu)企事錄在關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫和分布式融合系統(tǒng)領(lǐng)域,搭建了兩套足以顛覆傳統(tǒng)的DEMO方案,讓雙模式IT用戶都可以看到新技術(shù)帶來的性能的突飛猛進(jìn)。
1.企業(yè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫性能實(shí)測
企業(yè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫系統(tǒng)--今天,只用之前IOE十分之一的價(jià)格,四十分之一的功耗,就取得了更好的性能,用戶還完全不必?fù)?dān)心數(shù)據(jù)的安全性和系統(tǒng)的可靠性?
工程師將現(xiàn)場演示在真實(shí)的Oracle 12c環(huán)境下是如何跑出64萬TPM的優(yōu)異性能!
2.軟件定義超融合架構(gòu)FX2
軟件定義,硬件重構(gòu)!現(xiàn)場搭建基于Ceph的SDS系統(tǒng),看看軟件定義超融合架構(gòu)FX2是如何在超小空間里提供完整的SDS解決方案?
雙十一那一晚,何止是妹子們的瘋狂夜!
1800萬TPM的天量指標(biāo)
上萬臺(tái)服務(wù)器布網(wǎng)火力陣線……
技術(shù)咖們再次將性能峰值推向下一個(gè)***
拜科技發(fā)展所賜
現(xiàn)在,只要一臺(tái)單機(jī)就可獲得***TPM
企事錄的機(jī)房為您揭秘
集***TPM、高可用性于一身
爆款“全能王”戴爾PowerEdge R930
在這個(gè)世界上,沒有哪家的交易量能比得上中國的雙11狂歡節(jié)了,即便是剛剛在北美結(jié)束的黑五,較雙11的成交量和成交金額都成了一個(gè)不起眼的數(shù)字,無他,中國人多,上網(wǎng)剁手也方便。
那一晚,我們說IT
僅僅在雙11的最開始30分鐘,天貓每秒交易峰值17.5萬筆,相當(dāng)于17.5萬的峰值TPS;每秒支付峰值12萬筆則相當(dāng)于12萬峰值TPS。這兩者加起來差不多需要接近30萬TPS性能,簡單換算,不考慮其他因素影響,差不多達(dá)到了1800萬TPM的天量指標(biāo),這對(duì)于這個(gè)星球上的絕大多數(shù)數(shù)據(jù)庫系統(tǒng)來說,都是一個(gè)無法跨越的高山。先不說誰家數(shù)據(jù)庫技術(shù)能滿足天貓雙11的交易和支付性能需求(登錄、瀏覽等操作不在此列),單說阿里為了應(yīng)對(duì)“雙11”,應(yīng)該部署了上萬臺(tái)服務(wù)器來滿足如此天量的并發(fā)需求。
雖然用1800萬TPM的性能估算天貓的峰值性能并不科學(xué),畢竟“雙11”是全球***規(guī)模的“購物狂歡”,而分布式的系統(tǒng)架構(gòu)也是天貓能承載如此應(yīng)用的關(guān)鍵。在常規(guī)環(huán)境中,絕對(duì)大多數(shù)企業(yè)沒有這么天量的需求,也沒有必要維護(hù)如此龐大的系統(tǒng)。
【名詞解釋:TPM是Transactions Per Minute的簡稱,即數(shù)據(jù)庫在分鐘內(nèi)可以處理的事務(wù)數(shù)。TPM是用來衡量數(shù)據(jù)庫性能的一個(gè)關(guān)鍵指標(biāo)?!?/strong>
那么在開放的x86平臺(tái)上,就只能用數(shù)量換取性能和可靠性嗎?答案很明顯——不是。
企事錄經(jīng)過差不多兩年時(shí)間的等待,當(dāng)然,除了我們在儲(chǔ)備自己的技術(shù)積累外,還是在等一個(gè)外部的機(jī)會(huì),那就是新一代的高端x86服務(wù)器和顛覆存儲(chǔ)的新一代SSD。
從IOE到iOe,兩大技術(shù)進(jìn)步
成就爆款“全能王”
時(shí)光機(jī)開啟——回退十年!十年之前,屬于你,屬于我……屬于小機(jī)、屬于SAN的年代,那時(shí)候大家還都在IOE的懷抱里,好溫暖、好舒服,因?yàn)樗麄兌际莾r(jià)格巨高、運(yùn)維巨簡單的設(shè)備(買服務(wù)就好,反正出了問題運(yùn)維搞不定,也不敢搞),連阿里巴巴都在用。如果一個(gè)項(xiàng)目需要部署單機(jī)百萬TPM的數(shù)據(jù)系統(tǒng),那么需要準(zhǔn)備什么呢?
哦,性能要求太高,搞不定!
再次乘坐時(shí)光機(jī)——回到5年前!一個(gè)項(xiàng)目需要部署一套單機(jī)百萬TPM的數(shù)據(jù)庫系統(tǒng),那么CIO需要考慮什么呢?計(jì)算性能是首先要考慮的,百萬TPM起碼需要8路小機(jī)來提供計(jì)算支持;存儲(chǔ)也是非常重要的環(huán)節(jié),要提供百萬TPM,需要接近百萬IOPS的存儲(chǔ)設(shè)備,那么一套幾千塊硬盤的高端磁盤陣列(SAN)就是必須購買的,F(xiàn)C交換機(jī)等網(wǎng)絡(luò)設(shè)備林林總總的也不老少,一套這樣的系統(tǒng),……需要***別的投入!?每年光電費(fèi)就要幾十萬!?這不可能!沒那么多錢……
于是項(xiàng)目就流產(chǎn)了……
時(shí)間來到了2016年底,在企事錄的機(jī)房里,我們只花費(fèi)了區(qū)區(qū)幾十萬,就得到了一個(gè)百萬TPM性能的系統(tǒng),只占用4U的機(jī)架空間,工作時(shí)的功耗竟然只有380瓦。
預(yù)算從***別掉到幾十萬,購置一套性能相同的設(shè)備只需要花掉十年前的電費(fèi)錢?這樣的落差會(huì)讓絕大多數(shù)用戶感到難以理解,憑什么啊?
就憑技術(shù)的發(fā)展!主要總結(jié)為兩條線:
✔ x86的進(jìn)步讓單機(jī)的計(jì)算性能超越了小機(jī),一臺(tái)4路的至強(qiáng)E7 v4服務(wù)器可以提供多達(dá)192核,12TB內(nèi)存的強(qiáng)悍性能;
✔ 新一代的PCIe NVMe SSD可以輕松獲得50W IOPS以上的I/O性能,直接PK掉傳統(tǒng)SAN存儲(chǔ);
雙線并行,百萬TPM不是夢!
當(dāng)然,企業(yè)級(jí)數(shù)據(jù)庫系統(tǒng)仍然***Oracle,不過已經(jīng)進(jìn)化到12c版本。O還是那個(gè)O,IE已經(jīng)不是那個(gè)IE——IBM換成了intel,EMC換成了NVMe——嗯,是ie,或者說,iOe!
機(jī)房里爆發(fā)出一陣歡呼“技術(shù)才是時(shí)代***音!宇宙無敵的砍價(jià)高手啊~~~從千萬砍到幾十萬,剩下的錢都?jí)蛟诒本┵I房了!”
嗯,打住,我們還是回來看看為什么以前的百萬TPM那么的貴吧。
眾所周知,作為企業(yè)IT核心的數(shù)據(jù)庫系統(tǒng)主要是由服務(wù)器+數(shù)據(jù)庫+存儲(chǔ)系統(tǒng)三大塊構(gòu)成。其中,數(shù)據(jù)庫系統(tǒng)通常是Oracle數(shù)據(jù)庫,但Oracle數(shù)據(jù)庫這么多年來依然是關(guān)系型數(shù)據(jù)庫領(lǐng)域的霸主,價(jià)格一直堅(jiān)挺,所以價(jià)格大幅跳水跟數(shù)據(jù)庫沒什么關(guān)系。
服務(wù)器這塊倒是有顯著變化:五年前Unix服務(wù)器還是比較“傲嬌”的,企業(yè)在搭建數(shù)據(jù)庫這種核心IT系統(tǒng)時(shí)***的是小型機(jī),然而,隨著x86服務(wù)器的性能、可靠性以及可用性的突飛猛進(jìn),x86服務(wù)器+Oracle數(shù)據(jù)庫的組合變得越來越常見——更不要說,Oracle自己推出的Exadata數(shù)據(jù)庫一體機(jī)采用的就是x86服務(wù)器。當(dāng)然,x86服務(wù)器比Unix服務(wù)器價(jià)格的確便宜不少,但即便搭配新款小型機(jī)的價(jià)格也不像以往那么堅(jiān)挺了,所以從小機(jī)遷到x86服務(wù)器,這只是單機(jī)百萬TPM數(shù)據(jù)庫系統(tǒng)價(jià)格跳水的一個(gè)因素。
其實(shí)價(jià)格跳水的主要大頭在存儲(chǔ)系統(tǒng)。企事錄評(píng)測“磚家”曾智強(qiáng)表示,在過去要配備一套超高性能的數(shù)據(jù)庫系統(tǒng),存儲(chǔ)方面的支出就是大頭,因?yàn)榛跈C(jī)械硬盤的存儲(chǔ)很難獲得較好的Oracle數(shù)據(jù)庫性能。
“先不說百萬TPM,就說說百萬IOPS需要多少塊硬盤——不加隊(duì)列深度的情況下,一塊15000PRM的SAS 硬盤IOPS約為200,也就是說如果要達(dá)到百萬IOPS就需要5000塊性能***的硬盤,所以在傳統(tǒng)SAN時(shí)代,***的高端存儲(chǔ)設(shè)備標(biāo)稱可以支持5000+塊硬盤,也就是一百萬IOPS出頭。”曾智強(qiáng)說。
5000塊硬盤什么概念?按一個(gè)2U機(jī)箱插24塊盤來算,需要占整整八個(gè)機(jī)柜,一塊硬盤6.8W的功耗,百萬IOPS就需要34KW的供電,怪不得電費(fèi)一年就幾十萬。
不“傲嬌”的全能王
在企事錄的機(jī)房里,戴爾的PowerEdge R930服務(wù)器上,我們的工程師在一臺(tái)配備了兩塊PCie SSD的戴爾四路服務(wù)器上跑Oracle數(shù)據(jù)庫就跑出了百萬TPM的好成績。
戴爾PowerEdge R930是一臺(tái)4U高度的4路高端x86服務(wù)器,它安裝了4顆至強(qiáng)E7 v3 8880處理器,這個(gè)18核36線程的處理器在4路配置時(shí),具有144顆邏輯處理器,當(dāng)然,現(xiàn)在可以無縫支持至強(qiáng) E7 v4處理器了,可以提供最多192顆邏輯處理器,性能更上一層樓。
看看系統(tǒng)里這么多的核,想想都激動(dòng)。
E7 v3 8880的主頻為2.3GHz,但是睿頻后能達(dá)到3.1GHz,單顆處理器的TDP 150W,能滿足絕大多數(shù)用戶對(duì)計(jì)算性能的需求。適合云計(jì)算主機(jī)、大型虛擬化應(yīng)用環(huán)境和企業(yè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)等環(huán)境的使用。
而且PowerEdge R930***支持12TB DDR4-2133內(nèi)存(單條128GB內(nèi)存),意味著即便是內(nèi)存型數(shù)據(jù)庫也都可以輕松運(yùn)行。而且支持內(nèi)存鏡像、熱備等多種先進(jìn)的內(nèi)存工作特性,具備了媲美小機(jī)的可靠性。
內(nèi)存搞這么大,性能飆那么高,三天兩頭宕機(jī)也吃不消啊!對(duì)于高端服務(wù)器來說,有一個(gè)關(guān)鍵的指標(biāo)叫做RAS特性,要滿足服務(wù)器99.9%以上的可用性,不是一句話能說明白的,而RAS特性則很好地詮釋了高端x86服務(wù)器是如何提供高可用性的。
RAS——Reliability, Availability and Serviceability(可靠性、可用性、可擴(kuò)展性)
▌可靠性Reliability
可靠性是降低硬件故障的幾率,除了采用高可靠性的部件,還可以改善硬件的工作環(huán)境;通過增加局部的冗余延長整體的平均故障間隔時(shí)間。
戴爾R930在內(nèi)存板、CPU散熱片和擴(kuò)展卡上大量使用熱管技術(shù),能顯著降低系統(tǒng)關(guān)鍵部件的工作溫度,提升可靠性;R930的背部提供左右兩組4路熱交換電源,支持雙路電源供電。
12厘米大口徑風(fēng)扇2*3設(shè)計(jì),營造了良好的散熱風(fēng)道環(huán)境,全冗余設(shè)計(jì)也保證了極端情況下的服務(wù)器散熱
▌可用性Availability
可用性是在出現(xiàn)無法糾正的錯(cuò)誤時(shí),系統(tǒng)和應(yīng)用程序的運(yùn)行不會(huì)中斷。
戴爾Poweredge R930 基于至強(qiáng)E7 v3計(jì)算平臺(tái),在內(nèi)存的可靠性上提供3種硬件層的內(nèi)存可靠性選擇。這些功能是基于E7 v3處理器實(shí)現(xiàn)的功能, CPU是直接通過主板的內(nèi)存通道/接口連接內(nèi)存板的。支持內(nèi)存鏡像、熱備和數(shù)據(jù)轉(zhuǎn)移等功能,雖然鏡像和熱備功能會(huì)損失最多一半的內(nèi)存容量,但是能大幅增加內(nèi)存部分的可靠性。
▌易維護(hù)性Serviceability
易維護(hù)性是在正常運(yùn)行狀態(tài)下對(duì)系統(tǒng)進(jìn)行維護(hù)。
戴爾R930前部提供了iDRAC8 顯示屏,能顯示系統(tǒng)重要參數(shù)和信息。通過瀏覽器遠(yuǎn)程訪問iDRAC8能夠完整監(jiān)控和管理R930的方方面面,增強(qiáng)維護(hù)便利性,方便用戶。
內(nèi)存板和風(fēng)扇都可以全免工具維護(hù),它們安裝在一個(gè)堅(jiān)固的框架中,在易維護(hù)和可靠性上做到了高平衡。戴爾R930機(jī)箱帶有把手便于搬運(yùn)。
總結(jié)
“正是因?yàn)榇鳡?R930的超強(qiáng)計(jì)算性能,附以豐富、先進(jìn)的RAS特性,支持新一代的企業(yè)級(jí)存儲(chǔ)、網(wǎng)絡(luò)設(shè)備,才讓以往百萬TPM能夠在我們簡單的機(jī)房環(huán)境中,通過一個(gè)普通的市電插座就能實(shí)現(xiàn)。這無疑要?dú)w功于技術(shù)的進(jìn)步,讓我們能用更低的花費(fèi)獲得更強(qiáng)的數(shù)據(jù)庫處理性能??萍?,加速一切想象變成現(xiàn)實(shí)的進(jìn)程!”企事錄聯(lián)合創(chuàng)始人李獻(xiàn)說。