劍橋大學(xué)超級(jí)計(jì)算機(jī),用的是PowerEdge服務(wù)器
當(dāng)超級(jí)計(jì)算機(jī)的數(shù)據(jù)處理能力飛速向前發(fā)展,存儲(chǔ)I/O卻成為了瓶頸,制約著那些運(yùn)行數(shù)據(jù)密集型工作負(fù)載的人員更快獲取洞察的可能。而現(xiàn)在,劍橋大學(xué)已經(jīng)解決了該問(wèn)題。為此,他們?cè)赩irtual Institute公布的2019I/O-500榜單中,以620.69的得分位列第一,領(lǐng)先第二名290分!
談到這一話題時(shí),劍橋大學(xué)高性能計(jì)算主任Paul Calleja表示:“通過(guò)獨(dú)特的數(shù)據(jù)加速器,我們已經(jīng)破解了HPC存儲(chǔ)問(wèn)題。”
而這個(gè)數(shù)據(jù)加速器的背后,正是由戴爾科技提供技術(shù)支撐。
助力世界頂尖學(xué)府
加速前沿科學(xué)研究
坐落于英國(guó)劍橋的劍橋大學(xué)建立于1209年,乃是世界上最古老的大學(xué)之一,也是備受尊崇的學(xué)術(shù)中心。其開(kāi)展的均為前沿的科學(xué)研究,這也是大學(xué)使命的一部分,即通過(guò)追求國(guó)際最高水平的教育、學(xué)習(xí)和研究為社會(huì)做出貢獻(xiàn)。
這些原則指導(dǎo)著劍橋大學(xué)研究計(jì)算服務(wù)部的工作,該服務(wù)部為學(xué)校所有學(xué)科以及英國(guó)科學(xué)界和工業(yè)界等領(lǐng)域提供計(jì)算服務(wù)。如今,為了幫助他們保持在人工智能(AI)和科學(xué)研究領(lǐng)域的領(lǐng)先優(yōu)勢(shì),研究計(jì)算服務(wù)部啟動(dòng)了英國(guó)最大的學(xué)術(shù)超級(jí)計(jì)算機(jī)“Cumulus–英國(guó)科學(xué)云”。
Cumulus采用搭載英特爾®至強(qiáng)®處理器和英特爾®Omni-Path架構(gòu)的戴爾易安信PowerEdge服務(wù)器,其性能可達(dá)每秒超過(guò)2千萬(wàn)億次浮點(diǎn)運(yùn)算。該系統(tǒng)集成了OpenStack軟件,以控制計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源池,并使用戶(hù)可以通過(guò)云界面隨時(shí)訪問(wèn)這些資源。
Cumulus還集成了高度創(chuàng)新的戴爾數(shù)據(jù)加速器(Dell Data Accelerator:DAC)。DAC系統(tǒng)由戴爾易安信PowerEdge R740xd服務(wù)器構(gòu)建。Cumulus使用了24臺(tái)這樣的服務(wù)器,每臺(tái)服務(wù)器有12個(gè)NVMe驅(qū)動(dòng)器。為了平衡系統(tǒng)(基于評(píng)估NVMe的峰值性能和網(wǎng)絡(luò)帶寬),24臺(tái)服務(wù)器中的每一臺(tái)都有兩個(gè)英特爾OPA適配器。
戴爾易安信PowerEdgeR740xd
除了優(yōu)化單個(gè)DAC服務(wù)器配置外,研究計(jì)算服務(wù)部還與戴爾易安信、英特爾、StackHPC(一家致力于HPC和云融合的英國(guó)初創(chuàng)公司)密切合作,優(yōu)化網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并利用Lustre文件系統(tǒng)中的數(shù)據(jù)加速器和分布式名稱(chēng)空間(DNE)功能來(lái)優(yōu)化Cumulus集群的頂級(jí)I/O性能。
而在OpenStack方面,該系統(tǒng)利用戴爾易安信服務(wù)器中嵌入的iDRAC功能來(lái)進(jìn)行集群的調(diào)配和管理,特別是在Ansible驅(qū)動(dòng)的基礎(chǔ)設(shè)施作為代碼方面。
聯(lián)網(wǎng)的數(shù)據(jù)加速器節(jié)點(diǎn)是Cumulus集群的核心
正是在領(lǐng)先科技力量的共同合作之下,使得Cumulus超級(jí)計(jì)算機(jī)在I/O-500基準(zhǔn)測(cè)試中取得了令人震驚的成績(jī)。根據(jù)研究計(jì)算服務(wù)部的數(shù)據(jù),DAC加速器可提供超過(guò)500GB/秒的I/O讀取性能,使其成為英國(guó)最快的HPCI/O平臺(tái),為研究人員提供閃電般快速的吞吐量。
深耕HPC 20余年
助力探索人類(lèi)知識(shí)邊界
劍橋大學(xué)高性能計(jì)算主任Paul Calleja介紹,人工智能項(xiàng)目需要非常高的速度處理大量數(shù)據(jù),Cumulus有能力幫助用戶(hù)解決極其困難的數(shù)據(jù)驅(qū)動(dòng)、模擬和AI挑戰(zhàn),許多涉及劍橋研究人員的人工智能項(xiàng)目已經(jīng)在進(jìn)行中。
“在生命科學(xué)領(lǐng)域,我們正在研究醫(yī)學(xué)成像分析和基因組學(xué),在天文學(xué)領(lǐng)域,科學(xué)家們正在利用AI研究繪制系外行星圖,”他說(shuō),“我們還圍繞基因組學(xué)開(kāi)展了一些相當(dāng)具有突破性的工作,其中有英國(guó)10K項(xiàng)目,研究人員正在使用Hadoop數(shù)據(jù)分析引擎,圍繞非常大的人群基因組研究推動(dòng)突破性成果。”
事實(shí)上,不僅是劍橋大學(xué),戴爾科技長(zhǎng)期處于推動(dòng)客戶(hù)采用最新HPC技術(shù)的一線,大力推動(dòng)廣泛的科學(xué)發(fā)現(xiàn)和研究工作。
例如德州大學(xué)奧斯汀分校的德州超算中心(TACC)選擇與戴爾科技合作,在去年6月最新公布的TOP500榜單當(dāng)中,戴爾科技為T(mén)ACC設(shè)計(jì)并制造的Frontera超級(jí)計(jì)算機(jī)獲得了第五名的成績(jī),其速度在美國(guó)排名第三,并且也是所有大學(xué)中規(guī)模最大的系統(tǒng)。
還有密歇根大學(xué)正在部署Great Lakes計(jì)算集群,用于模擬、建模、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)、基因組學(xué)等等。這個(gè)新系統(tǒng)采用了基于戴爾易安信PowerEdge服務(wù)器的HPC基礎(chǔ)設(shè)施。Great Lakes是業(yè)內(nèi)第一個(gè)受益于Mellanox HDR 200Gb/s InfiniBand網(wǎng)絡(luò)的系統(tǒng),實(shí)現(xiàn)了更快的數(shù)據(jù)傳輸速度和更高的應(yīng)用性能。
在國(guó)內(nèi),戴爾科技也與很多高校成功實(shí)施部署了規(guī)模不等的HPC平臺(tái),包括清華大學(xué)生命科學(xué)與技術(shù)學(xué)院、北京大學(xué)生命科學(xué)聯(lián)合中心、西湖大學(xué)生命科學(xué)學(xué)院、哈爾濱工業(yè)大學(xué)生命科學(xué)與技術(shù)學(xué)院等,助力探索人類(lèi)知識(shí)邊界。
客戶(hù)引言
“傳統(tǒng)HPC集群技術(shù)提供預(yù)配置的靜態(tài)資源池,能夠在很大程度上滿(mǎn)足數(shù)量有限但非常重要的用戶(hù)群。通過(guò)實(shí)現(xiàn)云模式,包含在裸機(jī)環(huán)境中,軟件定義基礎(chǔ)設(shè)施的優(yōu)勢(shì)在于包含傳統(tǒng)HPC集群,無(wú)需犧牲性能,并在支持現(xiàn)代混合云工作負(fù)載方面提供更高的敏捷性。
我們看到此類(lèi)新工作負(fù)載的用戶(hù)大幅增長(zhǎng),而Cumulus讓我們的用戶(hù)可以在安全且靈活的環(huán)境中更輕松地進(jìn)行HPC和HPDA級(jí)計(jì)算。與戴爾易安信等合作伙伴攜手,我們打造了英國(guó)計(jì)算能力最強(qiáng)、I/O效率最高的資源之一。”
——PaulCalleja,劍橋大學(xué)高性能計(jì)算主任
相關(guān)內(nèi)容推薦:方總嘆了口氣,我有了個(gè)主意
相關(guān)產(chǎn)品:Dell EMC PowerStore T 系列存儲(chǔ)