偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

HDFS、Ceph、GFS、GPFS、Swift、Lustre……容器云選擇哪種分布式存儲(chǔ)更好？

作者：talkwithtrend 2020-02-20 11:56:38

存儲(chǔ) 存儲(chǔ)軟件分布式

容器云在使用分布式存儲(chǔ)時(shí)，HDFS、CEPH、GFS、GPFS、Swift等分布式存儲(chǔ)哪種更好?

容器云在使用分布式存儲(chǔ)時(shí)，HDFS、CEPH、GFS、GPFS、Swift等分布式存儲(chǔ)哪種更好?

公司在進(jìn)行容器云技術(shù)選型，想了解相應(yīng)的分布式存儲(chǔ)如何匹配，HDFS、CEPH、GFS、GPFS、Swift等分布式存儲(chǔ)，采用哪種更好，主要場景是容器存儲(chǔ)應(yīng)用日志、配置文件、非結(jié)構(gòu)化數(shù)據(jù)文件等。

問題來自@yin986 某保險(xiǎn)軟件架構(gòu)設(shè)計(jì)師，下文來自twt社區(qū)眾多同行實(shí)踐經(jīng)驗(yàn)分享。

@Steven99 軟件架構(gòu)設(shè)計(jì)師：

日志文件隨著時(shí)間會(huì)是個(gè)很大的量，所以建議考慮統(tǒng)一的日志中心存儲(chǔ)處理，可以用es等，備份到hdfs。

配置文件在量上通常不是個(gè)問題，可以考慮配置中心統(tǒng)一管理，無需額外存儲(chǔ)。

非結(jié)構(gòu)化數(shù)據(jù)通常是大量的文件，可以采用傳統(tǒng)nas或分布式對(duì)象存儲(chǔ)，當(dāng)然資金充?？梢圆少徍玫拇鎯?chǔ)，存儲(chǔ)性能很重要，根據(jù)業(yè)務(wù)重要程度選擇不同的存儲(chǔ)。

@Garyy 某保險(xiǎn)系統(tǒng)工程師：

容器存儲(chǔ)的持久化，對(duì)于有狀態(tài)數(shù)據(jù)的容器使用場景來說至關(guān)重要。因此，在技術(shù)選型的時(shí)候，需要明確存儲(chǔ)的具體需求。存儲(chǔ)按照數(shù)據(jù)類型來分，可以分為塊存儲(chǔ)，對(duì)象存儲(chǔ)，文件存儲(chǔ)。我們傳統(tǒng)的環(huán)境中，使用最多的還是塊存儲(chǔ)和文件存儲(chǔ)。隨著IT的更新?lián)Q代，現(xiàn)在對(duì)于對(duì)象存儲(chǔ)(非結(jié)構(gòu)化數(shù)據(jù))的需求日益旺盛，對(duì)象存儲(chǔ)在對(duì)一些Key-Value型數(shù)據(jù)的存儲(chǔ)有著天然的優(yōu)勢(shì)，再加上其分布式，副本/糾刪碼等可以匹配傳統(tǒng)存儲(chǔ)的特性，日益成為溫?cái)?shù)據(jù)/冷數(shù)據(jù)存儲(chǔ)的不二之選。

HDFS/CEPH/GFS/GPFS/Swift這類分布式存儲(chǔ)，按照存儲(chǔ)的類型來區(qū)分，HDFS/GPFS/GFS屬于文件存儲(chǔ)，CEPH屬于統(tǒng)一存儲(chǔ)--即塊/對(duì)象/文件統(tǒng)一體，Swift屬于對(duì)象存儲(chǔ)-目前屬于OpenStack下面的一個(gè)子項(xiàng)目。

1)HDFS

Hadoop分布式文件系統(tǒng)(HDFS)被設(shè)計(jì)成適合運(yùn)行在通用硬件(commodity hardware)上的分布式文件系統(tǒng)。它和現(xiàn)有的分布式文件系統(tǒng)有很多共同點(diǎn)。但同時(shí)，它和其他的分布式文件系統(tǒng)的區(qū)別也是很明顯的。HDFS是一個(gè)高度容錯(cuò)性的系統(tǒng)，適合部署在廉價(jià)的機(jī)器上。HDFS能提供高吞吐量的數(shù)據(jù)訪問，非常適合大規(guī)模數(shù)據(jù)集上的應(yīng)用。HDFS放寬了一部分POSIX約束，來實(shí)現(xiàn)流式讀取文件系統(tǒng)數(shù)據(jù)的目的。

HDFS有著高容錯(cuò)性(fault-tolerant)的特點(diǎn)，并且設(shè)計(jì)用來部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)來訪問應(yīng)用程序的數(shù)據(jù)，適合那些有著超大數(shù)據(jù)集(large data set)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以實(shí)現(xiàn)流的形式訪問(streaming access)文件系統(tǒng)中的數(shù)據(jù)。

2)GFS

GFS是一個(gè)可擴(kuò)展的分布式文件系統(tǒng)，用于大型的、分布式的、對(duì)大量數(shù)據(jù)進(jìn)行訪問的應(yīng)用。它運(yùn)行于廉價(jià)的普通硬件上，并提供容錯(cuò)功能。它可以給大量的用戶提供總體性能較高的服務(wù)。

3)GPFS

GPFS(General Parallel File System ,GPFS) 是 IBM 公司第一個(gè)共享文件系統(tǒng)，起源于 IBM SP 系統(tǒng)上使用的虛擬共享磁盤技術(shù)( VSD )。作為這項(xiàng)技術(shù)的核心， GPFS 是一個(gè)并行的磁盤文件系統(tǒng)，它保證在資源組內(nèi)的所有節(jié)點(diǎn)可以并行訪問整個(gè)文件系統(tǒng);而且針對(duì)此文件系統(tǒng)的服務(wù)操作，可以同時(shí)安全地在使用此文件系統(tǒng)的多個(gè)節(jié)點(diǎn)上實(shí)現(xiàn)。GPFS 允許客戶共享文件，而這些文件可能分布在不同節(jié)點(diǎn)的不同硬盤上;它提供了許多標(biāo)準(zhǔn)的 UNIX 文件系統(tǒng)接口，允許應(yīng)用不需修改或者重新編輯就可以在其上運(yùn)行。

4)CEPH

Ceph是一個(gè)可靠地、自動(dòng)重均衡、自動(dòng)恢復(fù)的分布式存儲(chǔ)系統(tǒng)，根據(jù)場景劃分可以將Ceph分為三大塊，分別是對(duì)象存儲(chǔ)、塊設(shè)備存儲(chǔ)和文件系統(tǒng)服務(wù)。在虛擬化領(lǐng)域里，比較常用到的是Ceph的塊設(shè)備存儲(chǔ)，比如在OpenStack項(xiàng)目里，Ceph的塊設(shè)備存儲(chǔ)可以對(duì)接OpenStack的cinder后端存儲(chǔ)、Glance的鏡像存儲(chǔ)和虛擬機(jī)的數(shù)據(jù)存儲(chǔ)，比較直觀的是Ceph集群可以提供一個(gè)raw格式的塊存儲(chǔ)來作為虛擬機(jī)實(shí)例的硬盤。

Ceph相比其它存儲(chǔ)的優(yōu)勢(shì)點(diǎn)在于它不單單是存儲(chǔ)，同時(shí)還充分利用了存儲(chǔ)節(jié)點(diǎn)上的計(jì)算能力，在存儲(chǔ)每一個(gè)數(shù)據(jù)時(shí)，都會(huì)通過計(jì)算得出該數(shù)據(jù)存儲(chǔ)的位置，盡量將數(shù)據(jù)分布均衡，同時(shí)由于Ceph的良好設(shè)計(jì)，采用了CRUSH算法、HASH環(huán)等方法，使得它不存在傳統(tǒng)的單點(diǎn)故障的問題，且隨著規(guī)模的擴(kuò)大性能并不會(huì)受到影響。

5)Swift

Swift 最初是由 Rackspace 公司開發(fā)的高可用分布式對(duì)象存儲(chǔ)服務(wù)，并于 2010 年貢獻(xiàn)給 OpenStack 開源社區(qū)作為其最初的核心子項(xiàng)目之一，為其 Nova 子項(xiàng)目提供虛機(jī)鏡像存儲(chǔ)服務(wù)。Swift 構(gòu)筑在比較便宜的標(biāo)準(zhǔn)硬件存儲(chǔ)基礎(chǔ)設(shè)施之上，無需采用 RAID(磁盤冗余陣列)，通過在軟件層面引入一致性散列技術(shù)和數(shù)據(jù)冗余性，犧牲一定程度的數(shù)據(jù)一致性來達(dá)到高可用性和可伸縮性，支持多租戶模式、容器和對(duì)象讀寫操作，適合解決互聯(lián)網(wǎng)的應(yīng)用場景下非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)問題。

@fanyqing 某銀行高級(jí)工程師：

1)Ceph的特點(diǎn)

Ceph支持對(duì)象存儲(chǔ)、塊存儲(chǔ)和文件存儲(chǔ)服務(wù)，故稱為統(tǒng)一存儲(chǔ)。

采用CRUSH算法，數(shù)據(jù)分布均衡，并行度高，不需要維護(hù)固定的元數(shù)據(jù)結(jié)構(gòu)。

數(shù)據(jù)具有強(qiáng)一致，確保所有副本寫入完成才返回確認(rèn)，適合讀多寫少場景。

去中心化，MDS之間地位相同，無固定的中心節(jié)點(diǎn)。

Ceph存在一些缺點(diǎn)：

去中心化的分布式解決方案，需要提前做好規(guī)劃設(shè)計(jì)，對(duì)技術(shù)團(tuán)隊(duì)的要求能力比較高。

Ceph擴(kuò)容時(shí)，由于其數(shù)據(jù)分布均衡的特性，會(huì)導(dǎo)致整個(gè)存儲(chǔ)系統(tǒng)性能的下降。

2)GFS特點(diǎn)

適合大文件場景的應(yīng)用，特別是針對(duì)GB級(jí)別的大文件，適用于數(shù)據(jù)訪問延時(shí)不敏感的搜索類業(yè)務(wù)。

中心化架構(gòu)，只有1個(gè)master處于active狀態(tài)。

緩存和預(yù)取，通過在client端緩存元數(shù)據(jù)，盡量減少與master的交互，通過文件的預(yù)讀取來提升并發(fā)性能。

高可靠性，master需要持久化的數(shù)據(jù)會(huì)通過操作日志與checkpoint的方式存放多份，故障后master會(huì)自動(dòng)切換重啟。

3)HDFS的特點(diǎn)(vs GFS)

分塊更大，每個(gè)數(shù)據(jù)塊默認(rèn)128MB;

不支持并發(fā)，同一時(shí)刻只允許一個(gè)寫入者或追加者;

過程一致性,寫入數(shù)據(jù)的傳輸順序與最終寫入順序一致;

Master HA，2.X版本支持兩個(gè)NameNode，(分別處于Active和Standby狀態(tài))，故障切換時(shí)間一般幾十秒到數(shù)分鐘。

HDFS適合的應(yīng)用場景：

適用于大文件、大數(shù)據(jù)處理，處理數(shù)據(jù)達(dá)到 GB、TB、甚至PB級(jí)別的數(shù)據(jù)。

適合流式文件訪問，一次寫入，多次讀取。

文件一旦寫入不能修改，只能追加。

HDFS不適合的場景：

低延時(shí)數(shù)據(jù)訪問。

小文件存儲(chǔ)。

并發(fā)寫入、文件隨機(jī)修改。

4)Swift特點(diǎn)

原生的對(duì)象存儲(chǔ)，不支持實(shí)時(shí)的文件讀寫、編輯功能。

完全對(duì)稱架構(gòu)，無主節(jié)點(diǎn)，無單點(diǎn)故障，易于大規(guī)模擴(kuò)展，性能容量線性增長。

數(shù)據(jù)實(shí)現(xiàn)最終一致性，不需要所有副本寫入即可返回，讀取數(shù)據(jù)時(shí)需要進(jìn)行數(shù)據(jù)副本的校驗(yàn)。

是OpenStack的子項(xiàng)目之一，適合云環(huán)境的部署。

Swift的對(duì)象存儲(chǔ)與Ceph提供的對(duì)象存儲(chǔ)區(qū)別：客戶端在訪問對(duì)象存儲(chǔ)系統(tǒng)服務(wù)時(shí)，Swift要求客戶端必須訪問Swift網(wǎng)關(guān)才能獲得數(shù)據(jù)。而Ceph可以在每個(gè)存儲(chǔ)節(jié)點(diǎn)上的OSD(對(duì)象存儲(chǔ)設(shè)備)獲取數(shù)據(jù)信息; 在數(shù)據(jù)一致性方面，Swift的數(shù)據(jù)是最終一致，而Ceph是始終跨集群強(qiáng)一致性)

5)Lustre特點(diǎn)

支持?jǐn)?shù)萬個(gè)客戶端系統(tǒng)，支持PB級(jí)存儲(chǔ)容量，單個(gè)文件最大支持320TB容量。

支持RDMA網(wǎng)絡(luò)，大文件讀寫分片優(yōu)化，多個(gè)OSS能獲得更高的聚合帶寬。

缺少副本機(jī)制，存在單點(diǎn)故障。如果一個(gè)客戶端或節(jié)點(diǎn)發(fā)生故障，存儲(chǔ)在該節(jié)點(diǎn)上的數(shù)據(jù)在重新啟動(dòng)前將不可訪問。

適用高性能計(jì)算HPC領(lǐng)域，適用于大文件連續(xù)讀寫。

幾種主流分布式存儲(chǔ)技術(shù)的特點(diǎn)比較如下：

責(zé)任編輯：武曉燕來源： twt社區(qū)

容器云分布式存儲(chǔ)哪種更好

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<kbd id="ef7qo"></kbd>