日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

如何基于Ceph設(shè)計與構(gòu)建一套軟件定義存儲系統(tǒng)( 二 )


日志盤:通用場景下,一般采用SSD或者NVMe盤做Ceph的日志盤,以便降低寫的延時和提高IOPS 。
數(shù)據(jù)盤:由于數(shù)據(jù)最終存儲到數(shù)據(jù)盤上,數(shù)據(jù)盤的個數(shù)、容量、性能(轉(zhuǎn)速等)至關(guān)重要;另外,一般情況下一個HDD對應(yīng)一個OSD 。
在系統(tǒng)擴容的過程中,增加存儲節(jié)點的HDD通常是最常見的選擇 。增加HDD一定會帶來容量的增加和冗余性的增強,也可能會帶來更高的IOPS和吞吐,但會消耗存儲節(jié)點更高的CPU,內(nèi)存及網(wǎng)絡(luò)帶寬,而且會帶來更高的緩存競爭的可能性 。另外,一般情況下,整存儲系統(tǒng)的IO時延會保持不變,不受影響 。
當然,擴容存儲系統(tǒng)還存在另外一個選擇:即增加存儲節(jié)點 。增加存儲節(jié)點會帶來更高的容量、吞吐、IOPS以及更強的冗余性,而時延不受影響 。但能夠增加節(jié)點的個數(shù)取決于網(wǎng)絡(luò)拓撲的限制 。另外,增加加點或者增加HDD通常都會帶來暫時的數(shù)據(jù)再平衡,如果不加控制,可能會影響前端業(yè)務(wù) 。
3) OSD文件系統(tǒng)的選擇:Btrfs VS XFS
XFS由于穩(wěn)定,成熟,并且更方面表現(xiàn)均衡,成為生產(chǎn)環(huán)境下的首選 。Ceph存儲系統(tǒng)中另一種文件系統(tǒng)選擇是Btrfs 。BTRFS有豐富的特性,如壓縮,校驗,CopyOnWrite等; 并且,寫操作的吞吐量通常更高 。但是它的問題是非常消耗CPU ??赡茉诓贿h的將來,Btrfs會成為更多人的選擇 。
4)緩存
根據(jù)Ceph存儲系統(tǒng)的IO路徑來看,Cache通常發(fā)生在三個地方:Client端,存儲節(jié)點的OS緩存,存儲控制器 。
Client端的緩存: 雖然對不會影響寫的性能,但是對讀,尤其是順序讀的性能有非常大的提高 。
存儲節(jié)點的OS緩存: 在沒有設(shè)置Client端緩存的情況下,會對讀性能有提高 。但是如果已經(jīng)使能了Client端緩存,對讀寫性能幫助不大 。
存儲控制器緩存:對于寫性能有很大幫助 。但是緩存本身最好有備用電池支持,否則一旦斷電,會導致緩存中的數(shù)據(jù)丟失 。
5)Journal
一般情況下,采用SSD或者NVMe SSD作為Ceph的Journal盤,采用HDD盤作為數(shù)據(jù)盤,會提高并發(fā)寫或者隨機寫的性能 。但是一旦只存在在Journal盤而沒有落到HDD盤的數(shù)據(jù)超過Journal盤或者分區(qū)的大小,性能則會下降到HDD的水平 。一般情況,為每個OSD進程和數(shù)據(jù)盤,設(shè)置10G~20GB的SSD分區(qū)作為日志 。
另外,SSD作為Journal盤,對讀性能沒有幫助 。另外,由于SSD盤會占據(jù)硬盤或者PCIe插槽,可能會導致存儲密度降低 。
6)HDD
選擇硬盤一般考慮以下幾個方面:
a) 容量 。單個硬盤的容量越大,通常會帶來總?cè)萘亢痛鎯γ芏鹊脑黾?。但是大容量的單盤的價格往往更貴 。
b) 硬盤本身的緩存 。由于Journal盤及其他緩存機制的存在,通常磁盤本身的緩存容量的意義不大 。
c) 轉(zhuǎn)速 。更高的RPM通常會提高IOPS和吞吐,但是也會增加功率消耗 。高性能的情況下一般考慮15K RPM的硬盤 。
d) SMR 。選擇SMR硬盤可以提高單盤的容量,但是寫性能可能會下降 。
7) 冗余:副本 VS 糾刪碼
副本機制,簡單來說,就是保存N個完全相同,與原始數(shù)據(jù)一致的備份 。生產(chǎn)環(huán)境下一般選擇N=3個副本 。采用副本的好處是數(shù)據(jù)可以利用多個數(shù)據(jù)源進行恢復,并且在采用類似條帶(stripe)技術(shù)的情況下,會提高讀性能 。但是對數(shù)據(jù)進行N個副本的復制,會降低寫吞吐,延長寫時延,并增加了Cluster網(wǎng)絡(luò)帶寬的使用率 。當然,最大的影響是容量,N=3的情況下導致用戶數(shù)據(jù)的有效容量為物理容量的三分之一 。
另一種冗余機制是糾刪碼,即把數(shù)據(jù)分為N個部分以及M個校驗碼 。相比副本機制,糾刪碼具有更高的空間使用率,但其代價是更高的I/O時延和更高的CPU使用率,尤其在數(shù)據(jù)重建時,需要消耗更高的CPU以及網(wǎng)絡(luò)帶寬 。

推薦閱讀