新聞資訊
NEWS為極致的視頻體驗(yàn)而設(shè)計(jì):facebook新一代存儲平臺Bryce Canyon架構(gòu)
在 Facebook,我們的存儲需求不斷演進(jìn)。 為了在運(yùn)行工作負(fù)載時(shí)更高效,我們一直致力于優(yōu)化我們的存儲服務(wù)器設(shè)計(jì)。 2013 年,我們與設(shè)計(jì)合作伙伴 Wiwynn 合作,將第一個(gè)存儲機(jī)柜 Open Vault(Knox)提供給開放計(jì)算項(xiàng)目(Open Compute Project),然后在 2015 年利用該設(shè)計(jì)創(chuàng)建了我們的存儲服務(wù)器 Honey Badger,還有 2016 年的 Lightning NVMe 機(jī)柜。
由于重點(diǎn)關(guān)注我們的應(yīng)用程序的視頻體驗(yàn),存儲的工作負(fù)載越來越需要更多的存儲容量和密度。 我們開始設(shè)計(jì)我們的下一代存儲,關(guān)注效率和性能,并于今天宣布,我們最新的存儲平臺 Bryce Canyon 的設(shè)計(jì)規(guī)范現(xiàn)在可通過開放計(jì)算項(xiàng)目(Open Compute Project)獲取。
Bryce Canyon 將主要用于高密度存儲,包括照片和視頻,并提供比 Open Vault 高 20% 的硬盤驅(qū)動器(HDD)密度。它被設(shè)計(jì)為支持更強(qiáng)大的處理器和更大的內(nèi)存,它通過在底盤下方吸入空氣來提高熱和電源效率。
我們的目標(biāo)是建立一個(gè)平臺,不僅能滿足我們今天的需求,還能擴(kuò)展以適應(yīng)未來增長的新模塊。 Bryce Canyon 提供了強(qiáng)大的分類存儲功能,與其他存儲平臺相比可以輕松擴(kuò)展。
Bryce Canyon 存儲系統(tǒng)支持 72 個(gè) 3.5 英寸硬盤(12 Gb SAS/6 Gb SATA)。系統(tǒng)可以配置為單個(gè) 72 驅(qū)動器存儲服務(wù)器,或者作為具有完全獨(dú)立電源的雙 36 驅(qū)動器的存儲服務(wù)器,或作為 36/72 驅(qū)動器的 JBOD(just a bunch of disks,一堆磁盤)。由于它減少了我們將來支持的存儲平臺配置數(shù)量,這種靈活性進(jìn)一步簡化了我們的數(shù)據(jù)中心操作。
當(dāng)配置為存儲服務(wù)器時(shí),Bryce Canyon 支持單或雙 Mono Lake CPU 模塊。我們發(fā)現(xiàn),對于某些工作負(fù)載(如 Web 和存儲),單插槽架構(gòu)更高效,每瓦性能更高;我們以前改變了我們的 Web 層來利用這種架構(gòu),并在 Bryce Canyon 平臺上實(shí)現(xiàn)了相同的 Mono Lake 構(gòu)建塊。
驅(qū)動器連接由存儲控制器卡(SCC)提供,在此迭代中提供 12 Gb SAS / 6 Gb SATA 連接接口。對于前端連接,有一個(gè)包含 OCP 夾層 NIC 的輸入/輸出模塊(IOM),它支持 25 Gb 和 50 Gb 網(wǎng)卡。目前有 IOM 的兩個(gè)變體:一個(gè)具有 2 x 四通道 M.2 模塊,一個(gè)具有12Gb SAS 控制器。通過填充不同的模塊,Bryce Canyon 可以通過多種方式進(jìn)行配置,以優(yōu)化各種用例,如 JBOD,Hadoop,冷存儲等。
Bryce Canyon 完全符合 Open Rack v2 標(biāo)準(zhǔn),并且利用了 OCP 硬件產(chǎn)品中的許多構(gòu)建塊。該系統(tǒng)通過 OpenBMC 進(jìn)行管理,可以兼容 Facebook 數(shù)據(jù)中心中大多數(shù)新硬件的通用管理框架。 CPU 模塊是 Mono Lake 卡,并且支持包括 25 Gb 和 50 Gb OCP 夾層 NIC。
模塊化和靈活的平臺
由于模塊化設(shè)計(jì),未來的平臺可以采用下一代 CPU 模塊,以在新技術(shù)采用時(shí)提高性能。 如果需要其他輸入/輸出接口,可以設(shè)計(jì)一個(gè)新的 I/O 模塊以滿足需要。 通過 16 條 PCIe 通道進(jìn)入 IOM,大量的帶寬可用于支持各種可能性。 該系統(tǒng)設(shè)計(jì)為協(xié)議無關(guān)的,所以如果需要 NVMe 系統(tǒng),存儲控制器卡就可以換成一個(gè)基于 PCIe 交換機(jī)解決方案。
支持不同工作負(fù)載的靈活性
高性能工作負(fù)載
對于大功率配置(如用于我們的某個(gè)分類存儲服務(wù)的配置),Bryce Canyon 配置了兩個(gè) Mono Lake CPU 模塊,以在同一機(jī)箱內(nèi)創(chuàng)建兩個(gè)獨(dú)立的 36 驅(qū)動器存儲服務(wù)器。 除了 OCP 夾層 NIC,此配置中使用的 I/O 模塊支持兩個(gè) PCIe M.2 插槽,四個(gè) PCIe Gen 3 通道。 M.2 插槽可用于緩存或合并寫入。
平衡工作負(fù)載
對于每個(gè)驅(qū)動器需要較少 CPU 性能的存儲系統(tǒng)(由于容量大和讀/寫速率低),可以使用單個(gè) Mono Lake 連接到系統(tǒng)中的所有 72 個(gè)驅(qū)動器。
最大容量
對于需要超過 72 個(gè)驅(qū)動器存儲空間的應(yīng)用程序(例如,存檔用例),您可以將多個(gè) Bryce Canyon JBOD 以菊花鏈形式連接到 Bryce Canyon 頭節(jié)點(diǎn)或外部服務(wù)器。
專用數(shù)據(jù)中心 - 規(guī)?;渴?/span>
由于無工具的設(shè)計(jì),Bryce Canyon 系統(tǒng)可以快速而簡單的上線服務(wù)。 系統(tǒng)中的每個(gè)主要 FRU 可以在不使用工具的情況下更換 - 它們包含在閂鎖或指旋螺釘中。 該設(shè)計(jì)最獨(dú)特的一個(gè)方面是無需工具的驅(qū)動器固定系統(tǒng),不需要任何托架:系統(tǒng)使用閂鎖機(jī)構(gòu)來保持裸驅(qū)動器。為了移除存儲器,閂鎖通過將驅(qū)動器部分地拉出系統(tǒng)來幫助用戶,以便于操作。 該系統(tǒng)大大簡化了部署和維護(hù)。
Bryce Canyon 的設(shè)計(jì)規(guī)范通過開放計(jì)算項(xiàng)目(Open Compute Project)公開提供,全面的硬件設(shè)計(jì)文檔將近期發(fā)布。請關(guān)注高可用架構(gòu)留意后續(xù)文章。
原文來自:高可用架構(gòu)
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。