OCP China Day 2019: 開放計算浪潮下OCP的堅守與變革
毋庸置疑,我們現(xiàn)在處于一個計算多樣化的時代,面對紛繁復雜的工作負載,企業(yè)需要多樣化的算力支持。而作為算力的承載體,數(shù)據(jù)中心也在面臨變革,比如超大規(guī)模數(shù)據(jù)中心不斷涌現(xiàn),部署在大型云數(shù)據(jù)中心的服務(wù)器出貨量呈現(xiàn)快速增長。同時,隨著物聯(lián)網(wǎng)的發(fā)展,邊緣計算數(shù)據(jù)中心成為業(yè)界的關(guān)注焦點。
面對不斷變化的市場,OCP開放計算社區(qū)以開放開源的形式,將最領(lǐng)先的數(shù)據(jù)中心實現(xiàn)標準化、產(chǎn)業(yè)化,從而加快整個行業(yè)的變革進程。OCP的理念是在大量的實踐中總結(jié)出最佳實踐方案,并將這些最佳實踐方案標準化、通用化,推廣到整個數(shù)據(jù)中心行業(yè)。
OCP主要成員企業(yè)都是大型互聯(lián)網(wǎng)運營商、方案提供商,是數(shù)據(jù)中心創(chuàng)新的主要推動力量,成員企業(yè)在實際應(yīng)用中提出創(chuàng)新方案,將IP提交到OCP,然后進行公示、升級,經(jīng)過十分漫長的過程,才會成為一個新的技術(shù)標準,開放、嚴密而漫長的流程,保證了OCP開放標準的普適性、實用性。
近日,由OCP基金會和OCP鉑金成員浪潮聯(lián)合主辦OCP China Day(開放計算中國日)在北京舉行,大會分享了Open Rack下一代整機柜服務(wù)器、OpenRMC下一代數(shù)據(jù)中心管理統(tǒng)一框架、SONiC開放網(wǎng)絡(luò)、人工智能、邊緣計算等前沿技術(shù)話題。
筆者親臨現(xiàn)場,深深感受到OCP China Day 2019涉及的話題非常廣闊,從整機柜架構(gòu)、OAI、OCP開放邊緣計算、OCP軟件等,開放計算產(chǎn)業(yè)蓬勃發(fā)展,OCP成員不斷創(chuàng)新實踐,推動數(shù)據(jù)中心產(chǎn)業(yè)的發(fā)展。
正如OCP CTO Bill Carter所言,OCP是一個開放的社區(qū),依靠合作伙伴協(xié)作創(chuàng)新。OCP成立之初聚焦云計算,傳統(tǒng)數(shù)據(jù)中心,但是隨著技術(shù)發(fā)展和產(chǎn)業(yè)演進,OCP希望與更多的企業(yè)一起突破傳統(tǒng)數(shù)據(jù)中心的界限,擴展到邊緣,共同打造一個開放的計算產(chǎn)業(yè)生態(tài)。
浪潮高級技術(shù)總監(jiān)郭洪昌則表示,未來是開放計算的時代,浪潮一直在積極的推動全球開放計算生態(tài)的發(fā)展。浪潮是全球三大開放計算社區(qū)OCP、ODDC和OPEN19的共同成員,浪潮從貢獻IP,參與開發(fā)標準到主導標準制定,在開放硬件社區(qū)中的參與度越來越高,先后貢獻了首批基于Open19標準的服務(wù)器、第一款OCP標準基于Intel Skylake平臺的主板、第一款Olympus四路服務(wù)器。同時,浪潮還參與了OCP OAM項目,牽頭成立了OpenRMC項目,開發(fā)完成了全球第一個基于OCP標準的整機柜管理架構(gòu)。
開放計算蓬勃發(fā)展
眾所周知,硬件的更新遠遠慢于軟件,因為硬件的更新需要整個產(chǎn)業(yè)生態(tài)的更新。硬件技術(shù)的研發(fā)不僅昂貴而且緩慢,因此標準的可行性、可持續(xù)性就成為一個十分關(guān)鍵的產(chǎn)業(yè)問題,一個優(yōu)秀的標準可以更好地保護用戶的既有技術(shù)投資,實現(xiàn)更好的業(yè)務(wù)靈活性。
經(jīng)過8年時間發(fā)展,OCP開放計算社區(qū)現(xiàn)在已經(jīng)是全球最大硬件開源社區(qū)之一,擁有數(shù)據(jù)中心基礎(chǔ)設(shè)施、服務(wù)器、存儲、硬件管理等10個技術(shù)項目組,并制定了不同領(lǐng)域的眾多開放標準,這些開放標準在業(yè)內(nèi)有著廣泛的影響力。
Bill表示,OCP比較注重創(chuàng)建新的技術(shù)標準和規(guī)范,以滿足效率和可擴展性的目標。這些標準規(guī)范跟設(shè)計文件可以在社區(qū)成員以及業(yè)界共同分享,他們基于這些設(shè)計文件進一步創(chuàng)新,比如設(shè)計產(chǎn)品。除了這些,OCP也與業(yè)界成員進行白皮書發(fā)布、測試驗證、產(chǎn)品和技術(shù)標注認證和案例研究等。
在整機柜方面,Open Rack已經(jīng)成為互聯(lián)網(wǎng)企業(yè)和電信運營商企業(yè)解決部署密度、能效等技術(shù)挑戰(zhàn)的重要解決之道。面對新的技術(shù)發(fā)展趨勢和用戶業(yè)務(wù)需求,Open Rack 3.0整機柜服務(wù)器規(guī)范備受期待。相比上一個版本,Open Rack 3.0加了液冷散熱,整機柜功率提高到15-33KW,增加了48V直流供電,能效進一步提高,另外,高度從41OU增加到44OU,提高了空間利用率,并且調(diào)整了內(nèi)部結(jié)構(gòu),為I/O、存儲等單項功能的擴展預(yù)留了空間。
整機柜產(chǎn)品在運營商、互聯(lián)網(wǎng)廠商、云計算提供商等頗受青睞,因為依靠整機柜產(chǎn)品可以極大提升服務(wù)器的部署速度。比如在百度順義數(shù)據(jù)中心,浪潮向百度交付了最新一批整機柜服務(wù)器,涉及節(jié)點超過1萬臺,交付過程為8小時,相當于每2.88秒1臺服務(wù)器,刷新了業(yè)界服務(wù)器交付最高速度。
為了順應(yīng)當前云計算的深入發(fā)展,浪潮與英特爾還聯(lián)合向OCP社區(qū)提交了全球首款面向云計算場景優(yōu)化的高密度四路服務(wù)器參考設(shè)計Crane Mountain(NF8260M5),這個全新設(shè)計將為云計算的IaaS平臺提供計算能力更強、密度更高的解決方案。
除了互聯(lián)網(wǎng)廠商和云計算提供商,電信行業(yè)也是OCP設(shè)計部署增速最快的領(lǐng)域之一。當前電信行業(yè)正處于轉(zhuǎn)型期,部署基于云的技術(shù),如軟件定義網(wǎng)絡(luò)和網(wǎng)絡(luò)功能虛擬化,成為趨勢,而OCP的理念正好合乎了這種趨勢。
在數(shù)據(jù)中心管理方面,OCP正在構(gòu)建下一代數(shù)據(jù)中心管理架構(gòu),Open Firmware、OpenRMC等項目就是為了適應(yīng)新一代云計算基礎(chǔ)架構(gòu)發(fā)展需求而推出。Open Firmware項目是發(fā)展敏捷、開放、標準的固件設(shè)計規(guī)范來適應(yīng)新一代云計算基礎(chǔ)架構(gòu)發(fā)展需求。基于這個規(guī)范的開源套件包括最基本的平臺代碼來識別白盒硬件,同時用Intel FSP發(fā)展可構(gòu)建和引導的白盒硬件系統(tǒng),形成軟硬一體化的Open Firmware生態(tài)。
而OpenRMC正在致力于OpenBMC與Redfish的融合,形成下一代數(shù)據(jù)中心管理的統(tǒng)一框架,該項目由浪潮牽頭成立。OpenBMC是Linux社區(qū)項目,意在解決閉源的BMC以及相關(guān)的軟件包標準不一的問題。Redfish是替代IPMI的下一代數(shù)據(jù)中心管理規(guī)范。OpenRMC項目希望能夠解決兩個標準之間的互操作性等一系列問題,并建立協(xié)同機制,形成規(guī)范,推進下一代數(shù)據(jù)中心管理技術(shù)和產(chǎn)業(yè)的發(fā)展。
可以預(yù)見的是OpenRMC 與Open Firmware將為下一代數(shù)據(jù)中心構(gòu)筑起開放、標準、靈活的統(tǒng)一管理技術(shù)生態(tài),從而幫助業(yè)界在數(shù)據(jù)中心管理方面開辟一片新天地。
當前計算在變革,網(wǎng)絡(luò)等也在革新。每隔一年,數(shù)據(jù)中心網(wǎng)絡(luò)速度就會使吞吐量翻倍,從10Gbps增長到40Gb再到100Gb。SONiC是微軟發(fā)布的開源交換機操作系統(tǒng),是一個成熟的SDN軟件平臺。SONiC是構(gòu)建網(wǎng)絡(luò)設(shè)備(如交換機)所需功能的軟件集合,通過交換機換抽象接口(SAI)運行在不同的ASIC平臺,改變軟件策略和拓撲實現(xiàn)新的網(wǎng)絡(luò)架構(gòu),讓網(wǎng)絡(luò)實踐更為靈活,這推動了OCP社區(qū)以及其他廠商在開放網(wǎng)絡(luò)方面的創(chuàng)新。
阿里巴巴就通過SONiC的大規(guī)模部署實現(xiàn)了高帶寬和低延遲,而且阿里巴巴基于SONiC做了大量的個性化開發(fā),這些工作很好地推動了阿里巴巴的業(yè)務(wù)創(chuàng)新。此外,阿里巴巴還聯(lián)合百度、騰訊等公司推動了ODCC鳳凰項目的成立。ODCC鳳凰項目就是以SONiC開源社區(qū)為依托,打造網(wǎng)絡(luò)生態(tài)發(fā)展,促進國內(nèi)開放網(wǎng)絡(luò)和SDN網(wǎng)絡(luò)的進步。
綜上所述,OCP、ODCC等開源組織推動的開放計算不斷壯大,相關(guān)項目不斷豐富和成熟,推動了數(shù)據(jù)中心產(chǎn)業(yè)的發(fā)展。社區(qū)成員之間通過不斷協(xié)作創(chuàng)新,構(gòu)建了良性循環(huán)的產(chǎn)業(yè)生態(tài)。
新技術(shù)驅(qū)動不斷革新
數(shù)據(jù)中心變革的直接動力是大型化和現(xiàn)代化,而新興的業(yè)務(wù)需求,如云計算、大數(shù)據(jù)和人工智能也在驅(qū)動數(shù)據(jù)中心的變革,這些都對數(shù)據(jù)中心提出了更高的要求。OCP社區(qū)也在積極擁抱這些新技術(shù),從而讓開放計算下的數(shù)據(jù)中心更好地承載這些工作負載。
人工智能的發(fā)展推動了一系列面向深度學習、機器學習以及高性能計算等應(yīng)用的異構(gòu)加速方案的發(fā)展,加速器硬件系統(tǒng)的技術(shù)挑戰(zhàn)和設(shè)計復雜性很大,將加速器集成到系統(tǒng)中通常更是需要較長的開發(fā)周期;诖,OCP社區(qū)在服務(wù)器項目組下設(shè)立了OAI(Open Accelerator Infrastructure)小組,負責開發(fā)OAM(OCP Accelerator Module)規(guī)范,將加速器模塊標準化,簡化AI基礎(chǔ)架構(gòu)的設(shè)計,縮短硬件設(shè)計周期。
當前公布的OAM標準,是由參與OCP開放計算項目的百度、微軟、Facebook三家國際AI領(lǐng)先企業(yè)聯(lián)合定義,集合定義了AI硬件加速模塊本身、主板、互聯(lián)拓撲、機箱、供電、散熱以及系統(tǒng)管理等系列設(shè)計規(guī)范,主要目標是通過模塊化、標準化來增強不同AI硬件加速模塊和系統(tǒng)的互操作性,加速新的AI硬件加速模塊的落地和應(yīng)用。
此外,騰訊和浪潮也宣布將T-Flex2.0規(guī)范貢獻給OCP社區(qū),該規(guī)范并不僅著眼于異構(gòu)加速的規(guī)范設(shè)計,而是基于I/O池化技術(shù),通過服務(wù)器不同模塊的解耦重組,實現(xiàn)服務(wù)器的模塊化迭代和靈活組合,用戶可以基于該規(guī)范,可以實現(xiàn)異構(gòu)加速、冷存儲、HPC集群等各類不同的應(yīng)用方案。
5G應(yīng)用將給數(shù)據(jù)中心帶來新的發(fā)展契機,各類邊緣數(shù)據(jù)中心將大量出現(xiàn),與大規(guī)模云數(shù)據(jù)中心一起成為重要社會基礎(chǔ)設(shè)施。面對5G和邊緣計算浪潮,OCP社區(qū)在電信項目組設(shè)立了Open Edge技術(shù)小組,為邊緣計算服務(wù)器等硬件設(shè)施開發(fā)一套公開標準。
諾基亞已經(jīng)貢獻了Open Edge Chassis Specification v1.2標準,該標準以3U高度、19英寸寬度和430mm深度的機箱為基本部署單元,機箱可以支持高度為1U和2U的擴展節(jié)點,每個節(jié)點的寬度可以為半寬、1/4寬和全寬,機箱最大供電功率2000W,支持AC和DC兩種供電模式,可以兼容邊緣計算、遠端邊緣計算等各類部署環(huán)境。
浪潮也展示了兩款邊緣計算服務(wù)器,它們可以直接與電信設(shè)備混合部署在通信中心機架上。同時,也針對邊緣機房進行了大量的適應(yīng)性設(shè)計,在耐高溫、防塵、耐腐蝕、電磁兼容、抗震等方面可以滿足極端環(huán)境的部署需求。
如上所述,我們看到OCP在不斷延展開放計算的內(nèi)涵和外延,通過與時俱進,OCP能夠讓數(shù)據(jù)中心承載更多樣化的工作負載,緊跟技術(shù)發(fā)展,滿足用戶需求。不管是AI,還是5G,或者邊緣計算,OCP不會缺席,積極融入到技術(shù)的滾滾洪流中。
結(jié)語
數(shù)據(jù)經(jīng)濟不斷發(fā)展,業(yè)界對于算力的需求不斷激增。數(shù)據(jù)中心的作用變得舉足輕重,OCP聚焦開放計算,通過協(xié)作創(chuàng)新,賦予開放計算更多使命,推動整個計算產(chǎn)業(yè)的發(fā)展。展望未來,OCP的發(fā)展值得期待。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
