推動標(biāo)準(zhǔn)化、智能化、一體化發(fā)展
北京2024年5月23日 /美通社/ -- 近日,開放計算標(biāo)準(zhǔn)工作委員會(OCTC)正式批準(zhǔn)發(fā)布《數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理要求白皮書》,這是業(yè)界首個針對數(shù)據(jù)中心計算、存儲、網(wǎng)絡(luò)、動力環(huán)境等IT基礎(chǔ)設(shè)施運維的管理要求。
該白皮書由國網(wǎng)智能電網(wǎng)研究院有限公司、中國電子技術(shù)標(biāo)準(zhǔn)化研究院、浪潮信息、中國質(zhì)量認(rèn)證中心、南京大學(xué)、北京信息科技大學(xué)等單位聯(lián)合編制,深入剖析了智能時代數(shù)據(jù)中心基礎(chǔ)設(shè)施管理的標(biāo)準(zhǔn)化、智能化和一體化發(fā)展趨勢,并通過最新智能化實踐案例,為數(shù)據(jù)中心多樣化的基礎(chǔ)設(shè)施運維管理提供了重要的技術(shù)指南。
在大數(shù)據(jù)、云計算、人工智能等技術(shù)的推動下,生產(chǎn)力、生產(chǎn)工具、運營模式被重新改寫,各行各業(yè)對算力和存儲的需求不斷增長,數(shù)據(jù)中心的建設(shè)呈現(xiàn)規(guī)?;?、集約化、多元化發(fā)展,數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件的種類也隨之增多。當(dāng)下,很多數(shù)據(jù)中心設(shè)備規(guī)模已突破10萬,數(shù)據(jù)中心基礎(chǔ)設(shè)施的多樣性和復(fù)雜性增加,架構(gòu)也更加復(fù)雜,不同管理軟件由于缺乏標(biāo)準(zhǔn)接口和統(tǒng)一的管理規(guī)范,難以協(xié)同工作,管理效率低。此外,現(xiàn)有的基礎(chǔ)設(shè)施管理技術(shù)在覆蓋不同行業(yè)客戶應(yīng)用方面存在不足,導(dǎo)致數(shù)據(jù)中心管理軟件無法滿足不同行業(yè)的特殊需求,限制了其應(yīng)用范圍。
《數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理要求白皮書》,旨在解決數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理標(biāo)準(zhǔn)各異、智能化水平低和一體化能力欠缺的問題。該白皮書對數(shù)據(jù)中心基礎(chǔ)設(shè)施管理規(guī)范進(jìn)行了統(tǒng)一的定義,基礎(chǔ)設(shè)施包括數(shù)據(jù)中心計算、存儲、網(wǎng)絡(luò)、動力環(huán)境等,管理功能涵蓋資產(chǎn)管理、監(jiān)控管理、自動化配置、能耗管理、拓?fù)涔芾怼踩婪豆芾怼⒔y(tǒng)計管理、用戶管理、平臺兼容性、平臺可靠性以及平臺高性能等方面。白皮書也詳細(xì)定義了不同功能模塊下的技術(shù)參數(shù)、技術(shù)標(biāo)準(zhǔn)、功能要求等,以此提高數(shù)據(jù)中心運維管理與對應(yīng)平臺軟件的標(biāo)準(zhǔn)化程度,促進(jìn)數(shù)據(jù)中心軟硬件上下游廠商之間的技術(shù)交流和對話。統(tǒng)一要求的制定有利于多元背景下差異化數(shù)據(jù)中心的自動化、規(guī)范化、標(biāo)準(zhǔn)化、智能化管理,提高數(shù)據(jù)中心的管理效率、可靠性和安全性,降低運營成本,推動整個數(shù)據(jù)中心基礎(chǔ)設(shè)施管理的高效發(fā)展。
白皮書指出,面對數(shù)據(jù)中心基礎(chǔ)設(shè)施規(guī)??焖倥噬?、需求日益多樣化的挑戰(zhàn),標(biāo)準(zhǔn)化管理、智能化管理以及一體化、平臺化等成為了數(shù)據(jù)中心演進(jìn)的重要方向。
通過標(biāo)準(zhǔn)化可以幫助運維人員基于標(biāo)準(zhǔn)接口自動化和集中化管理不同品牌和不同類型的設(shè)備,提高效率、降低成本,并增強安全性。白皮書對數(shù)據(jù)中心基礎(chǔ)設(shè)施管理給出了統(tǒng)一的規(guī)范要求,以此提高數(shù)據(jù)中心運維管理與對應(yīng)平臺軟件的標(biāo)準(zhǔn)化程度,促進(jìn)數(shù)據(jù)中心軟硬件上下游廠商之間的技術(shù)交流和對話。
通過人工智能、機器學(xué)習(xí)等先進(jìn)技術(shù)賦能數(shù)據(jù)中心各類基礎(chǔ)設(shè)施的運維管理過程,使其更加智能,提高運維管理效率和穩(wěn)定性。AIOps作為一種將人工智能與IT運維相結(jié)合的新興技術(shù),已被業(yè)界廣泛使用,它可以自動分析和識別基礎(chǔ)設(shè)施產(chǎn)生的異常、故障等問題,使運維管理更加高效、準(zhǔn)確和及時。其次,智能化管理可以實現(xiàn)前瞻性的故障預(yù)測。利用AI的預(yù)測能力,可以提前預(yù)測IT基礎(chǔ)設(shè)施的異常和故障,從而避免故障對業(yè)務(wù)造成影響,進(jìn)一步提高數(shù)據(jù)中心的可靠性。白皮書指出通過對CPU、GPU、I/O讀寫速度等監(jiān)測以及對內(nèi)存、硬盤、風(fēng)扇、PCIe等部件的智能化預(yù)警管理,可以保障數(shù)據(jù)中心的性能最大化并提升數(shù)據(jù)中心中設(shè)備的連續(xù)性,提高運維管理效率和穩(wěn)定性。
一體化、平臺化可以實現(xiàn)數(shù)據(jù)的集成和關(guān)聯(lián)分析,提供統(tǒng)一的管理界面,節(jié)省時間和精力,提高管理效率,同時可以實現(xiàn)更全面的資源管理和協(xié)同運維,提高整體數(shù)據(jù)中心的效能和可靠性。白皮書也指出了大規(guī)模數(shù)據(jù)中心平臺架構(gòu)的構(gòu)成,需要對算力、存儲、網(wǎng)絡(luò)等產(chǎn)品提供一體化的工具。
OCTC《數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理要求白皮書》的發(fā)布,通過管理平臺在架構(gòu)、功能和智能等方面的標(biāo)準(zhǔn)化,為數(shù)據(jù)中心應(yīng)對海量多元基礎(chǔ)設(shè)施運維管理,提供了重要參考。未來,OCTC將持續(xù)推動數(shù)據(jù)中心軟硬件上下游廠商之間的技術(shù)交流和對話,促進(jìn)IT產(chǎn)業(yè)生態(tài)健康發(fā)展。