北京2023年2月2日 /美通社/ -- 數(shù)字時(shí)代,數(shù)據(jù)共享互通成為剛需
數(shù)字經(jīng)濟(jì)時(shí)代,云計(jì)算、大數(shù)據(jù)、人工智能等新技術(shù)快速發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式增長,數(shù)據(jù)類型變得愈發(fā)復(fù)雜多樣。在自動(dòng)駕駛、基因測序、氣象預(yù)報(bào)等云數(shù)智應(yīng)用場景中,一次數(shù)據(jù)處理可能會涉及到文件、對象、大數(shù)據(jù)等多種協(xié)議,數(shù)據(jù)間的互通轉(zhuǎn)換成為數(shù)據(jù)存儲中至關(guān)重要的一環(huán),具備平臺化能力的融合存儲成為數(shù)字基礎(chǔ)設(shè)施建設(shè)的核心。
以基因測序場景為例,一次完整的基因測序涉及到數(shù)據(jù)采集、格式化、脫敏、壓縮、分析、發(fā)布等操作,其過程可以大致分為樣本采集、DNA/RNA測序、數(shù)據(jù)分析和發(fā)布四個(gè)步驟。在不同的處理階段,需要使用不同的數(shù)據(jù)協(xié)議進(jìn)行操作。其中在樣本采集和DNA/RNA測序階段采用NFS文件協(xié)議,數(shù)據(jù)分析階段采用HDFS大數(shù)據(jù)協(xié)議,數(shù)據(jù)發(fā)布階段則是通過公網(wǎng)數(shù)據(jù)共享采用S3對象協(xié)議。整個(gè)數(shù)據(jù)處理過程涉及三種協(xié)議格式,這就意味著完成一次基因的測序流程需要在NFS、HDFS和S3之間進(jìn)行兩次數(shù)據(jù)拷貝和數(shù)據(jù)格式的轉(zhuǎn)換。傳統(tǒng)存儲僅支持單一的訪問協(xié)議,這就會造成兩個(gè)問題:一是數(shù)據(jù)格式轉(zhuǎn)換和數(shù)據(jù)拷貝會降低整個(gè)數(shù)據(jù)處理流程的效率;二是多套存儲副本增加存儲空間成本。
百川入海:浪潮基于一套存儲 承載多樣化數(shù)據(jù)
浪潮分布式存儲平臺AS13000基于對非結(jié)構(gòu)化數(shù)據(jù)協(xié)議(NFS/CIFS/HDFS/S3)融合互通的研究進(jìn)行技術(shù)創(chuàng)新,采用統(tǒng)一的數(shù)據(jù)管理和元數(shù)據(jù)管理、統(tǒng)一的增值特性服務(wù)、統(tǒng)一的分布式存儲資源池和統(tǒng)一的管理軟件系統(tǒng),保證各種協(xié)議共享同一份數(shù)據(jù)和元數(shù)據(jù)。訪問過程中無需數(shù)據(jù)轉(zhuǎn)換和拷貝,并且為每種協(xié)議提供原生語義服務(wù),每種服務(wù)均可直接訪問,無需安裝網(wǎng)關(guān)、插件或在計(jì)算側(cè)或應(yīng)用層進(jìn)行改造。
基于"多合一"極簡架構(gòu),浪潮分布式存儲得以實(shí)現(xiàn)四個(gè)"統(tǒng)一"。
首先,提供統(tǒng)一的數(shù)據(jù)管理和元數(shù)據(jù)管理。
數(shù)據(jù)管理和元數(shù)據(jù)管理是非結(jié)構(gòu)化數(shù)據(jù)存儲的關(guān)鍵,浪潮分布式存儲平臺AS13000根據(jù)NFS、CIFS、HDFS和S3的語義和元數(shù)據(jù)特點(diǎn),抽象各協(xié)議的數(shù)據(jù)和元數(shù)據(jù)操作,通過一套統(tǒng)一的非結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)管理架構(gòu)有效地保證各協(xié)議的原生訪問。
其次,提供統(tǒng)一的增值特性服務(wù)。
基于統(tǒng)一的數(shù)據(jù)訪問接口和元數(shù)據(jù)管理的架構(gòu)設(shè)計(jì),浪潮AS13000對外提供統(tǒng)一的增值特性服務(wù),包括統(tǒng)一配額、QoS、加密、壓縮、快照、回收站、分級存儲、遠(yuǎn)程復(fù)制、元數(shù)據(jù)檢索等等。
以下圖為例:同一個(gè)元數(shù)據(jù)檢索服務(wù)ElasticSearch支持NFS、CIFS、S3、HDFS多種協(xié)議,并且各協(xié)議為同一配置入口和查詢?nèi)肟凇?/p>
再次,構(gòu)建統(tǒng)一的分布式存儲資源池。
AS13000支持NFS/CIFS/HDFS/S3等多種服務(wù)協(xié)議共享非結(jié)構(gòu)化存儲資源池,并且同一個(gè)文件不同協(xié)議訪問的數(shù)據(jù)和元數(shù)據(jù)為同一份。例如,通過文件NFS協(xié)議寫入的一個(gè)文件,通過對象存儲AWS S3協(xié)議、大數(shù)據(jù)HDFS協(xié)議和文件CIFS協(xié)議均可讀??;每個(gè)節(jié)點(diǎn)都可以啟動(dòng)文件NAS、大數(shù)據(jù)HDFS和對象存儲S3服務(wù)。
最后,打造統(tǒng)一的管理系統(tǒng)。
管理軟件負(fù)責(zé)集群的安裝、部署、業(yè)務(wù)配置、設(shè)備管理、監(jiān)控、告警等功能。浪潮分布式存儲平臺AS13000打造了融合互通的管理系統(tǒng),可同時(shí)支持NFS/CIFS/HDFS/S3等多種服務(wù)協(xié)議,增值特性通過統(tǒng)一的配置入口對所有非結(jié)構(gòu)化存儲協(xié)議同時(shí)生效,減少了企業(yè)的管理成本。
浪潮分布式存儲平臺AS13000通過多年來的持續(xù)技術(shù)創(chuàng)新,以一份數(shù)據(jù)支持多種協(xié)議訪問,實(shí)現(xiàn)了非結(jié)構(gòu)化數(shù)據(jù)融合互通,在提升數(shù)據(jù)處理效率的同時(shí)降低了存儲購置和運(yùn)維成本,保障各協(xié)議的語義無損和性能無損,構(gòu)筑了面向"云數(shù)智"應(yīng)用的融合存儲平臺,助力企業(yè)數(shù)字化轉(zhuǎn)型,加速釋放數(shù)據(jù)價(jià)值。