北京2022年9月1日 /美通社/ -- 從快捷支付到智能門禁,智能手機(jī)到服務(wù)機(jī)器人,不知不覺中,3D視覺感知技術(shù)已經(jīng)深入到我們的生活,成為智能設(shè)備感知環(huán)境、進(jìn)行智能交互的共性技術(shù)。為了加速3D視覺感知技術(shù)與AI技術(shù)的融合,滿足AIoT、3D掃描、服務(wù)機(jī)器人等典型應(yīng)用場景的AI訓(xùn)練需求,奧比中光與浪潮信息合作構(gòu)建面向3D視覺感知的AI訓(xùn)練平臺(tái),強(qiáng)化3D視覺算法訓(xùn)練能效,加速智慧3D視覺應(yīng)用的創(chuàng)新迭代。
通過浪潮 AI 服務(wù)器和浪潮AIStation軟硬件一體化的方案組合,奧比中光實(shí)現(xiàn)了計(jì)算節(jié)點(diǎn)、數(shù)據(jù)存儲(chǔ)的敏捷擴(kuò)容,滿足3D視覺訓(xùn)練不斷增長的AI算力以及數(shù)據(jù)存儲(chǔ)業(yè)務(wù)需求,幫助奧比中光將樣本數(shù)據(jù)獲取效率平均提升30%,提升算法人員對(duì)比驗(yàn)證實(shí)驗(yàn)的工作效率,并縮短訓(xùn)練周期以及簡化運(yùn)維工作。
3D視覺算法訓(xùn)練面臨多重挑戰(zhàn)
奧比中光以"讓所有終端都能看懂世界"為使命,構(gòu)建起"全棧式技術(shù)研發(fā)能力+全領(lǐng)域技術(shù)路線布局"的 3D視覺感知技術(shù)體系,在技術(shù)上縱向?qū)θ溌芳夹g(shù)進(jìn)行全棧式自主研發(fā),橫向?qū)Y(jié)構(gòu)光、iToF、雙目、dToF、Lidar、工業(yè)三維測量進(jìn)行全領(lǐng)域布局,是行業(yè)領(lǐng)先的3D視覺感知整體技術(shù)方案提供商。
人類約70%的信息是通過人眼獲取,未來的機(jī)器人也將和人類一樣,大量信息都將通過視覺感知技術(shù)獲取。然而,現(xiàn)實(shí)物理世界是三維的,傳統(tǒng)相機(jī)、攝像機(jī)的2D成像技術(shù)是無法完整重現(xiàn)各類三維場景的,因此需要通過3D視覺感知技術(shù)讓終端獲取更多精準(zhǔn)的三維信息,從而"看懂"真實(shí)世界。
3D 視覺與 2D視覺技術(shù)的最大區(qū)別在于處理的數(shù)據(jù)類型不同。在 3D 視覺領(lǐng)域,被處理的對(duì)象通常是依靠 3D 傳感器采集到的三維點(diǎn)云數(shù)據(jù),而 2D 視覺技術(shù)主要被用于處理平面圖像里的信息。這決定了 3D 視覺不僅能夠感知場景中物體的有無,還賦予了機(jī)器捕捉真實(shí)世界空間、人體、物體的三維信息的能力,讓終端設(shè)備具有類似人眼感知環(huán)境的能力。
3D視覺感知給各行業(yè)帶來不同的創(chuàng)新應(yīng)用,背后離不開AI技術(shù)的加持。AI 和3D視覺感知技術(shù)的結(jié)合可幫助計(jì)算機(jī)更好地進(jìn)行空間、人體和物體的數(shù)字重建,縮小物理空間與虛擬世界的差距,是促使 AI 更廣泛應(yīng)用的關(guān)鍵共性技術(shù)。配合AI算法能夠?qū)崿F(xiàn)多種2D成像技術(shù)難以實(shí)現(xiàn)的功能,使得骨架跟蹤、數(shù)字孿生、AR交互、三維重建、自主定位導(dǎo)航等應(yīng)用有更好并精準(zhǔn)的體驗(yàn)。
3D視覺感知技術(shù)與 AI 的融合應(yīng)用也帶來了算力方面的挑戰(zhàn)。這一方面是由于,3D視覺數(shù)據(jù)比2D視覺數(shù)據(jù)提高了不止一個(gè)數(shù)據(jù)量級(jí),AI算法訓(xùn)練也需要更高的算力支撐,對(duì)3D視覺訓(xùn)練平臺(tái)的算力、存儲(chǔ)及集群資源調(diào)度都是一個(gè)挑戰(zhàn)。以奧比中光為例,算法人員在使用圖片樣本進(jìn)行訓(xùn)練時(shí),由于樣本數(shù)據(jù)集規(guī)模高達(dá)1TB左右,網(wǎng)絡(luò)傳輸?shù)接?jì)算節(jié)點(diǎn)時(shí)間需要2-3小時(shí),導(dǎo)致整體訓(xùn)練過程較長。
此外,高效的AI算法訓(xùn)練有賴于敏捷的算力資源管理。奧比中光需要根據(jù)不同的場景訓(xùn)練不同的算法,這些算法對(duì)AI算力的需求在規(guī)模、時(shí)間等方面存在著差異,固定的算力資源分配將會(huì)導(dǎo)致資源浪費(fèi)、資源不足等問題。要想充分利用算力資源,就需要簡單、易用、高效的AI訓(xùn)練平臺(tái),對(duì)資源進(jìn)行敏捷分配,同時(shí)簡化運(yùn)維管理。
浪潮AI整體解決方案給3D視覺訓(xùn)練裝上"助推器"
浪潮信息為奧比中光提供了AI服務(wù)器NF5488A5、NF5468M6和浪潮 AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺(tái)的整體解決方案組合,不僅提供了AI算力,同時(shí)實(shí)現(xiàn)了AI計(jì)算集群的敏捷管理,支撐三維重建、人體骨架、人像摳圖、 深度恢復(fù)、定位感知、模型量化、圖像超分辨率、圖像風(fēng)格遷移、圖像生成等應(yīng)用創(chuàng)新。
浪潮AI服務(wù)器為奧比中光提供了業(yè)內(nèi)領(lǐng)先的GPU服務(wù),滿足大模型、自監(jiān)督模型的算法需求,支持多種網(wǎng)絡(luò),采用存算分離架構(gòu),保證GPU資源的高效利用。另外,采用了多級(jí)存儲(chǔ)架構(gòu),優(yōu)化性能和性價(jià)比,搭配浪潮AIStation實(shí)現(xiàn)多種算力資源的可視化管理。
浪潮AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺(tái)是浪潮面向人工智能企業(yè)訓(xùn)練與推理場景開發(fā)的高效人工智能資源平臺(tái),支持私有化部署,實(shí)現(xiàn)從模型開發(fā)、訓(xùn)練、部署、測試、發(fā)布、服務(wù)的全流程一站式高效交付,有效的解決奧比中光原有計(jì)算平臺(tái)的數(shù)據(jù)孤島、計(jì)算資源分散、開發(fā)軟件棧重復(fù)構(gòu)建等問題。通過對(duì)計(jì)算資源、數(shù)據(jù)資源、深度學(xué)習(xí)軟件棧資源進(jìn)行統(tǒng)一管理,AIStation為環(huán)境構(gòu)建、模型開發(fā)、模型訓(xùn)練、模型評(píng)估、模型推理、上線部署全鏈條全面提速,助力用戶加快AI開發(fā)應(yīng)用創(chuàng)新。
AIStation的GPU池化和GPU細(xì)粒度調(diào)度功能,幫助奧比中光將顯著提升了集群資源利用率,不僅滿足不同3D視覺算法訓(xùn)練的算力需求,減少了GPU資源的空置率,而且降低了算力成本。奧比中光通過AIStation的一站式人工智能開發(fā)和分布式自適應(yīng)優(yōu)化能力,在提升業(yè)務(wù)效率的同時(shí)簡化了運(yùn)維管理。
以奧比中光的在人體骨骼智能檢測為例,浪潮AI解決方案在研發(fā)階段實(shí)現(xiàn)數(shù)據(jù)共享和便捷鏡像環(huán)境制作,為對(duì)比實(shí)驗(yàn)及參數(shù)調(diào)試提供支持;在訓(xùn)練階段,通過資源優(yōu)化分配和托管訓(xùn)練方式,為高效完成訓(xùn)練任務(wù)和結(jié)果復(fù)現(xiàn)提供保證;在部署階段,AIStation的多種AI框架支持,使得項(xiàng)目在多平臺(tái)、多芯片的實(shí)現(xiàn)更加便捷快速,高效部署三維人體骨骼檢測應(yīng)用,滿足"虛擬人"生成等元宇宙創(chuàng)新應(yīng)用的大規(guī)模AI算力需求。
3D視覺感知技術(shù)與AI技術(shù)的融合是智算時(shí)代的重要趨勢,浪潮AI服務(wù)器和浪潮AIStation平臺(tái)通過強(qiáng)大的算力性能、卓越的分布式自適應(yīng)優(yōu)化能力與算力資源管理能力,為智能3D視覺技術(shù)的深度應(yīng)用提供有力支撐,讓越來越多的機(jī)器看懂三維世界。