北京2024年7月11日 /美通社/ -- 7月9日,在"元腦中國(guó)行"全國(guó)巡展?jié)险旧?,浪潮信息發(fā)布AIStation 人工智能開(kāi)發(fā)平臺(tái)V5升級(jí)版,具備全面的大模型流程支持能力,幫助企業(yè)用戶(hù)降低構(gòu)建大模型微調(diào)任務(wù)門(mén)檻,提供標(biāo)準(zhǔn)、安全的大模型推理服務(wù),并針對(duì)大模型業(yè)務(wù)資源需求優(yōu)化了集群管理功能,助力行業(yè)客戶(hù)快速開(kāi)展大模型業(yè)務(wù)創(chuàng)新與落地,獲得穩(wěn)定、高效、易用、高精度的大模型服務(wù)。
隨著大模型技術(shù)與產(chǎn)業(yè)化發(fā)展的快速迭代,企業(yè)用戶(hù)在大模型開(kāi)發(fā)和應(yīng)用的過(guò)程中面臨諸多新的挑戰(zhàn)。一方面,用戶(hù)在大模型微調(diào)過(guò)程通常會(huì)遇到環(huán)境算法配置復(fù)雜、模型結(jié)構(gòu)多樣適配繁瑣、算力資源管理難等問(wèn)題,模型精度難以提升;另一方面,在部署本地化、私有化大模型時(shí),會(huì)面臨部署經(jīng)驗(yàn)不足、性能優(yōu)化瓶頸、算力資源利用不合理等挑戰(zhàn),難以在保障數(shù)據(jù)與業(yè)務(wù)隱私的條件下構(gòu)建和使用本地化大模型應(yīng)用。
AIStation V5版本功能全面升級(jí),支持端到端的大模型開(kāi)發(fā)流程,新增適配50+大模型結(jié)構(gòu),內(nèi)置10+微調(diào)數(shù)據(jù)集和20+可配置參數(shù)項(xiàng),提供低代碼大模型微調(diào)能力,讓用戶(hù)一鍵提交任務(wù)、統(tǒng)一管理任務(wù),低門(mén)檻構(gòu)建大模型微調(diào)任務(wù)、優(yōu)化模型性能。同時(shí),針對(duì)大模型算力資源占用高、訓(xùn)練穩(wěn)定性難保障的問(wèn)題,AIStation V5升級(jí)了針對(duì)大模型訓(xùn)練與微調(diào)的分布式任務(wù)一鍵配置能力,幫助用戶(hù)高效、穩(wěn)定地進(jìn)行大模型微調(diào)。
AIStation V5集成了高性能推理服務(wù)框架,同等算力大模型批量推理服務(wù)承載量較原生部署方式提升1-3倍。通過(guò)對(duì)算力、服務(wù)、業(yè)務(wù)訪問(wèn)的全方位治理,以及多樣化的推理服務(wù)部署機(jī)制,AIStation V5可以滿(mǎn)足不同場(chǎng)景下用戶(hù)自研模型的部署需求,讓用戶(hù)能夠在大規(guī)模集群內(nèi)更加細(xì)粒度的分配調(diào)度算力,部署和使用不同來(lái)源、不同結(jié)構(gòu)、不同規(guī)模的大模型推理服務(wù),就像在本地部署單個(gè)大模型、傳統(tǒng)AI應(yīng)用與服務(wù)一樣簡(jiǎn)單。
此外,AIStation V5針對(duì)大模型業(yè)務(wù)特點(diǎn)持續(xù)優(yōu)化集群管理核心功能,支持平臺(tái)管控的數(shù)據(jù)模型下載任務(wù)管理和導(dǎo)入流程,實(shí)現(xiàn)了分鐘級(jí)大模型訓(xùn)練異常自動(dòng)恢復(fù),能夠有效降低大模型相關(guān)業(yè)務(wù)的人力投入和管理成本;優(yōu)化升級(jí)算力池化與分配策略,實(shí)現(xiàn)多團(tuán)隊(duì)開(kāi)發(fā)人員共用流程、共享環(huán)境,開(kāi)發(fā)者與算力高效協(xié)同,助力企業(yè)客戶(hù)提升各類(lèi)AI創(chuàng)新業(yè)務(wù)的整體效率。
浪潮信息AIStation是面向企業(yè)級(jí)訓(xùn)練與推理場(chǎng)景開(kāi)發(fā)的人工智能開(kāi)發(fā)平臺(tái),實(shí)現(xiàn)從模型開(kāi)發(fā)、訓(xùn)練、部署、測(cè)試、發(fā)布、服務(wù)的全流程一站式高效交付。通過(guò)統(tǒng)一管理計(jì)算資源、數(shù)據(jù)資源、深度學(xué)習(xí)軟件棧資源,以及支持大模型業(yè)務(wù)全鏈條,AIStation能夠?yàn)槠髽I(yè)用戶(hù)提供敏捷高效的一體化AI平臺(tái),加快AI開(kāi)發(fā)應(yīng)用創(chuàng)新落地。