北京2023年8月31日 /美通社/ -- "大模型的未來在于行業(yè)應(yīng)用",對此業(yè)界已經(jīng)達成了共識,下一步則是如何將大模型在行業(yè)中落地。
于是,我們能夠看到,既前一階段的基礎(chǔ)大模型之后,近來又掀起了行業(yè)大模型的熱潮。據(jù)粗略統(tǒng)計,僅在國內(nèi),已經(jīng)和計劃發(fā)布的大模型就達到上百個。
那么,對于有志于大模型業(yè)務(wù)的IT企業(yè)來說,是不是只有這兩條路可走,是否存在第三條可達路徑呢?
軟通動力給出的答案是:不做通用大模型,而是為行業(yè)客戶提供平臺工具、專業(yè)人才和技術(shù)服務(wù),與他們共創(chuàng)定制化的私有大模型,以此推動大模型行業(yè)應(yīng)用的快速落地。
行業(yè)頭部企業(yè)將扮演重要角色
在第一波熱潮中,大模型的發(fā)布者主要是ICT企業(yè),尤其以互聯(lián)網(wǎng)公司為主導(dǎo)。最近一段時間,各個行業(yè)的頭部企業(yè)也開始參與其中。
IDC前不久發(fā)布的報告預(yù)測,金融行業(yè)、能源行業(yè)等頭部機構(gòu),會率先在1年內(nèi)在相對成熟的場景中嘗試引入大模型。而且,隨著技術(shù)的普及,行業(yè)頭部企業(yè)在該市場的角色,也不再只是最終用戶,而有望成為新一代AI技術(shù)的提供商。
無論作為最終用戶還是技術(shù)提供商,頭部企業(yè)參與行業(yè)大模型的趨勢已經(jīng)建立,因為他們已經(jīng)看到大模型能夠為企業(yè)降本增效,建立起業(yè)務(wù)競爭優(yōu)勢。這些行業(yè)頭部企業(yè),正是軟通動力所長期服務(wù)的客戶,也在大模型領(lǐng)域走在前列。
軟通動力數(shù)字化創(chuàng)新服務(wù)線副總裁霍宇認為,要做好行業(yè)大模型,企業(yè)需要在兩個方面加大投入,一是算力,二是語料。對于算力的重要性,大家已經(jīng)都認識到了,其實語料對于行業(yè)大模型的訓(xùn)練更為重要。
他表示,相比國外,國內(nèi)的語料多集中在企業(yè)內(nèi)部,可以公開獲得的則比較少。因此,他建議,行業(yè)客戶應(yīng)該先"補數(shù)據(jù)的課",把更多預(yù)算投入到提升大模型的輸入質(zhì)量上,這樣不僅不耽誤時間,反而可以節(jié)省成本。
當然,在這一過程中,如何治理數(shù)據(jù)、如何把數(shù)據(jù)語料化、如何更好地訓(xùn)練模型,都將是對企業(yè)能力的考驗。軟通動力正致力于幫助企業(yè)提升這些方面的能力,從而利用大模型來升級數(shù)智化轉(zhuǎn)型戰(zhàn)略,在外部產(chǎn)業(yè)鏈和內(nèi)部企業(yè)管理兩個領(lǐng)域?qū)崿F(xiàn)全面數(shù)字化。
堅持走與客戶共創(chuàng)的路徑
在過去半年時間里,ICT企業(yè)都紛紛加入到大模型產(chǎn)業(yè)當中,發(fā)揮自身專長來獲取一席之地。目前,圍繞大模型的產(chǎn)業(yè)生態(tài)正逐步形成,雖然這一生態(tài)體系仍不穩(wěn)定,處于快速發(fā)展演化的過程中。
霍宇認為,軟通動力不做通用基礎(chǔ)大模型,因為這需要巨額投入,是行業(yè)頭部企業(yè)才能做的;也不會做通用行業(yè)大模型,因為軟通動力雖然懂行業(yè),但缺乏相應(yīng)的數(shù)據(jù)資源。因此,在行業(yè)大模型賽道里,軟通動力堅持走與客戶共創(chuàng)的路徑,為行業(yè)客戶提供數(shù)學(xué)建模、規(guī)則設(shè)定、模型優(yōu)化等服務(wù),幫助他們定制自己的私有大模型。這也可以充分發(fā)揮軟通動力的優(yōu)勢:定制開發(fā)能力強、技術(shù)服務(wù)能力強。
在這一路徑中,軟通動力也堅持生態(tài)合作,在底層基礎(chǔ)設(shè)施和基礎(chǔ)大模型方面,與微軟、華為、亞馬遜、阿里云等巨頭合作——他們原本就是軟通動力的長期戰(zhàn)略伙伴。
在行業(yè)選擇方面,霍宇介紹說,金融、零售兩個行業(yè)是當前的重點。選擇這兩個行業(yè),是因為他們的客戶是個人消費者,數(shù)據(jù)量比較充足,同時也是軟通動力長期服務(wù)的行業(yè),對其業(yè)務(wù)邏輯非常熟悉。
在大模型的規(guī)模方面,軟通動力則側(cè)重在六七十億到一百多億參數(shù)量的行業(yè)大模型,因為這個規(guī)模的大模型最具性價比。
對于大模型這個新鮮事物,很多行業(yè)頭部企業(yè)都表達出了強烈的興趣,但需求并不明確,目前仍處于嘗試階段。對此,軟通動力決定自己先探路,今年在基礎(chǔ)算力方面預(yù)計會投入近億元,同時,搭建服務(wù)工具平臺,讓工程師們?nèi)?quot;練手"。"未來還會繼續(xù)加大投入力度。"霍宇表示。
目前,行業(yè)大模型相對成熟的應(yīng)用場景是軟件開發(fā)和知識管理,其中軟件開發(fā)是公司的主要業(yè)務(wù)。軟通動力正在利用大模型,來優(yōu)化軟件工程研發(fā)及測試效率,爭取在年內(nèi)實現(xiàn)提效30%的目標。在知識管理方面,軟通動力則開發(fā)了律師行業(yè)助手類應(yīng)用LawCopilot,幫助律師進行文獻檢索、案例分析、錄音分析和法律咨詢。
不過,霍宇強調(diào)說,目前to B大模型的行業(yè)應(yīng)用都處于Copilot的階段,即輔助人工進行駕駛,而達不到脫離人工的完全自動駕駛。
圍繞工具和人才進行能力打造
與傳統(tǒng)ICT生態(tài)類似,在大模型生態(tài)系統(tǒng)中,技術(shù)服務(wù)商扮演著為客戶提供貼身服務(wù)的關(guān)鍵角色。
IDC也認為,提供各種工具和服務(wù),是大模型技術(shù)廠商的集中發(fā)力方向,包括模型訓(xùn)練、部署和推理,以及相關(guān)的數(shù)據(jù)集、API和工具軟件等,以幫助開發(fā)者更加高效地使用大型模型,從而快速實現(xiàn)各種應(yīng)用場景的落地。
軟通動力前不久發(fā)布了自己的模型即服務(wù)平臺——軟通天璇2.0 MaaS平臺。這一平臺包括三層,底層的大模型技術(shù)底座(L0級)、中間層的行業(yè)大模型(L1級)及管理、頂層的場景大模型應(yīng)用(L2級);除此之外,軟通動力還為客戶提供大模型一站式運營服務(wù)、數(shù)據(jù)治理及安全服務(wù)。
在天璇2.0中,軟通動力訓(xùn)推一體化平臺發(fā)揮了核心作用。其基于昇騰硬件底座+昇思MindSporeAI框架,采用軟通G420K訓(xùn)練平臺和G210K推理平臺,整合歐拉操作系統(tǒng)等組件,搭載軟通自有AI中臺,為客戶提供多種交互式AI模型,深度適配不同AI應(yīng)用場景,支持多模態(tài)場景,提供了涵蓋大模型訓(xùn)練、測評、部署的一整套端到端的安全可信體系。
霍宇介紹說,軟通動力訓(xùn)推一體化平臺,同時提供對商用和開源大模型的支持,客戶既可以直接接入商用大模型,也可以基于開源大模型進行本地化部署。實際上,大模型的開源化趨勢已經(jīng)非常明顯,正在成為大模型生態(tài)的主流。
除了工具平臺,軟通動力也加緊致力于AI專業(yè)人才的培養(yǎng),這也成為其在大模型生態(tài)中的核心競爭優(yōu)勢之一。
毫無疑問,大模型的流行將帶來人才結(jié)構(gòu)的變革,未來會需要大量的AI訓(xùn)練師、機器學(xué)習(xí)工程師、數(shù)據(jù)科學(xué)家等新型人才。在霍宇看來,未來的AI人才,不僅需要懂AI,也需要懂架構(gòu)。基于過去的業(yè)務(wù)積累,軟通動力已經(jīng)儲備了一大批相關(guān)人才,目前正在加緊培訓(xùn)及在內(nèi)部的算力平臺上實踐,幫助他們實現(xiàn)從編碼邏輯到提示詞邏輯的轉(zhuǎn)換。
這些專業(yè)人才,將會幫助軟通動力的行業(yè)客戶構(gòu)建自己的大模型,并最大程度地發(fā)揮大模型的作用,將其付諸落地實踐。
當下,基礎(chǔ)大模型的熱潮正在逐漸消退,但定制化大模型和大模型應(yīng)用才剛剛開始。隨著應(yīng)用的普及,大模型將帶來新的服務(wù)范式和商業(yè)模式?;粲钜舱J為,未來SaaS會被基于大模型的SaaS所取代。整個軟件領(lǐng)域甚至ICT行業(yè)生態(tài)的變革正在路上。