軟通動力霍宇：以服務入局大模型賽道，打通落地"最后一公里"

2023-08-31 16:59 2917

北京2023年8月31日 /美通社/ -- 進入2023年，ChatGPT推動世界步入一個全新時代——大模型時代，它不僅引發(fā)了AI產(chǎn)業(yè)的整體升級換代，同時也讓各種大模型層出不窮，背后的關鍵原因在于，大模型能普遍提升生產(chǎn)力，而業(yè)內(nèi)眾多公司也都在積極尋找應用大模型和生成式AI的機會，希望在產(chǎn)業(yè)端有所作為。

確實如此，ChatGPT之所以被稱為AI的"iPhone時刻"，源于ChatGPT為代表的生成式AI能夠讓每個人命令計算機解決問題成為了可能，其可對生產(chǎn)工具、對話引擎、個人助理等各類應用，起到協(xié)助人、服務人甚至超越人的角色，而憑借這項革命性的技術突破，ChatGPT在搜索引擎與各類工具軟件中率先掀起應用熱潮，并引起了行業(yè)用戶對ChatGPT相關技術的關注與學習。同時，海量下游應用也因此捕捉到新的技術與產(chǎn)業(yè)機會，希望通過各類大模型與工程化能力，將類ChatGPT產(chǎn)品能力輸送到原有的應用中，更好的賦能企業(yè)的數(shù)智化轉(zhuǎn)型。

但也要看到，要讓大模型從"已有"走向"可用"并不是"一蹴而就"的過程，更多的企業(yè)通常會面臨數(shù)據(jù)資源有限、算力投資難度大、模型泛化能力差、高水平人才稀缺的發(fā)展瓶頸。也正因此，對更多的企業(yè)來說，未來更加"務實"的做法，就是選擇適合自己的大模型服務商，"站在巨人的肩膀上"，更好地"用好"大模型。

正是洞察到這種迫切的市場需求，作為數(shù)字化轉(zhuǎn)型的實踐者和賦能者，軟通動力近年來始終堅持以全棧式數(shù)字技術為行業(yè)客戶創(chuàng)造價值，特別是在大模型領域，軟通動力也在積極地探索與實踐，希望憑借自身在AI基礎設施、AI專業(yè)人才，AI生態(tài)以及在通用領域和專用服務領域沉淀的豐富應用實踐，為行業(yè)客戶提供大模型落地的專業(yè)服務，打通大模型落地"最后一公里"，更好地加速千行百業(yè)擁抱大模型的新時代。

大模型落地的四重挑戰(zhàn)

毫無疑問，幾乎沒人會懷疑大模型對未來的顛覆性影響。但現(xiàn)實是，國內(nèi)對大模型的探索仍處于早期階段，無論在研發(fā)、迭代還是使用階段，大模型都是一個消耗資源巨大、使用成本也不低的"奢侈品"。除了成本居高不下之外，企業(yè)想要在實際業(yè)務場景中部署使用大模型，還面臨著數(shù)據(jù)、參數(shù)調(diào)優(yōu)、人才等諸多的落地難題。

對此，軟通動力數(shù)字化創(chuàng)新服務線副總裁霍宇表示，今年以來軟通動力積極在大模型領域探索與實踐，發(fā)現(xiàn)大模型要落地到行業(yè)和企業(yè)之中所面臨的挑戰(zhàn)非常之多，可以從幾個維度來做觀察：

一是，從算力的維度看，訓練大型模型需要大量的計算資源和資金投入，這對于眾多的企業(yè)是巨大的挑戰(zhàn)。"公司今年在大模型基礎算力方面的投入預計將會近億元，未來還會持續(xù)。在這個領域，如果需要形成有競爭力的產(chǎn)品或者方案，上千萬的資金投入只能算是起步門檻，可以說大模型的算力和訓練成本極高，這也包括現(xiàn)在經(jīng)常提到的行業(yè)大模型，垂直領域大模型，所以說算力方面就是一個躲不過去的高門檻。"霍宇表示。

二是，從數(shù)據(jù)的維度看，以生成式AI來說，訓練的語言模型就需要具有更高的豐富度和復雜性，才能更好地理解和生成各種語言表達形式。例如，不同的語言有不同的句法結(jié)構(gòu)、詞匯使用規(guī)律、語義關系等特點，因此訓練模型需要包括更多的語言知識和規(guī)則，以適應這些差異。同時，不同的語言還可能包含一些特殊的表達方式、文化背景等，訓練模型還需要考慮這些因素，以更好地模擬和生成各種語言表達形式。不僅如此，為了提高模型的豐富度和能力，還需要使用更加大規(guī)模、多樣化、真實的語言數(shù)據(jù)集，以提高模型的泛化能力和豐富性，使其能夠更好地適應各種語言場景和應用需求。

在霍宇看來，大模型訓練的語料問題本質(zhì)上就是企業(yè)的數(shù)據(jù)治理的問題，一方面要求企業(yè)必須要獲取大量可用和可信的數(shù)據(jù)；另一方面，數(shù)據(jù)還需要經(jīng)過治理，形成結(jié)構(gòu)化和標準化的數(shù)據(jù)，從而更好的訓練出所需要的大模型服務。

三是，從算法的維度看，AI模型的發(fā)展從AlexNet發(fā)布開始，隨后的研究多數(shù)是圍繞著模型的深度和廣度探索，發(fā)展至今已有BERT、 GPT等典型模型出現(xiàn)，也掀起了預訓練模型的熱潮，目前國內(nèi)的大模型參數(shù)也已經(jīng)攀升至千億、萬億級別，其準確度也在不斷的刷新 SOTA。

但與此同時，對于企業(yè)而言，如何選擇合適自身的預訓練模型，如何在具體場景和任務下，基于成熟的大模型進行微調(diào)能夠快速地產(chǎn)生準確結(jié)果，以及究竟是選擇商用還是開源的大模型服務，如何平衡成本和訓練效果，同樣也是非常讓人"頭疼"的問題。

四是，從人才維度看，隨著越來越多的企業(yè)開始廣泛應用大模型，相關的人才需求也成為了新的挑戰(zhàn)。以在人工智能產(chǎn)品實際使用過程中進行數(shù)據(jù)庫管理、算法參數(shù)設置、人機交互設計、性能測試跟蹤及其他輔助作業(yè)的AI訓練師為例，相關數(shù)據(jù)顯示，這類人才目前就出現(xiàn)了大量的"缺口"亟待滿足。
不難看出，雖然我們已經(jīng)見證了大模型開始與場景、行業(yè)進行深度融合并取得了不錯的成績，驗證了大模型已不僅在科技企業(yè)中應用，也邁出了走向千行百業(yè)的步伐，但大模型的落地并不是一件簡單的事情，仍需要解決好算力、數(shù)據(jù)、算法、人才等方面帶來的全新挑戰(zhàn)。

以服務入局大模型賽道

基于此，從今年年初開始，軟通動力就積極布局大模型賽道，不僅投資建設AI算力基礎設施，同時也站在服務和落地的視角，希望能夠憑借自身在AI人才資源，AI平臺工具，AI合作生態(tài)以及"躬身實踐"中沉淀的經(jīng)驗和方法論，和行業(yè)客戶共創(chuàng)能夠落地的大模型服務，更好地幫助企業(yè)迎接大模型時代的到來，具體來說：

首先，在AI人才資源方面，這是軟通動力在大模型賽道中獨具特色的優(yōu)勢。公司憑借十余年的技術積累和行業(yè)經(jīng)驗沉淀，通過將自身的服務能力橫向拉通、整合之后，目前不僅能夠為行業(yè)客戶提供"全?；?quot;的數(shù)字技術服務，同時更積累了一大批高質(zhì)量的數(shù)字化人才。

"我們的第一個切入點就是AI人才方向，投入專門的算力平臺作為培養(yǎng)工程師上手并熟悉大模型的工程實踐環(huán)境，能夠讓相關開發(fā)語言的工程師和架構(gòu)師更快更熟練玩轉(zhuǎn)大模型，希望通過對算力及人才的投資，讓他們能夠把大模型從產(chǎn)品到落地應用之間的鏈條打通，成為大模型領域的專家。而在未來，這批專家資源的能力不僅可以傳遞給更多的員工；另一方面，對企業(yè)來說，也可以直接獲得專家資源的幫助，直接進行企業(yè)所需要的大模型開發(fā)或者提供參數(shù)調(diào)優(yōu)等相關的服務。"霍宇說。

其次，在AI平臺工具方面，軟通動力也打造了軟通天璇2.0 MaaS 平臺。據(jù)介紹，基于產(chǎn)業(yè)服務需求，軟通天璇2.0 MaaS平臺在整合軟通行業(yè)模型管理平臺（iSS Model Ops Platform）、軟通應用開發(fā)平臺（iSS Model Dev Tools）、軟通場景Plugin應用服務平臺（iSS Model Plugin Store）等產(chǎn)品的基礎上，能夠為客戶提供大模型的數(shù)據(jù)處理、大模型一站式運營服務、繼續(xù)訓練、調(diào)優(yōu)、部署、推理和數(shù)字資產(chǎn)管理、數(shù)據(jù)安全等服務。值得一提的是，軟通動力全新升級的訓推一體化平臺，基于昇騰硬件底座，采用軟通G420K訓練平臺和軟通G210K推理平臺，整合歐拉操作系統(tǒng)等組件，搭載自有AI中臺，能夠為用戶提供多種交互式AI模型，深度適配不同AI應用場景，在央國企、教育科研、金融等多行業(yè)多領域都可以應用。

第三，在AI合作方面，軟通動力與行業(yè)內(nèi)頭部和主流大模型廠商都建立了生態(tài)向的合作。不僅率先接入了微軟Azure云 GPT4，并且也是百度文心一言、華為云盤古大模型、阿里通義千問、元乘象ChatImg2.0的生態(tài)合作伙伴，同時也在積極深研諸如ChatGLM、DeepSpeed Chat、OpenAssistant、Alpaca、LLaMA等開源大模型。
霍宇認為，軟通動力在AI合作生態(tài)方面全方位的"布局"，最大的價值在于團隊通過使用這些第三方的商用大模型服務，以及開源大模型，沉淀了不少的經(jīng)驗和方法論，而這些實踐和經(jīng)驗，對行業(yè)客戶落地大模型也是具有極高的參考價值和借鑒意義的，可以避免企業(yè)在大模型落地過程中少走"彎路"，這也是一種較為"穩(wěn)妥"的落地方式。

最后，是大模型落地實踐方面，軟通動力也正在和行業(yè)客戶通過"共創(chuàng)"的形式，更好地推動企業(yè)擁抱大模型時代。
"現(xiàn)在不少行業(yè)客戶都找到軟通，他們認為目前如果企業(yè)自己要搞一套大模型是有困難的，這些行業(yè)客戶的優(yōu)勢在于他們有不少的行業(yè)數(shù)據(jù)，但是并不知道如何讓這些數(shù)據(jù)更好地實現(xiàn)語料化，或者如何讓大模型在節(jié)省算力的基礎上，更快地實現(xiàn)訓練或者推理等等。除此之外，搭建行業(yè)大模型，前期的規(guī)劃以及選型，也是一道門檻，而這些正是軟通動力擅長的工作，因此雙方可以通過共創(chuàng)的形式，共同推進大模型的落地，目前公司已經(jīng)和不少的銀行和保險行業(yè)的客戶展開相關的合作。"霍宇說。

正如IDC最新發(fā)布的《AI大模型技術能力評估報告，2023》中提到的："對于行業(yè)用戶來說，在關注廠商大模型技術棧完備性的同時，應著重考察廠商的產(chǎn)業(yè)應用經(jīng)驗積累，主要發(fā)力點應集中在應用層，將技術應用到實際業(yè)務場景中，提前布局，積累行業(yè)、場景經(jīng)驗和數(shù)據(jù)，由此才能‘站在巨人的肩膀上'打造差異化競爭優(yōu)勢。"從這個角度來說，軟通動力在大模型服務領域積累的四大優(yōu)勢，無疑可以更好地幫助企業(yè)擁抱大模型，加速企業(yè)的數(shù)智化轉(zhuǎn)型。

打通落地"最后一公里"

事實上，軟通動力以服務模式"卡位"大模型賽道，本身也是深思熟慮和審慎考量的結(jié)果。

霍宇告訴我："當大模型浪潮襲來之時，我們首先否決掉的就是自己下場做通用大模型平臺，更多還是考慮從行業(yè)大模型的賽道入手，但深入研究之后又發(fā)現(xiàn)，要做行業(yè)大模型，垂直行業(yè)中的數(shù)據(jù)和語料也至關重要。因此,作為一家服務型的公司，軟通動力以服務的模式切入這個市場是最為合適的，我們可以通過專家資源、平臺工具，以及經(jīng)驗和方法論，加上行業(yè)客戶手中的數(shù)據(jù)資源，雙方以共創(chuàng)的形式合作，是能夠以較快方式實現(xiàn)大模型落地的。"

同樣，以"服務"模式入局大模型賽道，也讓軟通動力能夠以更加"全局"的視角來觀察和看待整個大模型市場，并從中沉淀和總結(jié)出了不少大模型落地中值得重視的關鍵事項。

第一，是關于開源和商用大模型的選型問題。對此，霍宇認為，基于業(yè)務的需求情況，中國企業(yè)也會像選擇公有云和私有云部署那樣，既會選擇直接接入商用大模型，也會選擇基于開源大模型部署本地化的服務。

"拋開算力資源問題不說，如果單看模型參數(shù)大小，開源大模型在相對小的規(guī)模上能力已經(jīng)接近商用模型，漸漸有了趕超的勢頭。另外，相對追求大而全的通用商用大模型，在垂直領域的模型訓練上，開源模型的數(shù)量已經(jīng)超過商用模型，因此企業(yè)不用太擔心開源大模型會落后于主流的商用大模型平臺。而在行業(yè)大模型領域，應該說整個市場都還不太成熟，還處在探索與實踐的階段，這就需要整個產(chǎn)業(yè)鏈通過共創(chuàng)的方式，推動行業(yè)大模型的慢慢成熟，最終打通落地的最后一公里。"霍宇說。

第二，除了算力和模型參數(shù)之外，企業(yè)應該把重心放在數(shù)據(jù)以及語料的沉淀上。在霍宇看來，目前語料確實是一個稀缺資源，但很多企業(yè)沒有意識到這一點，未來企業(yè)如果要做大模型，數(shù)據(jù)和語料就是繞不開的問題。也正因此，數(shù)據(jù)和語料的質(zhì)量問題就變得尤為重要，同樣底層數(shù)據(jù)的清洗、標注、治理等一系列的工作也變得更加地迫在眉睫。

"我們目前也正在幫助一些行業(yè)客戶做數(shù)據(jù)治理的工作，我們判斷做數(shù)據(jù)和語料的工作還會長久持續(xù)，只不過很多工作如數(shù)據(jù)標注、數(shù)據(jù)收集的工作會變成‘工具+人工'的方式，同時這些數(shù)據(jù)和語料也會更加關注行業(yè)屬性。不僅如此，在具體的實踐過程中，我們也總結(jié)和沉淀了如何把語料或數(shù)據(jù)形成標準化的方法論，多大的參數(shù)量需要‘喂'它多少的語料能夠達到比較合適的性價比，這都是軟通動力正在做的事情。在此基礎上，業(yè)務規(guī)則的設定，數(shù)學建模以及參數(shù)調(diào)優(yōu)，以及后續(xù)長期的優(yōu)化等工作，我們也都是可以為行業(yè)客戶提供相關服務的。"他說。

第三，向量數(shù)據(jù)庫也是軟通動力關注的重要方向。向量數(shù)據(jù)庫主要用在AI和機器學習領域。在這些領域，數(shù)據(jù)通常以向量的形式呈現(xiàn)，可以有效解決文本、圖片、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)存儲和查詢的難題；而在大模型時代，目前對非結(jié)構(gòu)化數(shù)據(jù)進行管理和處理的主流方法是，利用RNN或 Transformer 等嵌入模型（Embedding Model），將非結(jié)構(gòu)化數(shù)據(jù)的語義內(nèi)容轉(zhuǎn)化為多維向量，并直接對這些向量進行存儲、處理，由此可以為大模型的訓練、學習等提供更好的數(shù)據(jù)支撐。

霍宇認為，向量數(shù)據(jù)庫在大模型中將會起到三個方面的作用和價值，包括它目前已成為推動大模型迭代和進化的核心技術，同時它對企業(yè)的定制化需求也會有質(zhì)的影響；更為關鍵的是，向量數(shù)據(jù)庫對以后的數(shù)據(jù)型項目的交付也會產(chǎn)生比較大的變革。

"我的理解是，向量數(shù)據(jù)庫是對數(shù)據(jù)科學的再一次‘數(shù)字化'，可以簡單地對比原來以表結(jié)構(gòu)橫縱為主的數(shù)據(jù)庫，是用二維或者多維結(jié)構(gòu)來表現(xiàn)，那么向量數(shù)據(jù)庫就是用一維結(jié)構(gòu)來表現(xiàn)世界。因此隨著向量數(shù)據(jù)庫和算力以及AGI技術的發(fā)展，未來的數(shù)據(jù)交付模式就會改變，由此也會產(chǎn)生全新的商業(yè)模式，我們對此也是高度關注。"霍宇表示。

回頭來看，軟通動力這種"行勝于言"的務實風格，讓它在大模型服務賽道中構(gòu)建了屬于自己獨特的競爭優(yōu)勢。在AI算力資源上真金白銀的投入，對一家服務型企業(yè)而言，背后是決心的彰顯和對市場大勢的把握。這使得軟通動力一方面可以提供充足的算力資源供工程師和開發(fā)人員上手，積累和沉淀實操經(jīng)驗；另一方面，也可提供現(xiàn)場Demo環(huán)境供企業(yè)客戶使用，讓客戶能切實感受到大模型帶來的全新價值。"

未來，我們還會繼續(xù)儲備更多的專家資源，持續(xù)在平臺和工具上做投入，并根據(jù)客戶的業(yè)務應用場景強化數(shù)據(jù)和語料的質(zhì)量，最終提升交付的效率，以更好的創(chuàng)新服務模式打通大模型落地的最后一公里。"霍宇如是說。

在"躬身實踐"和"作壁上觀"之間，軟通動力選擇了前者，這也讓其對大模型市場有了更加深刻的認知和洞察，同時其過去一段時間的大膽實踐，也讓其在人才、工具、生態(tài)乃至方法論方面有了更多的積累和沉淀，而這也是軟通動力有能力，更有信心讓更多行業(yè)客戶加速擁抱大模型時代的底氣所在。

消息來源：軟通動力信息技術（集團）股份有限公司