北京2023年8月31日 /美通社/ -- 進入2023年,ChatGPT推動世界步入一個全新時代——大模型時代,它不僅引發(fā)了AI產(chǎn)業(yè)的整體升級換代,同時也讓各種大模型層出不窮,背后的關鍵原因在于,大模型能普遍提升生產(chǎn)力,而業(yè)內(nèi)眾多公司也都在積極尋找應用大模型和生成式AI的機會,希望在產(chǎn)業(yè)端有所作為。
確實如此,ChatGPT之所以被稱為AI的"iPhone時刻",源于ChatGPT為代表的生成式AI能夠讓每個人命令計算機解決問題成為了可能,其可對生產(chǎn)工具、對話引擎、個人助理等各類應用,起到協(xié)助人、服務人甚至超越人的角色,而憑借這項革命性的技術突破,ChatGPT在搜索引擎與各類工具軟件中率先掀起應用熱潮,并引起了行業(yè)用戶對ChatGPT相關技術的關注與學習。同時,海量下游應用也因此捕捉到新的技術與產(chǎn)業(yè)機會,希望通過各類大模型與工程化能力,將類ChatGPT產(chǎn)品能力輸送到原有的應用中,更好的賦能企業(yè)的數(shù)智化轉(zhuǎn)型。
但也要看到,要讓大模型從"已有"走向"可用"并不是"一蹴而就"的過程,更多的企業(yè)通常會面臨數(shù)據(jù)資源有限、算力投資難度大、模型泛化能力差、高水平人才稀缺的發(fā)展瓶頸。也正因此,對更多的企業(yè)來說,未來更加"務實"的做法,就是選擇適合自己的大模型服務商,"站在巨人的肩膀上",更好地"用好"大模型。
正是洞察到這種迫切的市場需求,作為數(shù)字化轉(zhuǎn)型的實踐者和賦能者,軟通動力近年來始終堅持以全棧式數(shù)字技術為行業(yè)客戶創(chuàng)造價值,特別是在大模型領域,軟通動力也在積極地探索與實踐,希望憑借自身在AI基礎設施、AI專業(yè)人才,AI生態(tài)以及在通用領域和專用服務領域沉淀的豐富應用實踐,為行業(yè)客戶提供大模型落地的專業(yè)服務,打通大模型落地"最后一公里",更好地加速千行百業(yè)擁抱大模型的新時代。
大模型落地的四重挑戰(zhàn)
毫無疑問,幾乎沒人會懷疑大模型對未來的顛覆性影響。但現(xiàn)實是,國內(nèi)對大模型的探索仍處于早期階段,無論在研發(fā)、迭代還是使用階段,大模型都是一個消耗資源巨大、使用成本也不低的"奢侈品"。除了成本居高不下之外,企業(yè)想要在實際業(yè)務場景中部署使用大模型,還面臨著數(shù)據(jù)、參數(shù)調(diào)優(yōu)、人才等諸多的落地難題。
對此,軟通動力數(shù)字化創(chuàng)新服務線副總裁霍宇表示,今年以來軟通動力積極在大模型領域探索與實踐,發(fā)現(xiàn)大模型要落地到行業(yè)和企業(yè)之中所面臨的挑戰(zhàn)非常之多,可以從幾個維度來做觀察:
一是,從算力的維度看,訓練大型模型需要大量的計算資源和資金投入,這對于眾多的企業(yè)是巨大的挑戰(zhàn)。"公司今年在大模型基礎算力方面的投入預計將會近億元,未來還會持續(xù)。在這個領域,如果需要形成有競爭力的產(chǎn)品或者方案,上千萬的資金投入只能算是起步門檻,可以說大模型的算力和訓練成本極高,這也包括現(xiàn)在經(jīng)常提到的行業(yè)大模型,垂直領域大模型,所以說算力方面就是一個躲不過去的高門檻。"霍宇表示。
二是,從數(shù)據(jù)的維度看,以生成式AI來說,訓練的語言模型就需要具有更高的豐富度和復雜性,才能更好地理解和生成各種語言表達形式。例如,不同的語言有不同的句法結(jié)構(gòu)、詞匯使用規(guī)律、語義關系等特點,因此訓練模型需要包括更多的語言知識和規(guī)則,以適應這些差異。同時,不同的語言還可能包含一些特殊的表達方式、文化背景等,訓練模型還需要考慮這些因素,以更好地模擬和生成各種語言表達形式。不僅如此,為了提高模型的豐富度和能力,還需要使用更加大規(guī)模、多樣化、真實的語言數(shù)據(jù)集,以提高模型的泛化能力和豐富性,使其能夠更好地適應各種語言場景和應用需求。
在霍宇看來,大模型訓練的語料問題本質(zhì)上就是企業(yè)的數(shù)據(jù)治理的問題,一方面要求企業(yè)必須要獲取大量可用和可信的數(shù)據(jù);另一方面,數(shù)據(jù)還需要經(jīng)過治理,形成結(jié)構(gòu)化和標準化的數(shù)據(jù),從而更好的訓練出所需要的大模型服務。
三是,從算法的維度看,AI模型的發(fā)展從AlexNet發(fā)布開始,隨后的研究多數(shù)是圍繞著模型的深度和廣度探索,發(fā)展至今已有BERT、 GPT等典型模型出現(xiàn),也掀起了預訓練模型的熱潮,目前國內(nèi)的大模型參數(shù)也已經(jīng)攀升至千億、萬億級別,其準確度也在不斷的刷新 SOTA。
但與此同時,對于企業(yè)而言,如何選擇合適自身的預訓練模型,如何在具體場景和任務下,基于成熟的大模型進行微調(diào)能夠快速地產(chǎn)生準確結(jié)果,以及究竟是選擇商用還是開源的大模型服務,如何平衡成本和訓練效果,同樣也是非常讓人"頭疼"的問題。
四是,從人才維度看,隨著越來越多的企業(yè)開始廣泛應用大模型,相關的人才需求也成為了新的挑戰(zhàn)。以在人工智能產(chǎn)品實際使用過程中進行數(shù)據(jù)庫管理、算法參數(shù)設置、人機交互設計、性能測試跟蹤及其他輔助作業(yè)的AI訓練師為例,相關數(shù)據(jù)顯示,這類人才目前就出現(xiàn)了大量的"缺口"亟待滿足。
不難看出,雖然我們已經(jīng)見證了大模型開始與場景、行業(yè)進行深度融合并取得了不錯的成績,驗證了大模型已不僅在科技企業(yè)中應用,也邁出了走向千行百業(yè)的步伐,但大模型的落地并不是一件簡單的事情,仍需要解決好算力、數(shù)據(jù)、算法、人才等方面帶來的全新挑戰(zhàn)。
以服務入局大模型賽道
基于此,從今年年初開始,軟通動力就積極布局大模型賽道,不僅投資建設AI算力基礎設施,同時也站在服務和落地的視角,希望能夠憑借自身在AI人才資源,AI平臺工具,AI合作生態(tài)以及"躬身實踐"中沉淀的經(jīng)驗和方法論,和行業(yè)客戶共創(chuàng)能夠落地的大模型服務,更好地幫助企業(yè)迎接大模型時代的到來,具體來說:
首先,在AI人才資源方面,這是軟通動力在大模型賽道中獨具特色的優(yōu)勢。公司憑借十余年的技術積累和行業(yè)經(jīng)驗沉淀,通過將自身的服務能力橫向拉通、整合之后,目前不僅能夠為行業(yè)客戶提供"全?;?quot;的數(shù)字技術服務,同時更積累了一大批高質(zhì)量的數(shù)字化人才。
"我們的第一個切入點就是AI人才方向,投入專門的算力平臺作為培養(yǎng)工程師上手并熟悉大模型的工程實踐環(huán)境,能夠讓相關開發(fā)語言的工程師和架構(gòu)師更快更熟練玩轉(zhuǎn)大模型,希望通過對算力及人才的投資,讓他們能夠把大模型從產(chǎn)品到落地應用之間的鏈條打通,成為大模型領域的專家。而在未來,這批專家資源的能力不僅可以傳遞給更多的員工;另一方面,對企業(yè)來說,也可以直接獲得專家資源的幫助,直接進行企業(yè)所需要的大模型開發(fā)或者提供參數(shù)調(diào)優(yōu)等相關的服務。"霍宇說。
其次,在AI平臺工具方面,軟通動力也打造了軟通天璇2.0 MaaS 平臺。據(jù)介紹,基于產(chǎn)業(yè)服務需求,軟通天璇2.0 MaaS平臺在整合軟通行業(yè)模型管理平臺(iSS Model Ops Platform)、軟通應用開發(fā)平臺(iSS Model Dev Tools)、軟通場景Plugin應用服務平臺(iSS Model Plugin Store)等產(chǎn)品的基礎上,能夠為客戶提供大模型的數(shù)據(jù)處理、大模型一站式運營服務、繼續(xù)訓練、調(diào)優(yōu)、部署、推理和數(shù)字資產(chǎn)管理、數(shù)據(jù)安全等服務。值得一提的是,軟通動力全新升級的訓推一體化平臺,基于昇騰硬件底座,采用軟通G420K訓練平臺和軟通G210K推理平臺,整合歐拉操作系統(tǒng)等組件,搭載自有AI中臺,能夠為用戶提供多種交互式AI模型,深度適配不同AI應用場景,在央國企、教育科研、金融等多行業(yè)多領域都可以應用。
第三,在AI合作方面,軟通動力與行業(yè)內(nèi)頭部和主流大模型廠商都建立了生態(tài)向的合作。不僅率先接入了微軟Azure云 GPT4,并且也是百度文心一言、華為云盤古大模型、阿里通義千問、元乘象ChatImg2.0的生態(tài)合作伙伴,同時也在積極深研諸如ChatGLM、DeepSpeed Chat、OpenAssistant、Alpaca、LLaMA等開源大模型。
霍宇認為,軟通動力在AI合作生態(tài)方面全方位的"布局",最大的價值在于團隊通過使用這些第三方的商用大模型服務,以及開源大模型,沉淀了不少的經(jīng)驗和方法論,而這些實踐和經(jīng)驗,對行業(yè)客戶落地大模型也是具有極高的參考價值和借鑒意義的,可以避免企業(yè)在大模型落地過程中少走"彎路",這也是一種較為"穩(wěn)妥"的落地方式。
最后,是大模型落地實踐方面,軟通動力也正在和行業(yè)客戶通過"共創(chuàng)"的形式,更好地推動企業(yè)擁抱大模型時代。
"現(xiàn)在不少行業(yè)客戶都找到軟通,他們認為目前如果企業(yè)自己要搞一套大模型是有困難的,這些行業(yè)客戶的優(yōu)勢在于他們有不少的行業(yè)數(shù)據(jù),但是并不知道如何讓這些數(shù)據(jù)更好地實現(xiàn)語料化,或者如何讓大模型在節(jié)省算力的基礎上,更快地實現(xiàn)訓練或者推理等等。除此之外,搭建行業(yè)大模型,前期的規(guī)劃以及選型,也是一道門檻,而這些正是軟通動力擅長的工作,因此雙方可以通過共創(chuàng)的形式,共同推進大模型的落地,目前公司已經(jīng)和不少的銀行和保險行業(yè)的客戶展開相關的合作。"霍宇說。
正如IDC最新發(fā)布的《AI大模型技術能力評估報告,2023》中提到的:"對于行業(yè)用戶來說,在關注廠商大模型技術棧完備性的同時,應著重考察廠商的產(chǎn)業(yè)應用經(jīng)驗積累,主要發(fā)力點應集中在應用層,將技術應用到實際業(yè)務場景中,提前布局,積累行業(yè)、場景經(jīng)驗和數(shù)據(jù),由此才能‘站在巨人的肩膀上'打造差異化競爭優(yōu)勢。"從這個角度來說,軟通動力在大模型服務領域積累的四大優(yōu)勢,無疑可以更好地幫助企業(yè)擁抱大模型,加速企業(yè)的數(shù)智化轉(zhuǎn)型。
打通落地"最后一公里"
事實上,軟通動力以服務模式"卡位"大模型賽道,本身也是深思熟慮和審慎考量的結(jié)果。
霍宇告訴我:"當大模型浪潮襲來之時,我們首先否決掉的就是自己下場做通用大模型平臺,更多還是考慮從行業(yè)大模型的賽道入手,但深入研究之后又發(fā)現(xiàn),要做行業(yè)大模型,垂直行業(yè)中的數(shù)據(jù)和語料也至關重要。因此,作為一家服務型的公司,軟通動力以服務的模式切入這個市場是最為合適的,我們可以通過專家資源、平臺工具,以及經(jīng)驗和方法論,加上行業(yè)客戶手中的數(shù)據(jù)資源,雙方以共創(chuàng)的形式合作,是能夠以較快方式實現(xiàn)大模型落地的。"
同樣,以"服務"模式入局大模型賽道,也讓軟通動力能夠以更加"全局"的視角來觀察和看待整個大模型市場,并從中沉淀和總結(jié)出了不少大模型落地中值得重視的關鍵事項。
第一,是關于開源和商用大模型的選型問題。對此,霍宇認為,基于業(yè)務的需求情況,中國企業(yè)也會像選擇公有云和私有云部署那樣,既會選擇直接接入商用大模型,也會選擇基于開源大模型部署本地化的服務。
"拋開算力資源問題不說,如果單看模型參數(shù)大小,開源大模型在相對小的規(guī)模上能力已經(jīng)接近商用模型,漸漸有了趕超的勢頭。另外,相對追求大而全的通用商用大模型,在垂直領域的模型訓練上,開源模型的數(shù)量已經(jīng)超過商用模型,因此企業(yè)不用太擔心開源大模型會落后于主流的商用大模型平臺。而在行業(yè)大模型領域,應該說整個市場都還不太成熟,還處在探索與實踐的階段,這就需要整個產(chǎn)業(yè)鏈通過共創(chuàng)的方式,推動行業(yè)大模型的慢慢成熟,最終打通落地的最后一公里。"霍宇說。
第二,除了算力和模型參數(shù)之外,企業(yè)應該把重心放在數(shù)據(jù)以及語料的沉淀上。在霍宇看來,目前語料確實是一個稀缺資源,但很多企業(yè)沒有意識到這一點,未來企業(yè)如果要做大模型,數(shù)據(jù)和語料就是繞不開的問題。也正因此,數(shù)據(jù)和語料的質(zhì)量問題就變得尤為重要,同樣底層數(shù)據(jù)的清洗、標注、治理等一系列的工作也變得更加地迫在眉睫。
"我們目前也正在幫助一些行業(yè)客戶做數(shù)據(jù)治理的工作,我們判斷做數(shù)據(jù)和語料的工作還會長久持續(xù),只不過很多工作如數(shù)據(jù)標注、數(shù)據(jù)收集的工作會變成‘工具+人工'的方式,同時這些數(shù)據(jù)和語料也會更加關注行業(yè)屬性。不僅如此,在具體的實踐過程中,我們也總結(jié)和沉淀了如何把語料或數(shù)據(jù)形成標準化的方法論,多大的參數(shù)量需要‘喂'它多少的語料能夠達到比較合適的性價比,這都是軟通動力正在做的事情。在此基礎上,業(yè)務規(guī)則的設定,數(shù)學建模以及參數(shù)調(diào)優(yōu),以及后續(xù)長期的優(yōu)化等工作,我們也都是可以為行業(yè)客戶提供相關服務的。"他說。
第三,向量數(shù)據(jù)庫也是軟通動力關注的重要方向。向量數(shù)據(jù)庫主要用在AI和機器學習領域。在這些領域,數(shù)據(jù)通常以向量的形式呈現(xiàn),可以有效解決文本、圖片、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)存儲和查詢的難題;而在大模型時代,目前對非結(jié)構(gòu)化數(shù)據(jù)進行管理和處理的主流方法是,利用RNN或 Transformer 等嵌入模型(Embedding Model),將非結(jié)構(gòu)化數(shù)據(jù)的語義內(nèi)容轉(zhuǎn)化為多維向量,并直接對這些向量進行存儲、處理,由此可以為大模型的訓練、學習等提供更好的數(shù)據(jù)支撐。
霍宇認為,向量數(shù)據(jù)庫在大模型中將會起到三個方面的作用和價值,包括它目前已成為推動大模型迭代和進化的核心技術,同時它對企業(yè)的定制化需求也會有質(zhì)的影響;更為關鍵的是,向量數(shù)據(jù)庫對以后的數(shù)據(jù)型項目的交付也會產(chǎn)生比較大的變革。
"我的理解是,向量數(shù)據(jù)庫是對數(shù)據(jù)科學的再一次‘數(shù)字化',可以簡單地對比原來以表結(jié)構(gòu)橫縱為主的數(shù)據(jù)庫,是用二維或者多維結(jié)構(gòu)來表現(xiàn),那么向量數(shù)據(jù)庫就是用一維結(jié)構(gòu)來表現(xiàn)世界。因此隨著向量數(shù)據(jù)庫和算力以及AGI技術的發(fā)展,未來的數(shù)據(jù)交付模式就會改變,由此也會產(chǎn)生全新的商業(yè)模式,我們對此也是高度關注。"霍宇表示。
回頭來看,軟通動力這種"行勝于言"的務實風格,讓它在大模型服務賽道中構(gòu)建了屬于自己獨特的競爭優(yōu)勢。在AI算力資源上真金白銀的投入,對一家服務型企業(yè)而言,背后是決心的彰顯和對市場大勢的把握。這使得軟通動力一方面可以提供充足的算力資源供工程師和開發(fā)人員上手,積累和沉淀實操經(jīng)驗;另一方面,也可提供現(xiàn)場Demo環(huán)境供企業(yè)客戶使用,讓客戶能切實感受到大模型帶來的全新價值。"
未來,我們還會繼續(xù)儲備更多的專家資源,持續(xù)在平臺和工具上做投入,并根據(jù)客戶的業(yè)務應用場景強化數(shù)據(jù)和語料的質(zhì)量,最終提升交付的效率,以更好的創(chuàng)新服務模式打通大模型落地的最后一公里。"霍宇如是說。
在"躬身實踐"和"作壁上觀"之間,軟通動力選擇了前者,這也讓其對大模型市場有了更加深刻的認知和洞察,同時其過去一段時間的大膽實踐,也讓其在人才、工具、生態(tài)乃至方法論方面有了更多的積累和沉淀,而這也是軟通動力有能力,更有信心讓更多行業(yè)客戶加速擁抱大模型時代的底氣所在。