深圳2023年7月14日 /美通社/ -- 近日,以"智聯(lián)世界,生成未來"為主題的2023年世界人工智能大會(WAIC)在上海圓滿落幕。本次大會旨在搭建世界級合作交流平臺,共促發(fā)展新機(jī)遇。全球知名商業(yè)領(lǐng)軍者和全球創(chuàng)新先鋒云集于本次大會,闡述其對于新AI與新商業(yè)的見解,其中,加拿大工程院和加拿大皇家學(xué)院兩院院士、FATE開源社區(qū)技術(shù)指導(dǎo)委員會主席、微眾銀行首席人工智能官楊強(qiáng)受邀出席,分享了聯(lián)邦學(xué)習(xí)領(lǐng)域的前沿研學(xué)成果。
可信聯(lián)邦學(xué)習(xí)與聯(lián)邦大模型,解構(gòu)大模型時(shí)代數(shù)據(jù)之困
7月7日,在由世界人工智能大會組委會辦公室主辦,中國信息通信研究院承辦,中國信息通信研究院華東分院、中國信息通信研究院云計(jì)算與大數(shù)據(jù)研究所協(xié)辦的"聚焦·大模型時(shí)代AIGC新浪潮"論壇上,楊強(qiáng)發(fā)表了"可信聯(lián)邦學(xué)習(xí)與聯(lián)邦大模型"主題演講。
在大模型迅猛發(fā)展的當(dāng)下,對算力、數(shù)據(jù)量的極高要求是橫亙在中小型機(jī)構(gòu)AI應(yīng)用之路上的一道難以跨越的鴻溝。正如OpenAI CEO Sam Altman所言,未來模型參數(shù)應(yīng)該向更小的方向發(fā)展,或者以多個(gè)小模型協(xié)作的方式工作。
楊強(qiáng)指出,聯(lián)邦學(xué)習(xí)(Federated Learning)能夠聯(lián)合分散的數(shù)據(jù)、分散的算力,可應(yīng)用于解決可用數(shù)據(jù)量不足的問題,從而使多方共建大模型基礎(chǔ)設(shè)施,為業(yè)界提供了前瞻性的解決方案。當(dāng)前,F(xiàn)ATE(Federated AI Technology Enabler)開源社區(qū)已經(jīng)發(fā)布了開源的聯(lián)邦大模型功能模塊FATE-LLM,支持各參與方的敏感數(shù)據(jù)不出本地域的前提下,根據(jù)各方實(shí)際數(shù)據(jù)量進(jìn)行算力投入,聯(lián)合進(jìn)行大模型訓(xùn)練。未來,聯(lián)邦大模型架構(gòu)將重點(diǎn)發(fā)展同構(gòu)與異構(gòu)聯(lián)邦大模型、大模型指導(dǎo)小模型聯(lián)邦等方面,進(jìn)一步提升聯(lián)邦大模型的可用性、易用性。
在聯(lián)邦學(xué)習(xí)整體研究與產(chǎn)業(yè)落地方面,楊強(qiáng)介紹,"可信聯(lián)邦學(xué)習(xí)"(Trustworthy Federated Learning)作為安全可信的多方分布式機(jī)器學(xué)習(xí)范式,具有安全可信、高效可用、可管理、可審計(jì)、普惠等核心特征,將更加適配當(dāng)前產(chǎn)業(yè)發(fā)展所需綜合考慮數(shù)據(jù)安全、隱私保護(hù)與效率的要求。同時(shí),楊強(qiáng)介紹了可信聯(lián)邦學(xué)習(xí)最新的前沿研究與應(yīng)用成果,包括質(zhì)效均衡的可信聯(lián)邦學(xué)習(xí)算法框架,在金融反洗錢等行業(yè)場景中的應(yīng)用等。
攜手共建聯(lián)邦學(xué)習(xí)開源生態(tài),推動數(shù)據(jù)要素安全流通
7月8日,在由世界人工智能大會組委會辦公室主辦,機(jī)器之心承辦的"AI開發(fā)者"論壇上,楊強(qiáng)重點(diǎn)作"可信聯(lián)邦學(xué)習(xí)與開源生態(tài)"主題分享,重點(diǎn)介紹了隱私計(jì)算和聯(lián)邦學(xué)習(xí)開源社區(qū)與生態(tài)。
據(jù)楊強(qiáng)介紹,開源已成為隱私計(jì)算技術(shù)規(guī)模化的其中一個(gè)重要途徑。FATE開源社區(qū)是由聯(lián)邦學(xué)習(xí)技術(shù)開發(fā)者、行研方、產(chǎn)業(yè)方及生態(tài)伙伴共同組建與治理的協(xié)作創(chuàng)新平臺,相關(guān)參與方可以基于工業(yè)級聯(lián)邦學(xué)習(xí)開源框架FATE探索聯(lián)邦學(xué)習(xí)技術(shù)的研究與應(yīng)用。FATE開源社區(qū)以"開源開放,共力創(chuàng)新"為愿景,匯聚了4000+社區(qū)用戶參與社區(qū)共建,覆蓋金融、醫(yī)療、科研、人工智能等多個(gè)領(lǐng)域與場景,不僅已成為全球領(lǐng)先的聯(lián)邦學(xué)習(xí)開源社區(qū),還是可信數(shù)據(jù)流通領(lǐng)域最具影響力的社區(qū)之一。
在建立行業(yè)標(biāo)準(zhǔn)、推動應(yīng)用場景方面,F(xiàn)ATE開源社區(qū)的成員單位共同牽頭建立了多項(xiàng)聯(lián)邦學(xué)習(xí)技術(shù)標(biāo)準(zhǔn),落地了在企業(yè)跨主體的大數(shù)據(jù)協(xié)作、企業(yè)異構(gòu)平臺互聯(lián)互通、多中心醫(yī)療發(fā)現(xiàn)等多場景下的聯(lián)邦學(xué)習(xí)應(yīng)用實(shí)踐,共同打造了包含數(shù)據(jù)提供方、模型提供方、業(yè)務(wù)提供方、價(jià)值中介方等各環(huán)節(jié)緊密結(jié)合的數(shù)據(jù)要素流通生態(tài)。
談及未來發(fā)展趨勢,楊強(qiáng)認(rèn)為聯(lián)邦學(xué)習(xí)與開源生態(tài)將成為隱私計(jì)算、機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)發(fā)展的關(guān)鍵驅(qū)動力。其中,可探索的重點(diǎn)包括進(jìn)一步完善聯(lián)邦學(xué)習(xí)安全機(jī)制;推動跨平臺的互聯(lián)互通;推動數(shù)據(jù)確權(quán)與定價(jià)和模型交易;基于"模型和數(shù)據(jù)集水印"技術(shù)的模型審計(jì)和模型全生命周期管理;推動聯(lián)邦學(xué)習(xí)與大模型、區(qū)塊鏈等技術(shù)的融合等方面,為未來的智能時(shí)代提供核心支持。