北京2018年8月1日電 /美通社/ -- 2018年7月26日,微軟小冰的第六代年度發(fā)布會上公布了“金融小冰”已化名上線了248天的消息?!敖鹑谛”敝铝τ谔峁?6類上市企業(yè)供稿摘要,而其中針對國內(nèi)個(gè)人投資者及專業(yè)證券APP的“華小冰”則由華爾街見聞公司化名而來。
這是華小冰靜默開工的第248天。過去的200多天里,華小冰撰寫的金融資訊觸達(dá)了中國40%的個(gè)人投資者。
跟所有勤奮的金融資訊加工者一樣,華小冰必須保持高度的專業(yè)水準(zhǔn),對每天密集發(fā)布的26類上市公司公告,進(jìn)行關(guān)鍵信息的提取、加工,并確保第一時(shí)間、準(zhǔn)確地推送到投資者手中。金融資訊的特殊性,決定了這類信息的加工必須以毫秒為單位、且不能出現(xiàn)哪怕萬分之一的偏差。
直到2018年7月26日,微軟小冰的第六代年度發(fā)布會。一些細(xì)心的投資者發(fā)現(xiàn),原來華小冰并不是一個(gè)人,而是懂金融的微軟小冰。
最懂金融的機(jī)器人
華小冰的“華”取自“華爾街見聞”,這家中國最有影響力的財(cái)經(jīng)媒體,一直致力于內(nèi)容與技術(shù)的雙輪驅(qū)動戰(zhàn)略。
曾首創(chuàng)金融信息7X24小時(shí)“實(shí)時(shí)”模式,通過同名華爾街見聞APP、選股寶APP、全天候科技等產(chǎn)品打造了強(qiáng)大的內(nèi)容矩陣,為用戶提供優(yōu)質(zhì)資訊、數(shù)據(jù)、行情、研究和社區(qū)等服務(wù)。此次聯(lián)手微軟,也可以視作華爾街見聞深耕內(nèi)容AI技術(shù)的一次創(chuàng)新合作。
華爾街見聞旗下產(chǎn)品選股寶被稱為“最懂投資者”的A股產(chǎn)品。作為A股產(chǎn)品界的一匹黑馬,憑借領(lǐng)先的結(jié)構(gòu)化A股資訊、強(qiáng)大精準(zhǔn)的主題數(shù)據(jù)庫、海量用戶數(shù)據(jù)積累,在競爭激烈的A股產(chǎn)品中殺出重圍。
此次華小冰的誕生,正是微軟小冰與選股寶團(tuán)隊(duì)深度合作的結(jié)果。雙方共同探索和應(yīng)用小冰金融文本生成技術(shù),并通過華爾街見聞、選股寶APP,將華小冰生成的智能資訊,分發(fā)至眾多合作券商APP,進(jìn)而覆蓋多達(dá)40%的個(gè)人投資者。
攻克難關(guān):AI寫作非標(biāo)金融資訊
此次合作就是瞄準(zhǔn)了金融資訊領(lǐng)域的用戶痛點(diǎn) -- 上市公司公告AI寫作。公告是上市公司絕大多數(shù)重要信息的唯一出口,第一時(shí)間掌握相關(guān)上市公司披露的關(guān)鍵信息和背后意義,是所有二級市場投資者必須跨越的難關(guān)。
金融AI寫作一直是個(gè)理想豐滿、現(xiàn)實(shí)骨感的領(lǐng)域。一方面,上市公司公告由于是程式化文本,存在數(shù)量多、信息冗余的情況。而人工處理普遍存在時(shí)滯、缺漏等問題。另一方面,AI公告寫作也一直是未解難題。上市公司公告更接近非標(biāo)準(zhǔn)化金融資訊。雖然公告所包含信息元素相對確定,但上市公司公告格式不盡相同,且經(jīng)常出現(xiàn)非標(biāo)準(zhǔn)化場景。因此,絕大部分的“金融AI寫作”僅僅是模板化的數(shù)據(jù)提取和填充,對于非標(biāo)準(zhǔn)化內(nèi)容的加工顯得有些力不從心。
2016年艾媒咨詢(iMedia Research)的調(diào)查顯示,相較于汽車、家居、健康等媒體,財(cái)經(jīng)類媒體的內(nèi)容專業(yè)性較強(qiáng),內(nèi)容價(jià)值是其重要驅(qū)動力。因此,要讓機(jī)器人撰寫專業(yè)的財(cái)經(jīng)內(nèi)容,似乎還需要進(jìn)行更艱難的探索。
華小冰則首度解決了金融領(lǐng)域的非標(biāo)準(zhǔn)化寫作難題。在借鑒傳統(tǒng) NLG 和語言模型方法的基礎(chǔ)上,結(jié)合華爾街見聞專業(yè)團(tuán)隊(duì)對A股市場的理解和搜索數(shù)據(jù)庫層面積累的大數(shù)據(jù),在模板基礎(chǔ)上進(jìn)行語言生成,從而快速完成AI寫作。
華小冰誕生之初便開始經(jīng)歷來自真實(shí)金融場景的嚴(yán)酷“訓(xùn)練”。上百萬條人工訓(xùn)練數(shù)據(jù)灌入、成百上千次的模型互調(diào),很快讓這個(gè)上手才200天的“年輕人”,迅速成為處理過海量數(shù)據(jù)、經(jīng)驗(yàn)超群的“老司機(jī)”,甚至可以快速處理長達(dá)幾百頁的招股說明書。
全新探索:個(gè)性化行情播報(bào)、主題故事線
除了公告AI寫作,華小冰還將在個(gè)性化行情播報(bào)、主題故事線方面進(jìn)行探索。
個(gè)性化播報(bào)不同于傳統(tǒng)的同一資訊池的“千人千面”,而是根據(jù)選股寶用戶畫像、結(jié)構(gòu)化資訊標(biāo)簽(如利好利空、大漲板塊和個(gè)股實(shí)時(shí)解盤)、行業(yè)主題數(shù)據(jù)庫等,對不同用戶智能化生成不同的播報(bào)文本,解決盯盤的個(gè)性化需求。
主題故事線,則是以選股寶行業(yè)主題數(shù)據(jù)庫為基礎(chǔ),通過數(shù)據(jù)庫內(nèi)精準(zhǔn)的股票和資訊匹配,圍繞行業(yè)或概念主題,智能化生成歷史事件圖譜,方便投資者快速了解歷史脈絡(luò)和熱點(diǎn),以便做出投資決策。