sub newsletter

《連線》雜志:未來(lái)15年內(nèi),90%的新聞稿將由機(jī)器撰寫

《連線》雜志:未來(lái)15年內(nèi),90%的新聞稿將由機(jī)器撰寫
《連線》雜志:未來(lái)15年內(nèi),90%的新聞稿將由機(jī)器撰寫

編者注:《連線》雜志日前發(fā)布一篇有意思的報(bào)道,在芝加哥論壇報(bào)社不遠(yuǎn)的地方,有家名為Narrative Science公司開始為客戶提供計(jì)算機(jī)算法撰寫新聞稿的服務(wù),該公司預(yù)言,在未來(lái)的15年內(nèi),90%的新聞稿將由計(jì)算機(jī)算法寫成,計(jì)算機(jī)生產(chǎn)的新聞質(zhì)量也會(huì)越來(lái)越好,甚至5年內(nèi)可能獲得普利策新聞獎(jiǎng),那么問(wèn)題是:計(jì)算機(jī)算法寫的新聞會(huì)比人類寫的還要好嗎?

在芝加哥論壇報(bào)報(bào)社不遠(yuǎn)的地方,平均每30秒就有一篇新聞故事被生產(chǎn)出來(lái)——但其署名問(wèn)題卻堪稱是個(gè)哲學(xué)問(wèn)題,因?yàn)檫@新聞稿是利用計(jì)算機(jī)算法生產(chǎn)出來(lái)的。這家名叫 Narrative Science 的公司首席技術(shù)官、聯(lián)合創(chuàng)始人 Kristian Hammond 近日在接受《連線》雜志采訪時(shí)預(yù)測(cè)說(shuō):在15年內(nèi),有90%的文章將會(huì)由算法寫就。一些小眾新聞服務(wù)已經(jīng)開始雇傭 Narrative Science 公司為其訂戶、體育迷或小額投資者提供新聞更新。但計(jì)算機(jī)算法寫的新聞會(huì)比人類寫的還要好嗎?

但文章認(rèn)為,這或許也不會(huì)是一場(chǎng)零和博弈,因?yàn)槲磥?lái)“新聞故事”的外延也會(huì)擴(kuò)展。例如,祖父母?jìng)儠?huì)很關(guān)心孫子的少年棒球聯(lián)盟里的新聞,但有誰(shuí)會(huì)報(bào)道他們呢?現(xiàn)在已經(jīng)出現(xiàn)了 一個(gè)叫 GameChanger 的 iPhone app,根據(jù)數(shù)據(jù)即可為有這種需求的人提供這類新聞。去年,這個(gè)軟件為少年棒球聯(lián)盟比賽只做了近40萬(wàn)篇報(bào)導(dǎo),預(yù)計(jì)今年這個(gè)數(shù)字會(huì)上升到150萬(wàn)。Narrative Science 公司認(rèn)為,計(jì)算機(jī)生產(chǎn)的新聞質(zhì)量也會(huì)越來(lái)越好,Hammond 甚至認(rèn)為,5年內(nèi)可能會(huì)有計(jì)算機(jī)算法獲得普利策新聞獎(jiǎng)!

《連線》雜志原文:http://www.wired.com/gadgetlab/2012/04/can-an-algorithm-write-a-better-news-story-than-a-human-reporter/all/1

《大西洋》月刊的轉(zhuǎn)載報(bào)道:

Predicted: In 15 Years, 90% of News Stories Will Be Written by Algorithms

預(yù)言:在15年內(nèi),90%的新聞將被計(jì)算機(jī)算法撰寫

原文:http://www.theatlantic.com/technology/archive/2012/04/predicted-in-15-years-90-of-news-stories-will-be-written-by-algorithms/256357/

以下為《連線》雜志全文

未來(lái)新聞90%以上將為電腦化新聞

Narrative Science(以下簡(jiǎn)稱“Narrative”)是一家專門訓(xùn)練計(jì)算機(jī)編寫新聞報(bào)道的公司。假如Narrative技術(shù)已經(jīng)能夠編寫出我今天撰寫的這篇文章,那我們很可能既不必提及該公司的芝加哥總部其實(shí)就在《芝加哥論壇報(bào)》(Chicago Tribune)報(bào)業(yè)大樓附近,也不必揭示出這種可能讓記者丟掉飯碗的潛在技術(shù),其實(shí)是部分誕生于美國(guó)西北大學(xué)梅迪爾新聞學(xué)院(Medill School)的媒體、整合營(yíng)銷通信項(xiàng)目。顯而易見(jiàn),這種諷刺意味其實(shí)是針對(duì)人類,而非計(jì)算機(jī)本身。

但至少目前尚未如此。

Narrative員工量為30名左右,該公司在芝加哥環(huán)路邊上有一個(gè)很大的房間。我們不妨試想一下這種場(chǎng)景:每隔30秒鐘左右,Narrative算法的如椽大筆就能撰寫出一則新聞報(bào)道,這無(wú)疑將引發(fā)我們進(jìn)行哲學(xué)高度的思考。這種計(jì)算機(jī)撰寫的新聞可以是美國(guó)大學(xué)籃球聯(lián)賽的Big Ten最新進(jìn)展情況,也可能涉及某家企業(yè)營(yíng)收的聲明,更可能是把多個(gè)Twitter信息匯總成有關(guān)賽馬的新聞。此類文章已在諸如《福布斯》以及其他知名媒體(其中不少媒體不愿透露其身份)的網(wǎng)站上發(fā)表。Niche新聞服務(wù)已聘請(qǐng)Narrative為其注冊(cè)用戶撰寫后續(xù)報(bào)道,使Narrative成為著他們的體育“粉絲”、小型投資者或快餐店老板。

事實(shí)上,通過(guò)Narrative算法所撰寫的文章,讀起來(lái)并不是那么晦澀和生硬。當(dāng)然,這種文章無(wú)法與美國(guó)體育評(píng)論作家羅杰·安吉爾(Roger Angell)的文風(fēng)相提并論。但這種敘述平實(shí)的文章,卻能很快將賽事結(jié)果等信息傳達(dá)給體育愛(ài)好者。Narrative利用iPhone用戶在GameChanger應(yīng)用程序中輸入的賽事得分結(jié)果等數(shù)據(jù),進(jìn)而撰寫出一篇篇文章。去年期間,這種軟件所生成的美國(guó)兒童棒球賽事帳號(hào)達(dá)40萬(wàn)個(gè),預(yù)計(jì)今年該數(shù)字將增至150萬(wàn)個(gè)。

Narrative聯(lián)合創(chuàng)始人兼首席技術(shù)官(CTO)克里斯蒂安·哈蒙德(Kristian Hammond)管理著一群編程人員和技術(shù)工程師。在哈蒙德看來(lái),這些文章只是計(jì)算機(jī)寫作的開始,最終計(jì)算機(jī)寫作的文章將在新聞產(chǎn)業(yè)中占據(jù)著主導(dǎo)優(yōu)勢(shì)地位。這種優(yōu)勢(shì)地位將究竟有多高?去年我曾要求哈蒙德回答這個(gè)問(wèn)題,他最初有點(diǎn)“王顧左右而言他”。但在我的連續(xù)追問(wèn)下,哈蒙德說(shuō)出了這樣一個(gè)數(shù)字:“90%以上?!?/p>

這也是我為何決定寫這篇文章的原因所在,并希望自己趕快完成,以免被一部MacBook Air筆記本電腦搶在我前頭發(fā)布了同類文章。

哈蒙德卻安慰我道,大不必為此而擔(dān)心。哈蒙德堅(jiān)稱,這種計(jì)算機(jī)撰寫的新聞稿,并不會(huì)讓新聞?dòng)浾叩热藛T丟掉飯碗,他們今后仍將能夠每月按時(shí)領(lǐng)取薪酬。隨著新聞產(chǎn)業(yè)規(guī)模的空前增長(zhǎng)和擴(kuò)大,計(jì)算機(jī)將通過(guò)相關(guān)數(shù)據(jù)而撰寫出成本低廉的新聞稿,此類文章將涵蓋大量活動(dòng)、產(chǎn)業(yè)趨勢(shì)和產(chǎn)品開發(fā),而這些領(lǐng)域目前尚未被傳統(tǒng)記者所關(guān)注。

然而這并不是說(shuō)計(jì)算機(jī)所撰寫文章,將永遠(yuǎn)處于邊緣化的位置,也不會(huì)永遠(yuǎn)被限定在一些小打小鬧或生成一些簡(jiǎn)單的企業(yè)營(yíng)收評(píng)論上面。哈蒙德最近曾被問(wèn)及這樣一個(gè)問(wèn)題:今后20年內(nèi),計(jì)算機(jī)所撰寫文章能否獲得普利策新聞獎(jiǎng)(Pulitzer Prize)?哈蒙德回答道,應(yīng)該用不了20年,5年之內(nèi)就可能實(shí)現(xiàn)該目標(biāo)。

Narrative公司與其創(chuàng)始人

哈蒙德生于美國(guó)猶他州,其父為一名考古學(xué)家,并在當(dāng)?shù)匾凰萘⒋髮W(xué)任教。成年后,哈蒙德原本計(jì)劃當(dāng)一名律師。但在上個(gè)世紀(jì)1980年代后期,也就是哈蒙德在耶魯大學(xué)上學(xué)期間,他深受知名人工智能專家、耶魯大學(xué)計(jì)算機(jī)系主任羅杰·尚克(Roger Schank)的影響。在拿到計(jì)算機(jī)科學(xué)博士學(xué)位后,哈蒙德受聘于芝加哥大學(xué),并擔(dān)任該大學(xué)一家新型人工智能實(shí)驗(yàn)室負(fù)責(zé)人。在該實(shí)驗(yàn)室工作期間(1990年代中期),他開發(fā)了一套可追蹤用戶閱讀、寫作習(xí)慣并向用戶推薦相關(guān)內(nèi)容的系統(tǒng)。

在該技術(shù)基礎(chǔ)上,哈蒙德創(chuàng)建了一家小型科技公司,后來(lái)他將該公司出售。這段時(shí)間中,哈蒙德進(jìn)入美國(guó)西北大學(xué)工作,并擔(dān)任該大學(xué)情報(bào)信息實(shí)驗(yàn)室主任。2009年期間,哈蒙德和他的同事拉里·伯恩鮑姆(Larry Birnbaum)在梅迪爾新聞學(xué)院教授一項(xiàng)課程,該課程同時(shí)包括電腦編程和未來(lái)新聞學(xué)兩項(xiàng)內(nèi)容。他們兩人鼓勵(lì)學(xué)生創(chuàng)建出可將數(shù)據(jù)轉(zhuǎn)移成新聞故事的系統(tǒng)。在該班學(xué)生中,有一位是《芝加哥論壇報(bào)》的特約記者,其報(bào)道范圍為美國(guó)高中生體育賽事。這名學(xué)生、以及另外兩位新聞系學(xué)生同一名計(jì)算機(jī)系學(xué)生被分成一組。該開發(fā)小組的原型軟件“Stats Monkey”,能夠搜集各大學(xué)、中學(xué)的體育賽事得分和相應(yīng)數(shù)據(jù)。

在那個(gè)學(xué)期結(jié)束時(shí),這個(gè)班級(jí)參與了該校舉辦的產(chǎn)品演示會(huì)。出席該演示會(huì)的新聞業(yè)人員,包括來(lái)自ESPN體育電視臺(tái)、Hearst報(bào)業(yè)集團(tuán)以及《芝加哥論壇報(bào)》的高管。Stats Monkey軟件給與會(huì)人員留下了深刻印象。梅迪爾新聞學(xué)院院長(zhǎng)約翰·拉文(John Lavine)回憶道:“他們將體育賽事得分?jǐn)?shù)據(jù)輸入到該程序當(dāng)中之后,大約12秒鐘之后,該程序就寫出了有關(guān)美國(guó)體育機(jī)構(gòu)歷史的文章,同時(shí)還配備了圖片和圖片文字說(shuō)明?!?/p>

美國(guó)網(wǎng)絡(luò)廣告公司DoubleClick(注:此前已被谷歌收購(gòu))前高管斯圖亞特·弗蘭克爾(Stuart Frankel)也是參與當(dāng)天演示會(huì)的嘉賓之一。弗蘭克爾說(shuō):“他們當(dāng)時(shí)一演示這款軟件后,房間里的氛圍馬上就變了。盡管如此,該產(chǎn)品也就僅僅是一款能夠撰寫有關(guān)棒球新聞報(bào)道的軟件而已?!睆腄oubleClick離職后,弗蘭克爾隨即加盟哈蒙德和伯恩鮑姆兩人的行列中。這種軟件能否撰寫任何新聞報(bào)道?能否使用任何數(shù)據(jù)?在得到肯定的回答后,弗蘭克爾認(rèn)定計(jì)算機(jī)寫作產(chǎn)業(yè)有著巨大增長(zhǎng)潛力。2010年期間,哈蒙德、伯恩鮑姆和弗蘭克爾共同創(chuàng)建了Narrative公司,弗蘭克爾出任該公司CEO。

Narrative首名客戶是一家報(bào)道美國(guó)大學(xué)籃球聯(lián)賽Big Ten會(huì)議的電視網(wǎng)絡(luò)。合同規(guī)定,Narrative算法將需要以相當(dāng)于實(shí)時(shí)方式,而撰寫出數(shù)千條有關(guān)Big Ten的體育新聞,同時(shí)每個(gè)季度對(duì)該賽事的數(shù)據(jù)和新聞進(jìn)行更新。Narrative還負(fù)責(zé)為美國(guó)女子壘球賽事撰寫文章,Narrative也因此變成為該賽事撰寫文章最多的“記者”。

在Narrative開始執(zhí)行合同后不久,就出現(xiàn)了一些小問(wèn)題:這些文章往往側(cè)重報(bào)道比賽勝出方。如果Big Ten的某只球隊(duì)被外圍球隊(duì)擊敗后,Narrative軟件撰寫的文章會(huì)讓人感到很丟臉。Big Ten賽事舉辦者因此向Narrative提出新要求:即使Big Ten的球隊(duì)輸球,Narrative文章仍能加以表?yè)P(yáng)。在這種情況下,多數(shù)人認(rèn)為應(yīng)該引進(jìn)人工記者加以干預(yù),但Narrative技術(shù)開發(fā)人員卻認(rèn)為無(wú)此必要,而只需對(duì)軟件代碼進(jìn)行相應(yīng)修訂。有過(guò)這次教訓(xùn)后,Narrative在負(fù)責(zé)為美國(guó)兒童棒球賽事進(jìn)行撰文過(guò)程中,也對(duì)相應(yīng)數(shù)據(jù)進(jìn)行了調(diào)整處理。

Narrative的新聞撰寫引擎需要數(shù)個(gè)步驟:首先,該引擎需要收集大量高質(zhì)量的數(shù)據(jù)。這也是金融業(yè)和體育產(chǎn)業(yè)能夠成為Narrative服務(wù)對(duì)象的直接原因:這兩個(gè)產(chǎn)業(yè)都涉及大量波動(dòng)性很強(qiáng)的數(shù)據(jù):每股收益、股價(jià)變化、壘球投手責(zé)任得分率(ERA)以及棒球打點(diǎn)(RBI)等。而新數(shù)據(jù)總是源源不斷,因此Narrative總能根據(jù)新數(shù)據(jù)撰寫出新文章或豐富舊內(nèi)容。

舉例來(lái)說(shuō),棒球“粉絲”們已創(chuàng)建了在比賽進(jìn)行過(guò)程中預(yù)測(cè)某個(gè)球隊(duì)勝算把握的模式。在此過(guò)程中,如果某個(gè)得分改變了勝算把握的幾率,比如由40%上升至60%,則Narrative算法就會(huì)將這個(gè)得分作為截止當(dāng)前比賽進(jìn)程中的亮點(diǎn)加以描述(比如Narrative必須知道擊跑數(shù)量最多的球隊(duì)將勝出)。因此Narrative技術(shù)工程師就為每種賽事或活動(dòng)預(yù)先設(shè)定一些規(guī)則。那么該如何做才能將這些分析數(shù)據(jù)變成文章?該公司招聘了一個(gè)所謂“元作者”的團(tuán)隊(duì),該團(tuán)隊(duì)由資深記者組成,以負(fù)責(zé)創(chuàng)建一系列報(bào)道題材的模板。該團(tuán)隊(duì)同Narrative技術(shù)工程師密切合作,使計(jì)算機(jī)能夠從不同“角度”來(lái)識(shí)別相應(yīng)數(shù)據(jù)。比賽結(jié)果是哪個(gè)球隊(duì)勝出?是艱難勝出還是大敗對(duì)方?比賽過(guò)程中是否有某位球員表現(xiàn)絕佳?該算法還根據(jù)比賽已知數(shù)據(jù)和其他數(shù)據(jù)庫(kù)進(jìn)行推測(cè):是否某個(gè)關(guān)鍵一擊起到了定勝負(fù)的作用?

然后就是文章結(jié)構(gòu)事宜。絕大部分新聞報(bào)道尤其是體育和金融題材,往往都會(huì)形成一個(gè)可預(yù)見(jiàn)的固定模式,因此創(chuàng)建相應(yīng)文章模板,就成為相對(duì)比較簡(jiǎn)單的問(wèn)題。該算法按照元作者提供的詞匯來(lái)組成句子(就壘球而言,元作者似乎會(huì)在很大程度依賴20世紀(jì)早期知名體育評(píng)論家林·拉德納(Ring Lardner)的寫作用詞習(xí)慣),該公司將這種完成后的產(chǎn)品稱為“敘事作品”(narrative)。

當(dāng)然這種算法偶爾也會(huì)犯些小錯(cuò)誤。比如說(shuō)棒球比賽中的代打者(pinch hitter)每場(chǎng)比賽只能代打一次,但Narrative算法所撰寫文章有時(shí)會(huì)將代打次數(shù)描述成2~6次。只是諸如此類的錯(cuò)誤很少出現(xiàn)。哈蒙德表示,有時(shí)數(shù)據(jù)庫(kù)也會(huì)提供錯(cuò)誤信息,而Narrative算法已具有糾錯(cuò)功能。哈蒙德說(shuō):“如果某家公司的季度利潤(rùn)環(huán)比增長(zhǎng)了600%,算法就會(huì)指出,很可能某個(gè)環(huán)節(jié)出現(xiàn)了錯(cuò)誤。人們會(huì)問(wèn)這樣的問(wèn)題:我們的算法是否出過(guò)令人難堪的大錯(cuò)誤,我們的回答是從未有過(guò)?!?/p>

《福布斯》媒體首席產(chǎn)品官劉易斯·德沃金(Lewis Dvorkin)表示,在對(duì)Narrative所報(bào)道的每一個(gè)賽事或其他活動(dòng)進(jìn)行了解后,他本人對(duì)此印象深刻但并不感到驚訝。盡管人工記者所撰寫文章出現(xiàn)重大錯(cuò)誤并不鮮見(jiàn),但德沃金并沒(méi)有聽(tīng)說(shuō)過(guò)有關(guān)計(jì)算機(jī)自動(dòng)新聞報(bào)道出錯(cuò)的任何投訴。德沃金說(shuō):“一次也沒(méi)有?!?/p>

新聞稿件文風(fēng)可以定制化

Narrative技術(shù)團(tuán)隊(duì)還讓客戶對(duì)文章基調(diào)加以定制化。美國(guó)金融分析公司Data Explorers在其安全資訊服務(wù)中使用了Narrative技術(shù)。Data Explorers首席運(yùn)營(yíng)官(COO)喬納森·莫里斯(Jonathan Morris)表示:“你可以獲得任何內(nèi)容,如文章讀上去像是一位金融記者正股票交易所大聲呼喊,或像一位理智的金融分析師正縱觀整個(gè)金融市場(chǎng)?!?/p>

莫里斯要求Narrative為Data Explorers撰寫的文章,將其基調(diào)處理成為一名受過(guò)良好教育、態(tài)度非常直率的金融新聞?dòng)浾?。其他客戶則要求Narrative將文章處理成更為活潑的博客文風(fēng)。Narrative產(chǎn)品副總裁拉里·亞當(dāng)斯(Larry Adams)對(duì)此表示:“截止目前,Narrative要撰寫一篇言辭活潑文章的難度,并不會(huì)比寫一篇中規(guī)中矩的文章高多少。我們甚至能夠以美國(guó)知名新聞評(píng)論人、1972年普利策新聞獎(jiǎng)得主邁克·羅伊科(Mike Royko)式的文風(fēng)來(lái)報(bào)道股票市場(chǎng)?!?/p>

在Narrative掌握如何報(bào)道體育和財(cái)經(jīng)新聞的“玄機(jī)”后,該公司意識(shí)到,其實(shí)還可以將Narrative算法應(yīng)用范圍擴(kuò)大到除新聞報(bào)道的其他領(lǐng)域。事實(shí)上,任何人希望翻譯或處理大一堆數(shù)據(jù),都可從Narrative算法中受益良多。Narrative接到了大量數(shù)據(jù)處理的請(qǐng)求,試用結(jié)果發(fā)現(xiàn),這些客戶愿意向Narrative付費(fèi),進(jìn)而使自己雜亂無(wú)意的數(shù)據(jù),能夠變?yōu)楹?jiǎn)潔明快并切中要害的句子。

顯而易見(jiàn),Narrative算法經(jīng)過(guò)改進(jìn)提高后,肯定能滿足此類數(shù)據(jù)處理要求。Narrative剛剛創(chuàng)建時(shí),該算法每接觸一個(gè)新的報(bào)道主題,“元作者”們必須費(fèi)盡心機(jī)來(lái)對(duì)機(jī)器進(jìn)行“培訓(xùn)”。但不久后元作者們開發(fā)出一款平臺(tái),從而使Narrative算法能夠更快了解新的業(yè)務(wù)領(lǐng)域。舉例來(lái)說(shuō),如果某位元作者希望創(chuàng)建一臺(tái)可報(bào)道某個(gè)城市飯店服務(wù)業(yè)的寫作機(jī)器,那么利用數(shù)據(jù)庫(kù)中的賓館評(píng)論文章,該機(jī)器就能很快了解飯店業(yè)的常用詞匯(服務(wù)良好、美食等等)。元作者們還給機(jī)器提供一些該行業(yè)的常見(jiàn)句子。在經(jīng)過(guò)此種“培訓(xùn)”后,數(shù)小時(shí)內(nèi)Narrative算法就能撰寫出諸如“亞特蘭大市最佳意大利飯館”之類的文章。

Narrative主要競(jìng)爭(zhēng)對(duì)手為Stat Sheet公司,后者總部位于美國(guó)北卡羅來(lái)納州,主營(yíng)業(yè)務(wù)為自動(dòng)文章創(chuàng)建,其業(yè)務(wù)范圍在經(jīng)過(guò)擴(kuò)張后,與Narrative有不少重疊之處。由于自感無(wú)法與Narrative展開直接競(jìng)爭(zhēng),Stat Sheet將其服務(wù)目標(biāo)定為小型報(bào)刊雜志。另一方面,Stat Sheet也開始涉足體育新聞報(bào)道。在認(rèn)識(shí)到計(jì)算機(jī)撰寫新聞產(chǎn)業(yè)具有巨大增長(zhǎng)潛力后,Stat Sheet將公司名稱更改為“Automated Insights”。該公司創(chuàng)始人羅比·艾倫(Robbie Allen)說(shuō):“以前我曾認(rèn)為,我們的業(yè)務(wù)范圍很窄,即僅限于數(shù)據(jù)處理產(chǎn)業(yè)?,F(xiàn)在看來(lái)我們應(yīng)該是商機(jī)無(wú)限?!?/p>

Narrative算法的業(yè)務(wù)范圍也變得越來(lái)越多樣化。Narrative曾受聘于一家快餐公司,被要求根據(jù)該快餐公司經(jīng)銷商所提供食品銷量數(shù)字而撰寫出每月報(bào)告,并將這些銷售數(shù)字同本地競(jìng)爭(zhēng)對(duì)手進(jìn)行比較,然后向該快餐公司提出應(yīng)該推出哪些新菜品的建議。

此外,這種低成本數(shù)據(jù)輸入后變成文章的操作方式,甚至能夠針對(duì)單一讀者撰寫文章。Narrative正考慮撰寫針對(duì)《魔獸世界》玩家的個(gè)性化費(fèi)用支出報(bào)告,玩家們就能對(duì)自己近一段時(shí)間內(nèi)的游戲費(fèi)用有著更全面了解。Narrative董事會(huì)成員、前DoubleClick首席執(zhí)行官戴維·羅森布拉特(David Rosenblatt)表示:“互聯(lián)網(wǎng)所產(chǎn)生數(shù)據(jù)的規(guī)??芍^前所未有,Narrative能夠?qū)⑦@些數(shù)據(jù)轉(zhuǎn)化成文章。這就是Narrative必須存在的理由。我們以撰寫新聞報(bào)道為主,報(bào)道管理為輔?!?/p>

光榮與夢(mèng)想

截至目前,新聞報(bào)道仍是Narrative的核心業(yè)務(wù)。與任何剛出道的新聞?dòng)浾咭粯?,Narrative也有著自己的“光榮與夢(mèng)想”:能夠參與重大新聞事件的首發(fā)和后續(xù)報(bào)道。而要實(shí)現(xiàn)這一目的,Narrative仍需在機(jī)器學(xué)習(xí)、數(shù)據(jù)處理等事宜上進(jìn)行大量投資,從而使機(jī)器能夠更為準(zhǔn)確理解人類語(yǔ)言和文字。事實(shí)上,Narrative在這方面已取得一些進(jìn)展。哈蒙德說(shuō):“就金融業(yè)而言,我們算法能夠讀懂文章頭條,能夠識(shí)別某家企業(yè)股票的漲跌,了解到某位高管受聘或解聘,明白某家公司正制定并購(gòu)計(jì)劃。同時(shí)我們知道這些事件同公司股價(jià)波動(dòng)之間的關(guān)系?!惫傻逻€表示,今后在Narrative所撰寫體育新聞報(bào)道中,除常規(guī)的數(shù)據(jù)內(nèi)容外,還將增加球員受傷或面臨法律起訴等信息。

即便Narrative永遠(yuǎn)也無(wú)法實(shí)現(xiàn)獲得普利策新聞獎(jiǎng)的目標(biāo),其文章可能永遠(yuǎn)也不會(huì)具備美國(guó)作家瓊·狄迪恩(Joan Didion)那種犀利的文風(fēng),但無(wú)論如何,該公司確實(shí)認(rèn)識(shí)到了這樣一個(gè)事實(shí):我們的日常生活活動(dòng),正越來(lái)越多被轉(zhuǎn)化為海量數(shù)據(jù)。舉例來(lái)說(shuō),過(guò)去數(shù)年中,美國(guó)職業(yè)棒球大聯(lián)盟已投資數(shù)百萬(wàn)美元,以在比賽場(chǎng)地安裝高分辨率攝像頭和高強(qiáng)度傳感器,目的是分析每場(chǎng)比賽中各位球員的表現(xiàn)情況,如球員身體動(dòng)作和棒球運(yùn)動(dòng)軌跡等信息。在不少情況下,體育新聞報(bào)道的取材就來(lái)自于這些數(shù)據(jù)當(dāng)中?;蛟S球隊(duì)教練并沒(méi)有意識(shí)到,自己所帶領(lǐng)球隊(duì)之所以被擊敗,主要原因就是球員身體過(guò)度疲勞所致。而這些結(jié)論,通常都需要數(shù)據(jù)作為強(qiáng)有力證據(jù)。

哈蒙德相信,隨著Narrative市場(chǎng)規(guī)模的進(jìn)一步增長(zhǎng),其業(yè)務(wù)范圍也將形成更為高端的“食物鏈”:從社區(qū)新聞到新聞分析,最終再進(jìn)入長(zhǎng)篇深度報(bào)道業(yè)務(wù)。從某種程度上講,人工記者和計(jì)算機(jī)算法或許能夠協(xié)手合作,并發(fā)揮出各自優(yōu)勢(shì)。計(jì)算機(jī)的優(yōu)勢(shì)在于記憶無(wú)差錯(cuò),并能夠快速訪問(wèn)各類數(shù)據(jù)。而人工記者在進(jìn)行采訪過(guò)程中,能夠做到“直奔主題”,在獲得相關(guān)材料后,再將撰寫文章的任務(wù)交給計(jì)算機(jī)。隨著計(jì)算機(jī)處理此類任務(wù)次數(shù)的增長(zhǎng)并能夠獲得更多數(shù)據(jù),計(jì)算機(jī)的“敘事”技巧也將越來(lái)越高。當(dāng)然,要達(dá)到這一階段我們可能尚需等上一段時(shí)間。但最終有一天,或許類似我的這篇文章,根本就不需要我本人動(dòng)手來(lái)寫。哈蒙德說(shuō):“人類思考能力非常強(qiáng)大,也異常復(fù)雜,而電腦不過(guò)是機(jī)器而已。今后20年內(nèi),將不存在Narrative無(wú)法勝任的新聞報(bào)道領(lǐng)域。”

就目前而言,哈蒙德一再?gòu)?qiáng)調(diào),Narrative算法并不是為了取代人工記者。哈蒙德透露,自己曾出席一次晚會(huì),在那兒遇到了一名戲劇評(píng)論家。該評(píng)論家了解了哈蒙德的Narrative業(yè)務(wù)模式后,便對(duì)哈蒙德橫加指責(zé),稱當(dāng)前新聞從業(yè)者的日子已經(jīng)過(guò)得很艱難,Narrative怎么忍心讓寫作機(jī)器人來(lái)?yè)屪咝侣動(dòng)浾叩娘埻耄?/p>

哈蒙德回憶道:“我當(dāng)時(shí)盯著他回答說(shuō),難道你在美國(guó)兒童棒球小聯(lián)盟(Little League)賽場(chǎng)上看見(jiàn)過(guò)記者的身影嗎?搞清這一點(diǎn)對(duì)我們而言非常重要。尚沒(méi)有任何新聞?dòng)浾咭騈arrative開展的各項(xiàng)業(yè)務(wù)而丟掉飯碗。”

至少目前尚未如此。

原創(chuàng)文章,作者:劉曉林,如若轉(zhuǎn)載,請(qǐng)注明出處:http://shjqd.com/blog/archives/1622

China-PRNewsire-300-300