AI應用落地再起高潮，高智商AI反殺詐騙犯

浪潮信息

2022-12-21 11:46 5257

北京, 2022年12月21日 /美通社/ -- 近日，B站一位開發(fā)者UP主基于開源大模型"源1.0"，開發(fā)了一個能夠無障礙進行微信聊天的人工智能"小源"，并在與騙子的真實對話場景中進行測試，破解"殺豬盤"詐騙套路，識破詐騙話術(shù)，進而加深公眾對詐騙套路的認識，增強公眾的反詐騙意識，減少網(wǎng)絡詐騙受害者。

"殺豬盤"是當下一種交友婚戀類網(wǎng)絡詐騙：詐騙分子利用網(wǎng)絡交友，誘導受害人投資賭博的電信詐騙方式。

詐騙分子準備好人設、交友套路等，通過建立戀愛關(guān)系，最后騙取錢財，而他們的目標女性一旦被鎖定，無論最終結(jié)果如何，都將"渡劫"。從此類詐騙手段的名稱——"殺豬盤"就能看出，在這場圈套中，目標女性已不再被詐騙分子視為"人"，而是渾身洋溢著金錢味道、等待被用感情裝飾的大刀揮下的"豬"，目的極其惡劣。

以"殺豬盤"為代表的情感詐騙，不僅給受害者帶來巨大金錢損失，更帶來嚴重感情傷害，甚至屢屢導致自殺事件發(fā)生。

詐騙團伙一般身處境外，偽造身份信息并通過各種社交平臺尋找對象，若要根除這些團伙仍需時間，因此自身防范與識破套路的防御能力就變得尤為重要。

然而"以身試險"代價太大，在這個高科技發(fā)達的時代，能用魔法打敗魔法嗎？

情感詐騙毒瘤"殺豬盤"，用黑科技打敗黑魔法

先看下這幾張聊天截圖：

小源是一線城市獨生女，房車雙全，工作體面穩(wěn)定，唯獨愛情還未開花結(jié)果，但她在賽博世界遇上了一份緣。

而對面正是一位從事金融行業(yè)的北京男孩，不僅性格爽朗體貼，經(jīng)濟上更是獨立，隨便一個項目就能小賺幾百萬，對她還很熱情。

但都說談錢傷感情，小源也未能幸免，面對投入資金進行共同投資的要求，我拒絕了對方，他因此認為小源沒有和他走下去的心意，后來甚至惡語相加。

很明顯，小源成為了這次殺豬盤的目標，但也不要太為"她"捏把汗。

因為嚴格來講，上述聊天截圖真假參半，真的是：確實在與懷有別樣目的性的男士在文字聊天，假的是：這位女生并非真實人類，而是人工智能。

這是一位開發(fā)者B站up主@圖靈的貓基于開源預訓練中文模型"源1.0"，開發(fā)了一個能夠無障礙進行微信聊天的人工智能"小源"，并在與騙子的真實對話場景中進行測試，試著觀察AI如何與騙子斗智斗勇。

為了讓騙子上鉤，@圖靈的貓在多個社交平臺注冊了賬號，然后根據(jù)反詐中心發(fā)布的受害者畫像，為賬號定位了單身、多金、高學歷乖乖女等身份標簽。果不其然私信爆炸。

AI通過大量學習，能更好地掌握對話規(guī)則，反套路詐騙犯，破解"殺豬盤"詐騙套路，識破詐騙話術(shù)，進而加深公眾對詐騙套路的認識，增強公眾的反詐騙意識，減少網(wǎng)絡詐騙受害者。

目前@圖靈的貓已將這一AI反詐項目已在Github上開源：

https://github.com/Turing-Project/AntiFraudChatBot

"殺豬盤"往往是有套路的，AI在對話中，又是如何見招拆招的呢？

當詐騙份子遇上AI：一場各懷心思的文字交鋒

這是一場文字上的交鋒，哪怕是AI上場，所謂的"見招拆招"需要有豐富的語料作為儲備。

本次項目基于的NLP大模型浪潮"源1.0"是浪潮人工智能研究院研發(fā)成功的大規(guī)模中文語言模型，參數(shù)量高達2457億，于2021年9月發(fā)布時即超越此前由美國OpenAI組織研發(fā)的1750億參數(shù)量的英文語言模型GPT-3，成為全球最大規(guī)模的人工智能語言模型。

有了"源1.0"作為智能基礎(chǔ)，開發(fā)者還在對話機制上進行了一些設計，讓AI對話起來更加自然，比如：設定每條信息的回復間隔，模擬真實打字速度（total_len / 10 * 2s)。

萬事具備，就開始交鋒吧。另外，作為一名潛在受害者，小源也并非事先知道哪位找她來聊天的是詐騙犯，"她"將和我們一起在溝通中發(fā)現(xiàn)蛛絲馬跡并進行防御，"她"發(fā)現(xiàn)蛛絲馬跡的過程正是為公眾識別詐騙做出的示范。

當然為了避免誤傷，開發(fā)者設定了一些嚴格的篩選條件，例如人設背景完美但關(guān)鍵信息模糊、照片確認為網(wǎng)圖、從事如私募、證券或投行等高端行業(yè)等，滿足這些條件的人才會讓小源接管對話。

之前就提到"殺豬盤"有一套嚴格的詐騙套路，規(guī)范的話術(shù)流程，詐騙犯把受害者叫做"豬"：

第一步，"找豬"指私加好友。面對小源，詐騙犯也一上來就通過旁敲側(cè)擊來打聽女生的現(xiàn)實情況，小源也會根據(jù)對方提供的信息做出反應，一些俏皮玩笑語句輸出，讓對話有來有回。

第二步，"喂豬"指盜用他人優(yōu)質(zhì)資料包裝自己，灌輸自己很成功、很優(yōu)秀等信息，獲取受害者的信任。

開始了開始了，他開始裝了。沒關(guān)系，根據(jù)他給的信息，小源也會給他舞臺，還給對方起了"富哥"作為昵稱，拉進彼此距離。

第三步，"養(yǎng)豬"指戀愛過程，這也是往往受害者放下警惕，交出信任的過程，詐騙犯在這一步都表現(xiàn)得深情款款，試圖讓對話氛圍蜜里調(diào)油，并且說一些套路騷話來確認"戀愛關(guān)系"。

到了這一步，小源已經(jīng)識別出他是詐騙犯了，那么為了反套路詐騙犯，小源裝作上套，也表示喜歡詐騙犯。

"殺豬盤"其實就是一種規(guī)則化、模式化的對話博弈，詐騙犯本就毫無真心真情，只求在一來一回的對話中讓受害者放低心理防御。在開發(fā)過程中，傳統(tǒng)的無目標導向的"開放域?qū)υ?quot;或"詞槽式目的域?qū)υ?quot;方案都表現(xiàn)不佳。

與GPT-3不同的是，"源1.0"更加擅長的是零樣本（Zero-Shot）和小樣本（Few-Shot）學習，而非目前更多模型所擅長的微調(diào)試學習（finetune）。在中文語言理解評測基準CLUE榜單的零樣本學習（zero-shot）和小樣本學習（few-shot）均取得過總榜第一的成績。

從實際應用效果來看也確實如此，在1~ 3個，甚至只有1個合適example的示范下，模型就可以實現(xiàn)開發(fā)者希望達到的"對話策略"，比如反套路、用語料拋梗等等，讓AI看起來能夠?qū)︱_子具備識別能力，本質(zhì)上這也是一種query->value的查詢匹配。

而開發(fā)者在本次項目中，example語料主要抽取自B站和貼吧的熱門評論，一來因為評論是天然的對話形式，有顯式的回復與被回復關(guān)系；二來自古評論出人才，一些金句和?？梢园讶藱C對話變得不那么生硬，就像"富哥V5"、"小黑子，露出雞腳了吧"，以及"喵"、"捏"都是頗具網(wǎng)感的語句和語氣助詞。

具體語料經(jīng)過人工篩選，過濾不當言論，再處理成prompt格式。以下是Prompt Example的生成樣例：

第四步，"殺豬"指欺詐過程。這是詐騙犯的終極目標，于他們而講，能不能成就這一哆嗦了，而對受害者來說，這也是涉及財產(chǎn)有無損失的關(guān)鍵一步。

在這個項目里，詐騙犯在循序漸進、有意無意地總是提到一個利潤率很高的項目，試圖給對方留下高回報率的印象。

這是一個連環(huán)計，這時候就要考驗到AI的記憶力了。由于微信聊天是多輪對話，AI有時并不記得自己或?qū)Ψ缴弦痪湔f過什么。

"源1.0"具備記憶能力，開發(fā)者同時參考了LSTM的思想，為系統(tǒng)增加了記憶機制，具體機制如下：

聊天記錄放入記憶區(qū)，在每次回復時計算相似度，超過相似度閾值的歷史對話將被AI讀取使用；并且設定遺忘窗口M，超過M/2輪次的對話將被pop() 這樣，AI就能夠?qū)崿F(xiàn)簡單的長短期對話記憶，比如昨天聊過的內(nèi)容或上一輪對話內(nèi)容。

帶著這樣的記憶，當過了兩天當詐騙犯再試圖和小源聊天時。小源也順著對方問出了"在哪里可以買到"的話：

當然，聊歸聊，開發(fā)在進行開發(fā)時就給小源加上了"思想鋼印"——凡是涉及投資理財、引導資金投入的都是詐騙。

哪怕是面對詐騙犯的威逼利誘，小源依然不為所動，堅持聲稱自己沒有錢，并提出向詐騙犯借錢。

到了后來，AI直接金蟬脫殼來一波反殺，面對PUA話術(shù)和挑釁行為，直接點出對方違法要求和"她"去警局自首，反將一軍。

AI向善，感性與創(chuàng)新引導下的理性應用

據(jù)開發(fā)者@圖靈的貓介紹，對話中的這位Henry騙子哥，只是主動找上"小源"的其中一位聊天對象，還有13位"嫌疑詐騙分子"，這個數(shù)字還是在開發(fā)者已經(jīng)進行了一波篩選之后。

小源完美的待嫁單身女生形象，吸引了無數(shù)人，私信爆炸?？梢韵胂?，同樣條件的人類女生在社交網(wǎng)站上是多么危機四伏，隨時都可能成為受害對象。

人類和AI的最大不同在于，多數(shù)時候人類的感性是占據(jù)上風的，做不到AI那樣的絕對理性，所以才會不知不覺間落入圈套。

但正是這樣感性的驅(qū)動下，AI在我們?nèi)粘Ｉa(chǎn)生活所發(fā)揮的空間才無窮，因為人工智能等先進技術(shù)的本質(zhì)仍是工具，而工具所謂的善惡傾向則取決于人類的出發(fā)點。

就如同@圖靈的貓這樣的開發(fā)者因為身邊有遇到過殺豬盤的朋友們，進而義憤填膺基于"源1.0"大模型開發(fā)出AI反詐"工具人"小源，提醒廣大女性提高警惕性，注意防范網(wǎng)絡上的陌生人。

人類善用AI的智慧定會勝過日益強大的AI技術(shù)。

如今，人工智能已經(jīng)從點到面滲透到更多行業(yè)、更多領(lǐng)域的各類場景，創(chuàng)新不斷。作為通用的巨量中文AI模型，"源1.0"具備優(yōu)秀的自然語言理解和自然語言生成的能力，可以作為新一代認知智能的引擎，適應廣泛的下游AI任務，自開源問世以來，不少開發(fā)者和相關(guān)機構(gòu)都基于此進行了諸多創(chuàng)新應用。

"源1.0"可以完成各種風格、類型文本的生成，如新聞資訊、金融行研、辦公公文、法律文書、廣告營銷、網(wǎng)絡文學、詩詞歌賦、食譜菜譜等。

超1000家用戶，采用"源1.0"提供的數(shù)據(jù)和API顯著提升了金融、互聯(lián)網(wǎng)、醫(yī)療和自動駕駛等行業(yè)應用的精度；

源1.0已經(jīng)與多個行業(yè)用戶開展深度合作，支持手機智能語音助手、大型互聯(lián)網(wǎng)翻譯平臺等應用的AI智能化升級……

除了這些相對"常規(guī)"的操作，不少開源社區(qū)的開發(fā)者們通過源1.0的開放開源平臺進行了創(chuàng)意實現(xiàn)。

在文娛方面，一群來自上海學生開發(fā)者創(chuàng)作的"AI劇本殺"就是其中代表，曾在GitHub引發(fā)熱烈討論。

Github鏈接：https://github.com/bigbrother666sh/shezhangbujianle

在心理輔導方面，自香港浸會大學社會工作系副教授陳智達教授負責的運用AI模擬求助者支援社會服務工作者培訓項目。

在上述案例中，AI在不同領(lǐng)域以意想不到的方式發(fā)揮著自己的潛力，也幫助著訴求不同的開發(fā)者們拓寬創(chuàng)新的邊界。這些創(chuàng)新想法或許早就出現(xiàn)在他們富有想象力的腦海中，而將"靈光乍現(xiàn)"變成可實現(xiàn)、可落地的應用，很大程度上需歸功于外部技術(shù)環(huán)境的變化，例如，如今以"源1.0"為代表的大模型已經(jīng)成為人工智能算法基礎(chǔ)設施，正在普惠千行百業(yè)。

事實上，創(chuàng)新往往并非無中生有的頓悟，而是某一領(lǐng)域發(fā)展到一定階段、厚積薄發(fā)的涌現(xiàn)，技術(shù)是向善的工具，亦是創(chuàng)新萌發(fā)的沃土。

消息來源：浪潮信息