在這個資訊爆炸的時代,我們可以從不同來源接收到各式各樣的資訊,無論是醫療保健、新聞時事、人生哲理等,無奇不有。「這些資訊到底是真是假阿? 」這個問題或許變成大家心中最常冒出的疑問。如何從五花八門的訊息中,找出不正確的資訊並拒絕接收,成為一個很重要的課題。

不實資訊影響多、速度快、流通廣

以語言蠱惑人心,謠言、懷疑、仇恨作為火種,藉資訊科技來擴散,在這個社群普及、注意力經濟主導的時代,人人都可以快速地傳遞訊息,根據MIC 2020年的研究,twitter每日的發文量達5億則,而Facebook更達到80億則,不實資訊的傳播的層面可說是多、快且廣。

全球最多使用者的社群媒體(圖片來源:MIC,2020)
圖說:全球最多使用者的社群媒體(圖片來源:MIC,2020)

不實訊息也有快篩試劑–與台灣事實查核中心合作

台灣作為資訊戰場的前沿,民間有不少事實查核團隊(台灣事實查核中心、MyGoPen、蘭姆酒吐司、CoFacts 真的假的)應運而生。而資策會服創所從2019年底開始與台灣事實查核中心合作,結合台灣事實查核中心的專業實務與資策會的技術能力,啟動實證合作,共同探索並開發中文語境的AI闢謠技術。

事實查核的流程可以分成以下5個步驟:
1.監測、蒐集與選題
2.工作分派
3.拆解謠言內容、列出疑點並查證
4.撰寫查核報告並發布
5.成效追蹤

事實查核工作流程
圖說:事實查核工作流程

在了解事實查核的工作流程後發現以下痛點:在選題方面,人工方式檢視及統計民眾舉報疑似謠言,拖慢選題速度,且無法即時掌握正在傳播的謠言跟客觀的統計謠言擴散的程度。工作分派上也耗費大量人力做相似謠言的統計,舊的謠言再起時,也僅能憑記憶或是人工確認。有鑑於此,服創所團隊開發出不實訊息快篩平台「謠言捕手」來協助台灣事實查核中心,去年底以來陸續成功整合該機構提供的多個讀者提報和申訴資訊源,包括查核中心LINE和Messanger聊天機器人、查核中心官網申訴專區、Co-facts真的假的資料庫等,運用異質資料擴增比對暨群組技術處理申訴訊息並建構快篩儀表板,透過簡潔簡單的介面,使查核團隊得以一眼掌握讀者提問的傳言頻率次數、內容版本等。

用謠言的語言特徵開發的「風險鑑識指標」

透過文獻研究與台灣事實查核中心的查核實務專業協助下,團隊也發現虛假訊息經常含有一些特定的語言特徵,如:呼籲提醒用語、武斷用語、情緒用語等,我們以下圖中已被查證為錯誤的網傳訊息為例,它以「非常毒」來引起閱聽者的恐懼情緒,加上武斷的說「全面消毒」,並輔以大量呼籲採取行動的用詞,加深分享意願,訊息中充滿不實訊息經常出現的文字風格。

圖說:虛假訊息文字舉例

服創所團隊建立AI模型,從訊息文本的行文語言風格中,自動偵測內文裡有哪些句子具有六種不實訊息經常使用的語言風格(武斷、情緒、冠名/親身見證、呼籲提醒、社交分享、推論),準確率可達87%。
接著,服創所團隊再將整篇訊息所偵測到的語言特徵轉換成文章的特徵向量分布,以類神經網路所訓練的真假訊息偵測模型,辨識該特徵分布與假訊息的特徵分布接近程度,以預測訊息為假的可疑程度,得出危險分數與危險等級,建構出不實訊息的自動化風險評估指標。

圖說:不實訊息常用6大語言特徵

查克佬Check It Out!資策會推出Chrome擴充功能提供不實訊息風險評估服務

網路謠言高居台灣網路亂象之首,尤其是以賺取點擊率為目標的內容農場,更經常成為謠言集散地,民眾面對五花八門的資訊,心中不免懷疑「這些資訊到底是真是假?」
資策會團隊擷取上述部分技術,推出不實訊息的Chrome Extension服務,不只可提供查核人員使用,更可擴及有訊息查證需求的新聞媒體業和一般大眾,讓使用者可一鍵將可疑訊息傳回本服務,對事實查核報告資料庫進行比對,告知該訊息是否已經過專業的事實查核組織查證;若未經過查證,則運用資策會的不實訊息風險評估技術,來預測近似謠言的風險值,作為警示,讀者更可以下載語言特徵分析報告,瀏覽訊息中那些文字使用了不實訊息經常使用的語言特徵,來培養謠言敏感度。

「人工智慧」與「擴增智慧」(AI & IA;intelligence augmentation)並重,持續深耕事實查核技術

謠言自古就有,更隨著科技進展而日新月異,服創所團隊持續深耕事實查核技術,正在把技術研發觸角從文字拓展到圖像與影像型謠言的查核輔助工具,除了在文字方面致力於開發具有可解釋性的查核技術與工具之外,更將結合資策會內外部其他研發團隊,共同發展多模態鑑識技術,以因應不實訊息集語音、影像、文字的偽造於一身的多重樣態特性。

下載「查克佬」

延伸閱讀:

「AI鑑識技術與台灣不實訊息聯防體系技術」勇奪2項大獎

「謠言捕手」撒下天羅地網 防堵超過三百則謠言不實訊息

在〈AI鑑識技術與事實查核科技,讓不實訊息無所遁形〉中有 1 則留言

發表迴響