識謠言、辨假貨 人工智能已活躍在打假一線


識謠言、辨假貨 人工智能已活躍在打假一線



“當真相在穿鞋的時候 , 謊言已經跑遍全城 。 ”現代社會 , 虛假新聞、圖片、視頻 , 甚至商品等借助網絡渠道迅速傳播 。 近日公布的《中老年人上網狀況及風險網絡調查報告》顯示 , 近六成中老年曾遭受過網絡謠言的危害 。
人們常說“流言止于智者” , 要想不被網上的流言和謠言盅惑、傷害 , 首先需要對其進行科學甄別 , 而時下人工智能正在嘗試擔任這一角色 。 那么 , 在打假一線AI技術如何做到去偽存真?這樣的“本領”可應用在哪些領域?
海量資訊發布 , 傳統識謠模式受限
“虛假信息的產生主要有兩類動機:一類是利益驅動 , 2018年發表于《科學》的研究發現 , 要達到相同的傳播深度 , 虛假信息的速度是正常信息的20倍;另一類是政治驅動 , 在現有互聯網經濟中 , 高效傳播代表著高額經濟價值 , 人工智能技術會被不法分子用來左右公眾對于政治的認知和判斷 , 從而控制輿論 , 威脅政治安全 。 研究顯示 , 2016年美國總統大選期間 , 受訪選民平均每人每天接觸到4篇虛假新聞 。 虛假新聞被認為影響了2016年美國大選和英國脫歐的投票結果 。 ”中科院計算所副研究員、博士生導師曹娟在日前北京舉辦的Women Who Code講座上介紹 。
為了減少虛假信息 , 有必要對網絡新聞進行認證 。 但大型資訊聚合類平臺每天的新聞發布量一般在50萬條以上 , 顯然完全依靠人工認證是不現實的 , 面向公眾 , 亟待建立高效的AI識謠平臺 。
杜克大學新聞研究中心的調查顯示:截至2018年2月 , 全球共有149個正在活躍運營的事實核查類新聞創業項目 , 其中北美和歐洲74個、亞洲7個 。 而在一些國外社交平臺上 , 已有自動化可信度評估插件來顯示信息的可信度 。
據了解 , 目前國內已有的主要識謠、辟謠平臺基本還是依靠專家識別模式 , 其存在一定的問題:發現線索主要依賴用戶舉報 , 數量有限 , 時效性不強 , 往往是事件已造成負面影響才“后知后覺”;此外 , 新聞認證速度有待提高 。 Facebook統計 , 依靠專家辟謠的認證模式平均滯后3天 , 錯失辟謠最佳時期;覆蓋類別受限 , 專家只能在自身擅長的領域辟謠 , 領域專家庫的多樣性決定了人工辟謠平臺的能力上限 。
為提高識謠效率 , 目前中科院計算機研究所、阿里、騰訊等多家企業和機構已經開展了人工智能識謠工作 。 曹娟帶領團隊從2013年開始致力于開展基于人工智能技術的虛假信息檢測研究 , 她介紹 , AI識謠公眾平臺可自動及時發現可疑線索并進行認證 , 大大降低謠言可能帶來的危害;通過機器學習算法輔助人工審核 , 僅需1分鐘即能對疑似謠言事件發出預警;基于數據驅動的方法 , 平臺還可不斷挖掘出不同類別謠言的特性 , 實現對各種謠言地自動識別 。
不過 , 需要指出的是 , “虛假信息識別是一個高度復雜的問題 , 一方面是虛假的定義并不明確 , 需要不確定性建模;另一方面是標注很困難 , 需要小樣本學習方法 。 目前 , 機器學習算法的準確率尚不足以完全取代人類 , 但已能夠輔助人類更快更好地審核新聞 。 ”曹娟表示 。 正如扎克伯格所說 , “想要完全依靠AI審核內容 , 可能尚需5—10年時間” 。
多模態、多層次、多角度揪出假新聞
“虛假新聞往往從選題、文字表述 , 到配圖都呈現出較強煽動性:一般選題集中于社會熱點或爭議點;文字描述中情感激烈;配圖具有視覺沖擊力等 。 ”曹娟剖析道 。
曹娟介紹 , 目前 , 中科院計算所開發的辟謠平臺已積累數萬條假新聞信息 , 累計認證數十萬次 。 通過平臺積累的數據 , 目前可從新聞質量的角度把杜撰的新聞文本大致分為三類:一完全杜撰 , 往往是在真實存在的實體上編造情節;二半真半假 , 可能描述的前半段是真 , 后半段就展開不可靠的想像 , 或者一部分是真 , 但在關鍵情節上添油加醋;三舊聞新傳、移花接木 , 事件本身可能存在 , 但發布者故意模糊化甚至篡改原事件中的時間、地點 , 讓人誤以為事情剛剛發生在當地被 。

推薦閱讀