借助AI技術 Facebook開發出更快更精確翻譯方法


借助AI技術 Facebook開發出更快更精確翻譯方法



據印度《經濟時報》9月2日報道, Facebook的研究人員已經開發出了一種更快、更準確的方法, 使用人工智能翻譯烏爾都語和緬甸語等低資源語言 。
據《福布斯》雜志報道, 這項突破將在自然語言處理頂級會議 EMNLP上展示 。 由于Facebook這一社交媒體巨頭使用自動語言翻譯來幫助世界各地的用戶閱讀適用他們的語言的帖子, 因此這一突破對其可能很重要 。
Facebook人工智能研究院 ( FAIR )部門的團隊, 從維基百科等公開網站中獲取大量不同語言的不同文本, 以此來提升機器翻譯 (MT) 。
需要注意的是, 這些文本是相互獨立的 。 “建立一個平行語料庫很復雜, 因為你需要找到精通兩種語言的人來創建它 。 例如, 如果你想建立一個葡萄牙語和尼泊爾語的平行語料庫, 需要找到精通這兩種語言的人, 這是非常困難的, ”研究科學家兼FAIR巴黎研究實驗室主任Antoine Bordes表示:“另一方面, 建立葡萄牙語和尼泊爾語單語語料庫非常容易:無論它們是否為平行句子, 也不管它們談論的是否為同一件事, 你只需要從葡萄牙語和尼泊爾語網站下載網頁就可以了 。 ”
【借助AI技術 Facebook開發出更快更精確翻譯方法】大多數語言翻譯計算機系統使用單語語料庫和平行語料庫來學習 。 Bordes稱:“我們方法的新穎之處在于, 只用從單語語料中提升MT系統, 我們不需要任何平行語料 。 理想化來說, 如果一本書是用外語寫的, 我們可以用我們的模型將其翻譯成英語 。 ”

    推薦閱讀