【數(shù)據(jù)庫(kù)|語(yǔ)音重建AI「翻譯」代言】
「有口難言」的病人 , 是因腦部疾病、神經(jīng)損傷而引致構(gòu)音障礙癥(dysarthria) 。 透過(guò)AI、語(yǔ)音重建技術(shù)和擴(kuò)展障礙語(yǔ)音數(shù)據(jù)庫(kù) , 將患者含糊不清的語(yǔ)音重建成正常語(yǔ)音 。
根據(jù)美國(guó)言語(yǔ)、語(yǔ)言及聽(tīng)力學(xué)會(huì)(ASHA)解釋 , 構(gòu)音障礙癥是一種神經(jīng)性語(yǔ)言障礙 。 成人患者常見(jiàn)征狀包括說(shuō)話時(shí)在強(qiáng)度、速度、音域、穩(wěn)定、語(yǔ)調(diào)出現(xiàn)異常;在呼吸、發(fā)聲、共鳴、發(fā)音或說(shuō)話韻律上欠準(zhǔn);面部、口部等構(gòu)音肌肉功能不理想 , 或有肌肉痙攣、無(wú)力等情況出現(xiàn) 。
語(yǔ)音識(shí)別技術(shù)(automatic speech recognition , 簡(jiǎn)稱ASR)及語(yǔ)音合成技術(shù)(text-to-speech , 簡(jiǎn)稱TTS) , ASR是指透過(guò)人工智能 , 容許機(jī)器接受語(yǔ)音輸入(speech input) , 從語(yǔ)音數(shù)據(jù)庫(kù)中學(xué)習(xí)人類(lèi)語(yǔ)言 , 再將人們的語(yǔ)音變?yōu)槲淖郑欢鳷TS則是透過(guò)AI , 容許機(jī)器將人們輸入的文字變成語(yǔ)音輸出 。
要研究語(yǔ)音技術(shù) , 就必須使用大數(shù)據(jù) 。 話語(yǔ)中存有很多變化性(variability)和不變性(invariance) 。 變化性包括不同說(shuō)話者的各種語(yǔ)調(diào)、情感、口音、身體狀況等 , 都會(huì)改變?cè)捳Z(yǔ)發(fā)出的信號(hào);不變性可以是說(shuō)話時(shí)使用的字眼 。 各種變數(shù)的出現(xiàn) , 令語(yǔ)音技術(shù)研究需用上大數(shù)據(jù)辨識(shí)話語(yǔ)內(nèi)容 。
花數(shù)年擴(kuò)展廣東話數(shù)據(jù)庫(kù)然而 , 現(xiàn)有語(yǔ)音數(shù)據(jù)庫(kù)存數(shù)據(jù)偏頗 , 因?yàn)閿?shù)據(jù)一般來(lái)自從事IT行業(yè)、常用數(shù)碼化產(chǎn)品、說(shuō)當(dāng)?shù)卣Z(yǔ)言時(shí)口音較少的人 , 多數(shù)為成年人士;相反有口音、語(yǔ)言障礙患者、長(zhǎng)者、小朋友等就沒(méi)有足夠的語(yǔ)音數(shù)據(jù)支撐ASR技術(shù) , 使他們的語(yǔ)音難以被準(zhǔn)確辨識(shí) 。 另外 , 現(xiàn)存公開(kāi)的語(yǔ)音數(shù)據(jù)庫(kù) , 部分語(yǔ)言缺乏數(shù)據(jù) , 包括廣東話 。
透過(guò)語(yǔ)音重建技術(shù)(speech reconstruction)、ASR、TTS的研究 , 同時(shí)花上數(shù)年時(shí)間擴(kuò)展廣東話的語(yǔ)音數(shù)據(jù)庫(kù) , 協(xié)助構(gòu)音障礙癥患者與照顧者更好溝通 。 由2013年開(kāi)始 , 研究團(tuán)隊(duì)與香港中文大學(xué)醫(yī)學(xué)院及病友組織合作 , 邀請(qǐng)數(shù)十名不同年齡層的構(gòu)音障礙癥患者 , 錄制他們常用的廣東話用語(yǔ) , 擴(kuò)充障礙語(yǔ)音數(shù)據(jù) 。 錄制過(guò)程中 , 患者會(huì)讀出經(jīng)研究團(tuán)隊(duì)精心設(shè)計(jì)的廣東話句子 , 嘗試用最少的字句包含所有廣東話發(fā)音 , 收集研究所需的語(yǔ)音數(shù)據(jù) 。
以ASR、TTS技術(shù)為基礎(chǔ) , 以及團(tuán)隊(duì)開(kāi)發(fā)的語(yǔ)音重建技術(shù) , 系統(tǒng)接收到患者含糊不清的語(yǔ)音后 , 利用AI演算法 , 將含糊不清的語(yǔ)音轉(zhuǎn)化成正常語(yǔ)音 , 最后以語(yǔ)音轉(zhuǎn)換技術(shù)轉(zhuǎn)換成貼近說(shuō)話人的發(fā)音及語(yǔ)調(diào) 。
團(tuán)隊(duì)期望日后能把此技術(shù)制作成應(yīng)用程式 , 讓更多有需要人士可于不同地方使用 。
相關(guān)經(jīng)驗(yàn)推薦
- 智能語(yǔ)音|智能or智障?橫評(píng)幾家新勢(shì)力智能語(yǔ)音,誰(shuí)說(shuō)語(yǔ)音只是雞肋!
- 特斯拉|新能源汽車(chē)哪家的語(yǔ)音智能最好?特斯拉說(shuō):你們玩別帶我!
- 數(shù)據(jù)庫(kù)|十年磨一劍,從無(wú)到有,中國(guó)數(shù)據(jù)庫(kù)從此站起來(lái)了!
- 小米手機(jī)|小米手機(jī)的系統(tǒng)很不錯(cuò),比較人性化,語(yǔ)音也很不錯(cuò)
- 語(yǔ)音輸入|最新第三方輸入法報(bào)告 用戶追求更個(gè)性、更智能的輸入體驗(yàn)
- Twitter|微信語(yǔ)音通話能錄音嗎?可以,給你兩個(gè)選擇
- 華為|Meta嘗試?yán)谜Z(yǔ)音AI技術(shù)自動(dòng)生成虛擬場(chǎng)景|虛實(shí)之間
- 數(shù)據(jù)庫(kù)|近半價(jià)!293元!羅技G431電競(jìng)游戲耳機(jī)秒殺 送支架
- 數(shù)據(jù)庫(kù)|如今的幾萬(wàn)元電腦仍不如10年前頂級(jí)電腦性能,這是PC行業(yè)的驕傲還是悲哀?
- 半導(dǎo)體|“橙就”只需一點(diǎn)!聯(lián)想智能語(yǔ)音鼠標(biāo)上市 多款功能玩轉(zhuǎn)桌面黑科技
