豆包APP實時語音通話升級全雙工模型 抗干擾與低時延能力提升

豆包APP實時語音通話升級全雙工模型 抗干擾與低時延能力提升

近日 , 豆包APP實時語音通話功能升級 , 上線全雙工語音大模型Seeduplex。 據介紹 , 作為原生全雙工端到端語音大模型 , Seeduplex 能夠在復雜聲學場景下實現精準抗干擾與動態判停 , 提供更順暢、更自然的語音交互體驗 。
此次更新后 , 豆包實時語音通話功能在對話自然度、響應速度和抗干擾能力等方面均有提升 。
記者實測發現 , 升級后的豆包語音通話在復雜環境下表現出較強的抗干擾能力 , 即便周圍存在人聲和噪音干擾 , 也能較準確地識別用戶語音 , 不易被無關聲音帶偏 。 以餐廳、展覽等易出現多人交談的場景為例 , 過往 AI 產品容易因背景噪音或旁人說話聲出現誤打斷、誤回復等情況;此次升級后 , 豆包對無關聲音的過濾能力有所增強 , 對話過程也更不容易被人聲意外打斷 。
除抗干擾能力外 , 升級后的語音對話節奏也更接近自然交流 。 人與人對話中 , 停頓并不總意味著發言結束 。 此次升級后 , 豆包可結合語音與語義信息判斷用戶是否仍在繼續表達 , 從而減少對話中的“搶話”現象 。 與此同時 , 對話響應時延也進一步降低 , 在接龍、飛花令等高頻互動場景中表現更為明顯 。
目前 , 這一能力已在豆包 APP上線 。 用戶可點擊“打電話”按鈕 , 開啟實時語音通話功能體驗 。
【豆包APP實時語音通話升級全雙工模型 抗干擾與低時延能力提升】

    推薦閱讀