
騰訊科學訊(Everett/編譯)據國外媒體報道,研究人員開發了一款新軟件,可以將英語口語翻譯成中文口語,同時也會保留語調和節奏,因此即便是通過機器翻譯的語音聽起來依然像是初始的聲音。微軟公司認為該研究實現了突破,使得瞬時翻譯系統出錯的次數下降了,系統研制的技術藍本借鑒了大腦的工作方式,以提高翻譯的准確性。
微軟公司研發部主任裡克·拉希德(Rick Rashid)在天津對該軟件設計項目進行了詳細的解析,拉希德在最後幾分鐘的陳述幾乎在瞬間被這套來自微軟的快速口譯系統翻譯成中文,而且快速翻譯機器生成的語音還保留著他口語的風格。正是由於該款新型快速口譯軟件,使得快速翻譯成為了可能,這項成果要感謝微軟實驗室在早些時候對相關技術的突破。
早期的研究工作拋棄了傳統的語音翻譯系統模式,轉而支持統計型模型,使得機器在捕捉人類聲樂能力上具有更好地表現。隨著計算機技術的改進,進一步提高了軟件對語音數據的識別處理能力,但錯誤率仍然處於20%至25%之間。根據裡克·拉希德先生的相關記錄文件,早在2010年,微軟的工作人員與多倫多大學的科學家進行合作,通過深度神經網絡結構對瞬時翻譯系統進行改進,正是由於深度神經網絡在識別聲音的工作方式與我們的大腦相似。裡克·拉希德認為該技術可應用到語音轉換上來,並將錯誤率控制在15%的範圍內,這項改進也被喻為戲劇性的變化。
針對翻譯過程中出現的錯誤率,研究人員開始對類神經網絡進行訓練,使得錯誤率進一步降低。當然,目前這套快速口語翻譯系統仍然存在問題,比如在英文文檔和翻譯成口語化中文時有時會出現非常幽默的結果,盡管如此,這項技術的發展還是非常有用的。許多不同的技術公司,如AT&T公司、谷歌(微博)公司都有相似的同聲翻譯軟件開發項目。日本電報電話公司的NTT DoCoMo手機公司此前展示了一個智能手機應用系統,方便日本語使用者與外國人進行交談,使之能利用自己的母語無障礙地交流。