Google Translatotron 能用你的聲音進行翻譯

而且它是直接翻譯你講的東西,省掉了語音到文本再到語音的轉換過程。

Google 在翻譯這件事上的造詣,現在又變得更加厲害了一些。他們新推出的 Translatotron 工具,是首款能以用戶本身語音語調來翻譯不同語言的產品。而且讓人稍有些意外的是,Google 這次還捨棄了相對錯誤率更高的語音到文本再到語音順序翻譯方案,Translatotron 是在用戶所講東西的基礎上直接翻譯出語音內容。Google 希望能透過 Translatotron 的技術開發,帶來未來直接翻譯模型的發展。

按照官方說法,Translatotron 是利用序列到序列的網路模型來進行語音輸入,然後以聲譜圖的形式來處理,最終再生成目標語言的新聲譜圖。這樣一來,翻譯的速度會變的更快,而且過程中語意丟失的可能性也更低。另外這款工具也可搭配源聲編碼器組件使用,在裝入之後 Translatotron 就能在一定程度上模仿被翻譯者的聲音、聲調了。感興趣的朋友可以去這個 GitHub 頁面,雖然目前多少還是能聽得出些機器感,但相信以後會再有所改進吧。

Model architecture of Translatotron
Model architecture of Translatotron

來源: Google

經由: Engadget