Google 的翻譯 AI 除了直接學習過的語言之外,現在連沒有學過的也能試著翻譯了呢。Google 翻譯服務支援的語言一共有 103 種,如果每一種組合都要能對翻的話,Google 必須要訓練 AI 5,253 對的配對方式 -- 考慮到每種語言都有上百萬種的範例要學習,這顯然是不現實的。Google 最近在轉換到神經元網路翻譯(Google Neural Machine Translation, GNMT)系統後,發現有學習過的語言組合翻譯品質有變好,於是他們便想,能不能進一步應用到沒有學過的語言呢?舉例來說,如果 GNMT 會了英翻日和英翻韓的雙向翻譯,那是否也能合理地進行日翻韓的雙向翻譯呢?答案是肯定的,而且翻得遠比工程師們預期的還要好。但到底 GNMT 是怎麼辦到的,連研究專家們都不是很確定,只能從資料結構的 3D 視覺化表示去分析,發現 GNMT 把不同語言,但語意接近的句子都放在了一起。

這表示系統不光只是知道詞與詞之間的對應關係,甚至連整個句子都有做完整的分析。學者們懷疑這是否能解釋成其實 GNMT 自己已經有了一套「語言」,而所有的翻譯都是先翻成 GNMT 能理解的中介語言,再翻譯成最終結果的。

在一個實驗中,研究團隊將 12 種語言整合成一套模型,只佔用和過去一對語言相同的資料空間。雖然資料量大幅減少,但翻譯品質「只有些許的下降」。這對 Google 迅速開展更多語言間的翻譯,是個大好消息吧!只是不知道再這樣發展個幾年,是不是專職翻譯工作的人就要等著失業了...(抖)。