計算機已經創造出自己的秘密語言

摘要:好了,不要驚慌,但計算機已經創造出自己的秘密語言,而且現在很可能正在對我們評頭論足呢。好吧,這種說法過于簡單化了,而且后半段索性說得不對。不過,谷歌的人工智能研究人員最近遇到了一個非常吸引人但到底存不存在還說不準的發展動態。 你可能還記得,在今年 9 月份的時候,谷歌宣布自己的 神經機器翻譯系統(GNMT)上線 了,它能夠利用深度學習在兩種語言之間進行更好、 ...

好了,不要驚慌,但計算機已經創造出自己的秘密語言,而且現在很可能正在對我們評頭論足呢。好吧,這種說法過于簡單化了,而且后半段索性說得不對。不過,谷歌的人工智能研究人員最近遇到了一個非常吸引人但到底存不存在還說不準的發展動態。

你可能還記得,在今年 9 月份的時候,谷歌宣布自己的 神經機器翻譯系統(GNMT)上線 了,它能夠利用深度學習在兩種語言之間進行更好、更自然的翻譯,太酷了!

在取得這項成就之后,GNMT 的開發人員對一件事情感到很好奇。如果你教翻譯系統把英語翻譯成韓語,再把韓語翻譯成英語;或者是教它把英語翻譯成日語,再把日語翻譯成英語……那么它能不能直接把韓語翻譯成日語,不用依靠英語作為兩種語言之間的橋梁?研究人員制作了下面這張 GIF 動畫,用以展示他們稱為“zero-shot 翻譯”的概念(橙色部分):

image01

事實證明, 這是可行的!GNMT 能夠在兩種沒有進行過明確關聯的語言之間產生出“合理的”翻譯結果。請記住,其中沒有用到英語。

不過,這引出了第二個問題。如果計算機能夠在之前沒有關聯的概念和詞語之間建立聯系……這是否意味著計算機已經對那些詞語形成了一種共享概念,意味著它對詞語有了更深層次的理解,而不僅僅在不同語言之間進行等價關聯?

換言之,計算機有沒有創造出自己的內部語言,并使用它來表達概念,從而在不同語言之間進行互譯?考慮到 GNMT 神經網絡存儲空間中句子彼此關聯的復雜程度,谷歌語言和人工智能的研究人員認為,它已經做到了。

transcape

這種“中間語言”似乎是作為一種更深層次的表達存在的,它可以看出三種語言句子和詞語之間的相似性。除此之外,我們就很難說出別的門道了,因為復雜神經網絡的內部過程是出了名的難以描述。

那可能是一些復雜的東西,或者也有可能是一些簡單的東西。但是,這種語言存在的事實本身——系統通過原創語言來輔助自己對未學習概念的理解——從哲學上說,堪稱非常強大的東西。

你可以在 Arxiv 閱讀這篇介紹研究人員成果的論文,其中主要講的是高效率的多語種翻譯,但也談到了這種神秘的中間語言。毫無疑問,由系統創造和應用的更深層次概念還需要進一步的研究。在此之前,讓我們把期望值放到最低。

翻譯:王燦均(@何無魚

Google’s AI translation tool seems to have invented its own secret internal language



無覓評論,優化體驗,加強品牌價值

無覓相關文章插件,快速提升流量

广东福利彩36选7好彩3