Alphabet 的 DeepMind AI 已經比人類更擅長 Atari 遊戲了

AI 在《Pitfall》、《Montezuma's Revenge》、《Solaris》和《Skiing》裡得分超過人類。


以遊戲來測試 AI 效率是一種可行性很高的辦法,因為它的結果很容易就能透過得分反映出來。比如說 Alphabet 旗下的 DeepMind,他們就專門為訓練 AI 選出了 57 款 Atari 遊戲。AI 遊戲的結果會被拿來跟人類的平均水準進行對比,而 DeepMind 最新一版的系統 Agent 57 近日就在這方面實現了巨大的突破。

按照官方說法,這是 AI 系統首次超越了人類的基準線。尤其在《Pitfall》、《Montezuma's Revenge》、《Solaris》、《Skiing》這四款對大部分 AI 都極具挑戰的遊戲裡,Agent 57 均發揮出了很高的水平。根據 MIT Technology Review 的介紹,《Pitfall》和《Montezuma's Revenge》這兩款作品需要 AI 進行非常多的嘗試以找到獲取更高分數的辦法。而《Solaris》跟《Skiing》的難點則在於不太容易發現勝利的跡象,這就讓 AI 很難從長遠角度出發來考慮自己的操作。

Deepmind Agent57
Deepmind Agent57


針對這些問題,DeepMind 在過去版本的基礎上加強了 Agent57 的決策力,同時還最佳化了它面對短期和長期利益時的取捨判斷。基於這些變化得到的結果令人印象深刻,不過 MIT Technology Review 也指出目前的 AI 相比人類還是欠缺「真正的變通性」,它們每次還是只能弄清楚一款遊戲。不過即便如此 Agent57 的進步仍舊有著十分重要的意義,相信這也給未來的 AI 開發提供了很重要的參考方向。