DeepMind AI 的下一個挑戰:像人類一樣玩《Quake III Arena》

透過 AI 間的對戰以及和人類的對戰,AI 可以達到比人類還高的等級。

自從 AlphaGo 突破了圍棋這個人工智慧的門檻後,DeepMind 並沒有就此滿足,反而朝向更複雜的遊戲前進,透過機器學習開發了可以像人類一樣玩《Quake III Arena》的 AI。DeepMind 團隊將重心放在「奪旗模式」上,並且讓地圖會在每場比試間隨機進行變化。AI 不僅要能快速在隨機地圖中找到自己的位置並導航,還要懂得和隊友合作、並且適應各種不同的敵方戰術。

更進一步增加 AI 開發難度的,是遊戲的目標只有一個,就是「贏」,而達成這個條件的方式有太多種,讓 AI 很難判定到底是做了什麼讓「贏」或「輸」更容易發生。每一個 AI 玩家還要頗外設定一些「動機」,像是跟隨其他隊友、或是奪取旗子等。除了讓 AI 間「自行對抗」外,AI 專家們也讓 AI 與人類對抗,學習人類的戰術,結果發現 AI 比人類更能好好合作,並且還偷學了蹲點等招數。



從表現來看,自己和自己隨機玩的 AI 到不了一般人類的水準,但加上足夠多的動機的話,可以在 20 萬場「訓練」之後,到達接近人類「高手」的程度。如果是再加上了和人類間的對抗的話,則可以在大約 15 萬場後超過人類好手,並且繼續向上爬升。

就最直觀來說,這樣的 AI 在近期內可能可以有助於電競團隊練習、並發現新的戰術;如果訓練系統可以更通用化的話,或許可以產生出一些真正厲害的電腦對手來呢。

來源: DeepMind

經由: Engadget