GAN Theft Auto
Harrison Kinsley / Daniel Kukiela

靠著機器學習和各種不同的訓練方式,AI 已經可以做到不少令人嘆為觀止的事情,但如果是完全不用 3D 引擎,只靠著神經元網路來運算出一個 3D 遊戲呢?YouTuber Harrison Kinsley 在影片中分享了由他和 Daniel Kukiela 等一群人工智慧愛好者一同製作的「GAN Theft Auto」,將《俠盜獵車手 V》英文原名(Grand Theft Auto V)的第一個字由生成對抗網路(Generative Adversarial Networks)的縮寫所取代。顧名思義,這是個以生成對抗網路「模擬」出來的《俠盜獵車手》世界。

生成對抗網路由兩個相對抗神經元網路組成,一個負責生成,另一個負責判別。在這個例子當中,AI 被丟到了 《俠盜獵車手》世界中的一條高速公路上進行學習,了解當使用者按下加速、煞車、左轉、右轉時,畫面應該如何變化。生成網路會產生出一個它「猜測」應該正確的畫面,而判別網路則會與實際的遊戲畫面進行比較,來「指導」生成網路怎樣的畫面才是對的。

這結果,就是一個雖然模糊,但大致可以辨別的世界,裡面所有的元素都是 AI 神經元網路依照「經驗」生成的,完全沒有用到任何 3D 繪圖或是物理運算。即便如此,AI 依然相當不可思議地學到了車輛影子的角度該隨著轉動變化,車體上的太陽反光也是正確的。如果車子撞到障礙物(例如兩側的圍籬時),AI 懂得讓畫面停住,隨後視撞擊的角度向左或右滑,而後來更是加入了其他路上的車輛,AI 也能(大致上)正確的進行反應,甚至連遠方的山都會隨著「遠近」而有大小變化。

訓練這樣的 GAN 是個非常花費 GPU 運算力的工作,因此 NVIDIA 出借了一台內建 64 核 AMD CPU 及四張 A100 顯卡的 DGX Station A100 給 Kinsley,可以同時在機器上執行 12 個 AI 訓練模型。這些模型持續反復在這段公路上奔跑之外,Kinsley 也用 AI 來平滑畫面,讓它看起來不要太像素化,最後的結果就是好像在夢中開車的場景了。

不過可惜的是,由於時間不足,Kinsley 和 Kukiela 無法擴大實驗的範圍。最主要的,是他們不確定可以將這個「世界」擴大到多大,AI 才會開始送出奇怪的結果;又或是對於與其他車輛間的互動,能進行到什麼程度。就目前來說,與車輛間的互動大多以對方被撞後就消失告終,但也發生過撞上時對方一分為二的事情,在少數情況下,AI 可以產生出正確的互動,例如有車輛擋在左方時,會讓左轉失效,但想要更精確的表示與其他車輛的互動,恐怕還要很長時間的訓練才行了。