只用一張RTX 4090顯卡，開發者用視訊生成模擬【超級馬利奧兄弟】

2024-09-12心靈

近期，AI 技術在遊戲開發領域取得了令人矚目的進展。

繼谷歌的 GameNGen AI 模型展示了使用影像擴散技術生成可玩版【淪陷戰士】（Doom）的能力後，一個新研究計畫又將目光投向了另一款經典遊戲——任天堂的【超級馬利奧兄弟】（Super Mario Bros）。

這個計畫展示了 AI 如何透過視訊生成技術來模擬這款 1985 年發行的經典遊戲，為未來的遊戲開發開辟了新的可能性。

公開資料顯示，MarioVGG 計畫主要由 GitHub 使用者歐尼·周（Ernie Chew）和布瑞恩·林（Brian Lim）管理，其相關論文由加密貨幣相關的 AI 公司 Virtuals Protocol 發表。

該計畫主要利用機器學習技術，透過研究遊戲視訊和輸入數據，來推斷遊戲的物理規則和遊戲動態。

研究人員使用了一個包含 280 個遊戲關卡的公開數據集，遊戲畫面超過 737000 幀。

為了簡化遊戲情況，他們只關註兩種潛在輸入：向右跑和向右跑並跳躍。經過約 48 小時的訓練（使用單塊 RTX 4090 顯卡），模型就能夠從靜態的初始遊戲影像和文本輸入生成新的視訊幀序列。

MarioVGG 采用了文本到視訊生成的方法來重現【超級馬利奧兄弟】。模型透過學習遊戲畫面，能夠根據玩家的文本輸入（「跑」或「跳」）生成相應的遊戲畫面序列。

具體來說，模型只需要接收一個初始的遊戲畫面幀和所需動作的文本描述（例如「跳躍」），然後學習生成一系列視覺化描述所需動作的幀。

為了提高效率，研究人員將輸出幀的分辨率從原始 NES（註：Nintendo Entertainment System，是任天堂生產的第一代家用遊戲機）的 256×240 降低到了 64×48 或 128×96。

此外，他們將 35 幀的視訊時間壓縮為僅 7 個生成幀，這些幀以均勻的間隔分布，從而創造出比實際遊戲畫質更粗糙的遊戲視訊。

盡管采用了這些方法，MarioVGG 模型仍然面臨著接近即時視訊生成的挑戰。研究人員只用了一張 RTX 4090 顯卡，需要大約 6 秒鐘才能生成 6 幀視訊序列，視訊長度僅僅超過半秒，這還是在極其有限的幀率下。

研究人員承認這「對於互動式視訊遊戲來說既不實用也不友好」，但他們希望未來的最佳化可以改善這一速率。

盡管存在上述限制，MarioVGG 仍然展現出了一些令人印象深刻的特性。

首先，模型能夠純粹從訓練數據中學習遊戲的物理規則，包括馬利奧從懸崖邊跌落時的重力效果，以及在遇到障礙物時停止前進。

其次，雖然 MarioVGG 主要關註模擬馬利奧的動作，但它也能有效地為馬利奧生成新的障礙物，這些障礙物「與遊戲的圖形語言相一致」。

此外，MarioVGG 能夠生成獨特的馬利奧關卡，只有第一幀輸入來自真實遊戲狀態。

然而，MarioVGG 也面臨著一些顯著的挑戰，比如研究人員觀察到，輸入動作文本並不總是被模型所遵守。

有時還會出現明顯的視覺問題，如馬利奧有時會穿過障礙物和敵人、顏色閃爍、在幀之間縮小/增大，或在多個幀中完全消失後又重新出現。

模型並不懂得遊戲邏輯，即使在馬利奧死掉之後，它還是會繼續渲染視訊幀，而不是回到最後的檢查點。此外，關卡和物體的生成也不可控，只能透過程式化生成。

MarioVGG 計畫為未來遊戲開發開辟了新的可能性，展示了 AI 如何透過學習視訊數據來理解和重現復雜的遊戲機制。

研究人員希望這代表著「產生和展示可靠和可控的視訊遊戲生成器」的第一步，甚至可能在未來「完全使用視訊生成模型取代遊戲開發和遊戲引擎」。

然而，要實作這一願景，還需要解決諸如即時效能、畫面品質、遊戲邏輯一致性等一系列挑戰。例如，如何在生成的遊戲中決定終止狀態，這仍然是一個開放的研究問題。

盡管如此，考慮到 MarioVGG 計畫僅使用了相對較小的訓練數據集和單個消費級圖形處理器（GPU，Graphics Processing Unit），其取得的成果已經相當令人印象深刻。

Virtual Protocols 公司在推特上樂觀地表示：「無限互動世界的時代已經到來。」

總的來說，雖然視訊生成制作遊戲的方法還無法完全替代傳統的遊戲開發方法，但它為遊戲產業註入了新的活力，讓我們得以一窺 AI 驅動的遊戲未來。

這些新計畫為遊戲設計和開發提供了新的思路，展示了 AI 如何透過學習視訊數據來理解和重現復雜的遊戲機制。

未來，我們可能會看到，隨著技術的發展有望出現更多 AI 輔助的遊戲開發工具，甚至是完全由 AI 生成的遊戲世界。

參考資料：

https://arstechnica.com/ai/2024/09/new-ai-model-learns-how-to-simulate-super-mario-bros-from-video-footage/

https://www.pcmag.com/news/this-ai-model-can-create-a-super-mario-game-using-a-text-to-video-generator

營運/排版：何晨龍