Google melatih model Gen-AI untuk mensimulasikan mesin permainan DOOM • The Register

Sebuah tim dari Google dan Universitas Tel Aviv telah mengembangkan mesin permainan AI generatif yang mampu mensimulasikan game klasik DOOM pada lebih dari 20 bingkai per detik karena penelitian.

Pekerjaan tersebut, dirinci dalam sebuah makalah diterbitkan (PDF) kemarin, mendemonstrasikan bagaimana model penguatan dan penyebaran dapat digunakan untuk mensimulasikan mesin permainan secara real time.

Dijuluki GameNGen, diucapkan “game engine,” model tersebut dilatih pada DOOM, tetapi para peneliti mencatat bahwa tidak ada pendekatan yang digunakan khusus untuk game tersebut, dan dapat diterapkan ke sejumlah judul game apa pun.

Mesin permainan tradisional dikodekan secara manual untuk mengikuti serangkaian putaran yang melacak masukan pengguna, memperbarui status permainan, dan menampilkan piksel di layar. Lakukan ini dengan cukup cepat dan akan tercipta ilusi bahwa Anda sedang bergerak dan berinteraksi dengan lingkungan virtual.

Video Youtube

Sebagai perbandingan, GameNGen bekerja sedikit berbeda karena seluruh mesin permainan dan frame dibuat secara otomatis berdasarkan tindakan pemain dan beberapa frame terakhir. Untuk melakukan ini, Anda mungkin berpikir para peneliti menambang rekaman permainan selama berjam-jam dari pemain sebenarnya; tetapi menurut para peneliti, ini tidak praktis.

Sebaliknya, fase pertama pelatihan GameNGen adalah membuat agen pembelajaran penguatan yang belajar memainkan DOOM. Data yang dihasilkan oleh sesi pelatihan ini digunakan untuk melatih model difusi kustom berdasarkan Stable Diffusion v1.4, yang merender game.

Menurut para peneliti, dengan menggunakan satu TPU v5, GameNGen mampu mencapai sekitar 20 FPS. Meskipun itu jauh dari target 60 FPS yang dianggap dapat diterima untuk sebagian besar game first-person shooter modern, perlu dicatat bahwa OG DOOM tetap mencapai 35 FPS.

Para peneliti mencatat bahwa kinerja yang lebih cepat sebenarnya dimungkinkan, hingga 50 FPS, saat turun ke satu langkah penghilangan derau, tetapi mereka mencatat bahwa kualitasnya menurun sebagai akibatnya.

Dalam hal kualitas visual, para ahli mengklaim frame yang dihasilkan sebanding dengan kompresi JPEG yang lossy, dan bahwa “penilai manusia hanya sedikit lebih baik daripada peluang acak dalam membedakan klip pendek permainan dari klip simulasi.” Kami telah menyematkan video agar Anda dapat menilai sendiri, tetapi perlu dicatat bahwa “klip pendek” tersebut hanya berdurasi 1,6 hingga 3,2 detik permainan.

Seperti yang Anda duga, GameNGen benar-benar merupakan bukti konsep pada titik ini dan mengalami berbagai keterbatasan seperti yang disorot dalam makalah tersebut. Salah satu yang terbesar adalah memori. Berjalan pada satu TPU v5, model tersebut hanya memiliki cukup ruang untuk menyimpan sekitar 3 detik permainan.

Fakta bahwa logika permainan dapat berfungsi meskipun ada keterbatasan ini saja sudah “luar biasa” menurut para peneliti.

Keterbatasan lain yang disorot dalam teks adalah bahwa mengandalkan agen pembelajaran penguatan sebagai sumber data pelatihan berarti bahwa tidak setiap sudut permainan asli dipetakan. “Agen kami, bahkan di akhir pelatihan, masih belum menjelajahi semua lokasi dan interaksi permainan, yang mengarah pada perilaku yang salah dalam kasus tersebut.” ®

Sumber