A session held on August 23rd, the third day of CEDEC 2024 ``Almost a full AI game. A mechanism that allows Red Ram to generate an unlimited number of mystery games of the player's preference'' .
"Red Ram" is a technology demo developed by Morikatron, a developer specializing in game AI, and is an attempt to automatically generate a murder mystery-style culprit guessing game based on keywords entered by the player. It has become.
In this session, Shigenori Miyamoto, Morikatron's lead engineer who was in charge of natural language processing for the game, and Rikito Takahashi, an AI engineer who was in charge of system design and client implementation, explained how the generation works. It was revealed.
Lead engineer Shigenori Miyamoto (right) and AI engineer Rikito Takahashi (left)
Fun created by using generation AI in the game
The session started with Mr. Takahashi talking about the message he had put into this session. That is, ``I want more games to use generation AI in-game.'' This is a message unique to Morikatron, which is skilled in AI technology, but the company believes that by utilizing generative AI in games, two types of fun can be created.
One is that there are so many variations that you won't get bored. Another benefit is the ability to create a gaming experience tailored to each player's preferences. ``Red Ram'', which will be discussed in this session, was created to study the gaming experience unique to generative AI.
“Red Ram” game overview |
Jadi, bagaimanakah penjanaan permainan Red Ram berfungsi?
Pertama, pemain memasukkan tetapan pilihan mereka, dan kemudian AI menghasilkan plot yang merupakan garis besar kejadian. Seterusnya, data cerita dibuat yang menyempurnakan data, dan watak serta tetapan ditentukan berdasarkan data tersebut. Akhir sekali, baris dialog, imej watak, imej latar belakang, dsb. dihasilkan, dan permainan diselesaikan dengan menggabungkannya.
Encik Miyamoto menerangkan butiran generasi ini. Pertama, plot dijana secara berperingkat menggunakan LLM (model bahasa berskala besar/``Red Ram'' menggunakan GPT 3.5 dan 4 OpenAI) berdasarkan kata kunci yang dimasukkan oleh pemain. Jika keadaan kompleks diperlukan untuk penjanaan, GPT 4 berprestasi tinggi nampaknya digunakan.
Sebagai contoh, walaupun pemain memasukkan sesuatu yang tidak sesuai sebagai senjata, LLM akan mencipta senario yang sewajarnya.
Dalam penjanaan plot, bukan sahaja latar kejadian tetapi juga panduan penulisan misteri dan cara mencipta aliran kemajuan dimasukkan sebagai gesaan. Sediakan berbilang aliran kemajuan yang dijana secara manual oleh LLM terlebih dahulu dan gunakannya secara rawak. Dikatakan bahawa penjanaan plot tanpa sebarang kekangan format boleh dijangka menghasilkan produk yang lebih berkualiti.
Daripada plot yang dibuat dengan cara ini, data cerita dijana dalam format yang boleh dikendalikan oleh program. Seperti yang anda boleh lihat dalam slaid di bawah, pada peringkat plot ia hanyalah teks biasa, tetapi data yang diperlukan seperti lokasi dan mangsa diekstrak daripadanya, dan kandungannya disempurnakan pada masa yang sama.
Seterusnya, data terperinci untuk setiap orang, lokasi dan bukti yang muncul dalam permainan dijana daripada data cerita. Selain menentukan profil seseorang seperti umur, personaliti dan pekerjaan, nada suara mereka juga ditentukan. Pada masa ini, gesaan untuk menjana imej juga dibuat.
Perkara terakhir yang dihasilkan ialah senario perbualan -- teks soal siasat (baris perbualan) yang dilakukan oleh pemain, detektif, terhadap suspek. Gesaan dibuat dengan memasukkan data yang dijana setakat ini ke dalam enam jenis templat bergantung pada situasi dan lokasi kejadian, dan perbualan dijana. Selain itu, emosi watak disimpulkan daripada teks dialog kepada LLM dan diklasifikasikan kepada enam jenis emosi. Ini dikatakan digunakan untuk menukar ekspresi muka suspek dalam penjanaan imej.
Seterusnya, beralih kepada penjanaan imej. Berdasarkan teks yang dijana oleh LLM, imej disediakan menggunakan "Resapan Stabil" (nama model AI penjanaan imej). Untuk imej latar belakang dan bukti, gunakan gesaan yang dibuat apabila anda menjana butiran masing-masing. Pada masa ini, pelarasan dibuat untuk melaraskan sudut tontonan imej latar belakang dan menggantikan serta melukis item bukti yang sukar diwakili.
Begitu juga, potret watak menggunakan gesaan yang dibuat apabila data terperinci dijana. Kekangan dikenakan supaya imej dilukis dalam kedudukan tetap dan pada saiz tetap, dan pemprosesan ketelusan latar belakang (memotong) juga dilakukan pada ketika ini.
Untuk pemangkasan, Segmentasi Semantik (kaedah pembahagian yang melabelkan setiap piksel) dan teknologi yang menganggarkan kedalaman imej digunakan untuk memastikan pemangkasan yang boleh dipercayai dengan mengekstrak bahagian dalam sahaja.
Ekspresi muka dilaraskan supaya mereka tidak kelihatan seperti orang yang berbeza dengan hanya menambah jumlah minimum pada gesaan semasa menghasilkan pose.
|
|
Cabaran dan prospek masa depan untuk permainan AI generatif
Slaid seterusnya menunjukkan kejadian yang sebenarnya dijana sebagai hasilnya.
Pertama sekali, memandangkan senjata pembunuhan itu adalah ``tauhu'', adalah wajar untuk mengatakan bahawa punca kematian adalah sesak nafas. Pentas itu ditetapkan sebagai ``syarikat pembangunan permainan yang inovatif,'' jadi tempat seperti pejabat atau bilik persidangan telah dijana.
Memandangkan motif jenayah itu adalah "masalah kewangan"
, hubungan manusia yang tertumpu kepada peminjaman dan peminjaman wang telah diwujudkan. Ngomong-ngomong, nampaknya anda boleh memilih antara gaya aksi langsung dan gaya anime untuk watak.
|
At the end of the session, Mr. Takahashi spoke about current issues and future prospects.
First, there is the issue of quality. In "Red Ram," the characters' conversations sometimes don't make sense. For example, a conversation may begin with ``evidence has been found,'' but end in a mysterious manner, with the evidence not being found. Furthermore, during the explanation of the case at the beginning, the main character, the detective, may even reveal the truth.
This makes it impossible to enjoy solving murder cases and reasoning. In other words, the current situation is a game where you can enjoy the strange behavior of the generative AI. That has a certain flavor and is interesting, but that's not what Morikatron is aiming for.
In order to achieve a consistent scenario, it is necessary to further devise the system design and the prompts given to the LLM. Other issues such as cost and waiting time were also raised, but these are expected to be gradually resolved through the evolution of the LLM model.
According to Mr. Takahashi, in the future he would like to create an experience where the information entered by the player is reflected in the game world in real time, and in July 2024, he will release a technology demo called "Labyrinth of Kotodama". are.
This demo is a text adventure that aims to conquer a dungeon, but the system is such that items are generated based on the words entered by the player. In response to the input words, the item's image, parameters, flavor text, etc. are generated on the spot, and the main character is shown using the item.
Additionally, papers and generation examples related to "Red Ram" are available online. It can be viewed using the QR code on the slide below, so if you are interested, why not check it out?
The above is the detailed content of What is the mechanism of 'Red Ram' that can generate mystery games by leaving it to AI? [CEDEC 2024]. For more information, please follow other related articles on the PHP Chinese website!