Sesi yang diadakan pada 23 Ogos, hari ketiga CEDEC 2024 ``Hampir permainan AI penuh Mekanisme yang membolehkan Red Ram menjana jumlah permainan misteri pilihan pemain yang tidak terhad'' .
"Red Ram" ialah demo teknologi yang dibangunkan oleh Morikatron, pembangun yang mengkhususkan diri dalam permainan AI, dan merupakan percubaan untuk menjana permainan meneka gaya misteri pembunuhan berdasarkan kata kunci yang dimasukkan oleh pemain.
Dalam sesi ini, Shigenori Miyamoto, jurutera utama Morikatron yang bertanggungjawab dalam pemprosesan bahasa semula jadi untuk permainan itu, dan Rikito Takahashi, seorang jurutera AI yang bertanggungjawab terhadap reka bentuk sistem dan pelaksanaan pelanggan, menerangkan cara penjanaan itu berfungsi.
Jurutera utama Shigenori Miyamoto (kanan) dan jurutera AI Rikito Takahashi (kiri)
Keseronokan dicipta dengan menggunakan generasi AI dalam permainan
Sesi dimulakan dengan Encik Takahashi bercakap tentang mesej yang telah dia masukkan ke dalam sesi ini. Iaitu, ``Saya mahu lebih banyak permainan menggunakan generasi AI dalam permainan.'' Ini adalah mesej unik kepada Morikatron, yang mahir dalam teknologi AI, tetapi syarikat itu percaya bahawa dengan menggunakan AI generatif dalam permainan, dua jenis keseronokan boleh dicipta.
Salah satunya ialah terdapat begitu banyak variasi yang anda tidak akan bosan. Perkara lain ialah anda boleh mencipta pengalaman permainan yang sesuai dengan pilihan setiap pemain. ``Red Ram'', yang akan dibincangkan dalam sesi ini, dicipta untuk mengkaji pengalaman permainan yang unik kepada AI generatif.
Ikhtisar permainan "Red Ram" |
Jadi, bagaimanakah penjanaan permainan Red Ram berfungsi?
Pertama, pemain memasukkan tetapan pilihan mereka, dan kemudian AI menghasilkan plot yang merupakan garis besar kejadian. Seterusnya, data cerita dibuat yang menyempurnakan data, dan watak serta tetapan ditentukan berdasarkan data tersebut. Akhir sekali, baris dialog, imej watak, imej latar belakang, dsb. dihasilkan, dan permainan diselesaikan dengan menggabungkannya.
Encik Miyamoto menerangkan butiran generasi ini. Pertama, plot dijana secara berperingkat menggunakan LLM (model bahasa berskala besar/``Red Ram'' menggunakan GPT 3.5 dan 4 OpenAI) berdasarkan kata kunci yang dimasukkan oleh pemain. Jika keadaan kompleks diperlukan untuk penjanaan, GPT 4 berprestasi tinggi nampaknya digunakan.
Sebagai contoh, walaupun pemain memasukkan sesuatu yang tidak sesuai sebagai senjata, LLM akan mencipta senario yang sewajarnya.
Dalam penjanaan plot, bukan sahaja latar kejadian tetapi juga panduan penulisan misteri dan cara mencipta aliran kemajuan dimasukkan sebagai gesaan. Sediakan berbilang aliran kemajuan yang dijana secara manual oleh LLM terlebih dahulu dan gunakannya secara rawak. Dikatakan bahawa penjanaan plot tanpa sebarang kekangan format boleh dijangka menghasilkan produk yang lebih berkualiti.
Daripada plot yang dibuat dengan cara ini, data cerita dijana dalam format yang boleh dikendalikan oleh program. Seperti yang anda boleh lihat dalam slaid di bawah, pada peringkat plot ia hanyalah teks biasa, tetapi data yang diperlukan seperti lokasi dan mangsa diekstrak daripadanya, dan kandungannya disempurnakan pada masa yang sama.
Seterusnya, data terperinci untuk setiap orang, lokasi dan bukti yang muncul dalam permainan dijana daripada data cerita. Selain menentukan profil seseorang seperti umur, personaliti dan pekerjaan, nada suara mereka juga ditentukan. Pada masa ini, gesaan untuk menjana imej juga dibuat.
Perkara terakhir yang dihasilkan ialah senario perbualan -- teks soal siasat (baris perbualan) yang dilakukan oleh pemain, detektif, terhadap suspek. Gesaan dibuat dengan memasukkan data yang dijana setakat ini ke dalam enam jenis templat bergantung pada situasi dan lokasi kejadian, dan perbualan dijana. Selain itu, emosi watak disimpulkan daripada teks dialog kepada LLM dan diklasifikasikan kepada enam jenis emosi. Ini dikatakan digunakan untuk menukar ekspresi muka suspek dalam penjanaan imej.
Seterusnya, beralih kepada penjanaan imej. Berdasarkan teks yang dijana oleh LLM, imej disediakan menggunakan "Resapan Stabil" (nama model AI penjanaan imej). Untuk imej latar belakang dan bukti, gunakan gesaan yang dibuat apabila anda menjana butiran masing-masing. Pada masa ini, pelarasan dibuat untuk melaraskan sudut tontonan imej latar belakang dan menggantikan serta melukis item bukti yang sukar diwakili.
Begitu juga, potret watak menggunakan gesaan yang dibuat apabila data terperinci dijana. Kekangan dikenakan supaya imej dilukis dalam kedudukan tetap dan pada saiz tetap, dan pemprosesan ketelusan latar belakang (memotong) juga dilakukan pada ketika ini.
Untuk pemangkasan, Segmentasi Semantik (kaedah pembahagian yang melabelkan setiap piksel) dan teknologi yang menganggarkan kedalaman imej digunakan untuk memastikan pemangkasan yang boleh dipercayai dengan mengekstrak bahagian dalam sahaja.
Ekspresi muka dilaraskan supaya mereka tidak kelihatan seperti orang yang berbeza dengan hanya menambah jumlah minimum pada gesaan semasa menghasilkan pose.
|
|
Cabaran dan prospek masa depan untuk permainan AI generatif
Slaid seterusnya menunjukkan kejadian yang sebenarnya dijana sebagai hasilnya.
Pertama sekali, memandangkan senjata pembunuhan itu adalah ``tauhu'', adalah wajar untuk mengatakan bahawa punca kematian adalah sesak nafas. Pentas itu ditetapkan sebagai ``syarikat pembangunan permainan yang inovatif,'' jadi tempat seperti pejabat atau bilik persidangan telah dijana.
Memandangkan motif jenayah itu adalah "masalah kewangan"
, hubungan manusia yang tertumpu kepada peminjaman dan peminjaman wang telah diwujudkan. Ngomong-ngomong, nampaknya anda boleh memilih antara gaya aksi langsung dan gaya anime untuk watak.
|
Pada akhir sesi, Encik Takahashi bercakap tentang isu semasa dan prospek masa depan.
Pertama, terdapat isu kualiti. Dalam "Red Ram," perbualan watak kadangkala tidak masuk akal. Sebagai contoh, perbualan mungkin bermula dengan ``bukti telah ditemui,'' tetapi berakhir dengan cara yang misteri, dengan bukti tidak ditemui. Apatah lagi, watak utama iaitu detektif mungkin mendedahkan kebenaran semasa penjelasan kes pada awalnya.
Ini menjadikannya mustahil untuk menikmati penyelesaian kes pembunuhan dan alasan. Dalam erti kata lain, situasi semasa ialah permainan di mana anda boleh menikmati tingkah laku aneh AI generatif. Itu mempunyai rasa tertentu dan menarik, tetapi bukan itu yang disasarkan oleh Morikatron.
Untuk mencapai senario yang konsisten, adalah perlu untuk merangka lagi reka bentuk sistem dan arahan yang diberikan kepada LLM. Isu lain seperti kos dan masa menunggu juga dibangkitkan, tetapi ini dijangka akan diselesaikan secara beransur-ansur melalui evolusi model LLM.
Menurut En. Takahashi, pada masa hadapan dia ingin mencipta pengalaman di mana maklumat yang dimasukkan oleh pemain dicerminkan dalam dunia permainan dalam masa nyata, dan pada Julai 2024, dia akan mengeluarkan demo teknologi yang dipanggil "Labyrinth of Kotodama ". ialah.
Demo ini ialah pengembaraan teks yang bertujuan untuk menakluk penjara bawah tanah, tetapi sistem sedemikian rupa sehingga item dijana berdasarkan perkataan yang dimasukkan oleh pemain. Sebagai tindak balas kepada perkataan input, imej item, parameter, teks rasa, dsb. dijana serta-merta dan watak utama ditunjukkan menggunakan item tersebut.
Selain itu, kertas kerja dan contoh penjanaan yang berkaitan dengan "Red Ram" boleh didapati dalam talian. Ia boleh dilihat menggunakan kod QR pada slaid di bawah, jadi jika anda berminat, mengapa tidak menyemaknya?
Atas ialah kandungan terperinci Apakah mekanisme 'Red Ram' yang boleh menjana permainan misteri dengan menyerahkannya kepada AI? [CEDEC 2024]. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!