Kreativiti ialah keupayaan manusia yang unik yang membolehkan kita mencipta karya novel, bernilai dan bermakna, seperti seni, sastera, sains, teknologi, dll. Kreativiti juga merupakan daya penggerak yang penting dalam masyarakat manusia Ia menggalakkan pembangunan dan kemajuan dalam budaya, ekonomi, pendidikan dan bidang lain. Apakah sebenarnya kreativiti? Bagaimana ia terhasil? Bagaimanakah ia dinilai dan diperbaiki? Soalan-soalan ini telah membingungkan penyelidik dari pelbagai disiplin seperti ahli psikologi, saintis kognitif, dan ahli falsafah. Dengan perkembangan pesat teknologi kecerdasan buatan (AI), isu ini turut menarik perhatian dalam bidang AI. Bolehkah AI menjadi kreatif seperti manusia? Jika ya, bagaimanakah anda mentakrif, mengukur dan memupuk kreativiti AI? Isu-isu ini bukan sahaja mempunyai kepentingan teori, tetapi juga mempunyai nilai praktikal, kerana kreativiti AI akan mempengaruhi aplikasi dan pembangunan AI dalam pelbagai bidang.
Forum akademik sains dan teknologi arxiv.org menerbitkan kertas kerja terbaru "Bolehkah AI Menjadi Kreatif Seperti Manusia pada 3 Januari. Kertas itu ditulis oleh ramai penyelidik AI terkenal dari Amerika Syarikat, Britain, Singapura dan negara lain. Dikarang bersama oleh dua rakan sekerja, makalah ini merupakan penerokaan mendalam tentang kreativiti AI Ia mencadangkan paradigma penilaian kreativiti yang baru, iaitu kreativiti relatif (Relative Creativity), dan mewujudkan rangka kerja kreativiti yang boleh diukur, iaitu statistik Kreativiti. Kertas kerja ini bukan sahaja memajukan perbincangan teori tetapi juga menyediakan alat dan kaedah praktikal untuk menilai dan meningkatkan potensi kreatif AI. Sumbangan dan inovasi utama kertas kerja ini adalah seperti berikut:
mencadangkan konsep kreativiti relatif, mengubah penilaian kreativiti sistem AI daripada standard mutlak kepada perbandingan dengan pencipta manusia tertentu, dengan itu mengiktiraf bahawa dalam proses kreatif subjektiviti yang wujud, dan menggunakan kaedah perbandingan untuk menilai kecerdasan daripada Ujian Turing. Pendekatan inovatif ini membandingkan kreativiti AI dengan kreativiti manusia, membolehkan kami memahami dengan lebih baik prestasi dan keupayaan sistem AI dalam proses kreatif. Dengan memasukkan subjektiviti ke dalam sistem penilaian, kami dapat menilai dengan lebih lengkap kreativiti sistem AI dan membandingkannya dengan pencipta manusia, menjadikannya lebih
Untuk menilai kreativiti AI, konsep kreativiti statistik diperkenalkan, a kaedah yang menggabungkan pembinaan teori dan penilaian empirikal. Kaedah ini memfokuskan sama ada AI boleh meniru hasil kreatif kumpulan orang tertentu, dengan itu menilai secara kuantitatif kreativiti AI dan meningkatkan kebolehgunaan praktikal rangka kerja teori.
Menggunakan kreativiti statistik pada model autoregresif ialah teknik pemodelan bahasa yang digunakan secara meluas. Teknik ini dianggap agak kreatif dan mempunyai metrik praktikal untuk menilai kreativiti statistik model. Terutamanya mengenai ramalan tanda seterusnya, metrik ini boleh disesuaikan dengan keperluan model AI kontemporari dan menunjukkan potensi untuk seiring dengan kemajuan teknologi.
Penyelidikan memperkenalkan fungsi objektif yang dipanggil Kehilangan Kreativiti Statistik untuk melatih model AI kreatif. Kajian ini juga menganalisis had atas kehilangan kreativiti statistik, dan konsep yang berkaitan dengan generalisasi dalam pembelajaran mendalam, seperti kerumitan Rademacher, maklumat bersama dan nombor liputan ε. Panduan teori dan langkah praktikal ini memberikan bantuan penting dalam memupuk keupayaan kreatif model AI.
Kreativiti adalah satu kebolehan yang sukar untuk ditakrifkan dan diukur kerana ia melibatkan faktor subjektif, situasi, multidimensi dan dinamik. Mungkin terdapat pandangan dan piawaian yang berbeza tentang apa itu kreativiti dan apa itu kerja kreatif. Oleh itu, adalah tidak realistik dan tidak adil untuk memberikan definisi mutlak kreativiti atau memberikan penilaian kreativiti mutlak kepada sistem AI. Penulis percaya bahawa penilaian kreativiti harus bersifat relatif, bukan mutlak, iaitu kreativiti sistem AI harus dibandingkan berdasarkan tahap dan ciri pencipta manusia yang berbeza. Dengan cara ini, penilaian kreativiti bukan lagi satu piawaian statik, tetap dan tunggal, tetapi satu proses yang dinamik, fleksibel dan pelbagai yang dapat mencerminkan dengan lebih baik sifat dan kepelbagaian kreativiti.
Pengarang mencadangkan konsep kreativiti relatif (Relative Creativity), mentakrifkannya sebagai: sistem AI dianggap agak kreatif jika ia boleh menjana maklumat yang serupa dengan pencipta manusia tertentu berdasarkan maklumat biografi pencipta. Sekiranya karya itu tidak dapat dibezakan, maka sistem AI boleh dianggap kreatif seperti pencipta itu. "Relativiti" kreativiti relatif dicerminkan dalam fakta bahawa ia bergantung kepada perbezaan antara individu yang dibandingkan. Sebagai contoh, sistem AI mungkin kelihatan sangat kreatif jika dibandingkan dengan pencipta manusia bukan pakar, tetapi kurang kreatif jika dibandingkan dengan pereka bentuk atau artis pakar. Kreativiti relatif juga mengakui subjektiviti kreativiti, seperti keaslian, pemikiran berbeza, dan kemahiran menyelesaikan masalah, yang dimasukkan ke dalam proses pemilihan yang menambat pencipta manusia. Memandangkan penilaian kreativiti adalah berdasarkan perspektif manusia, konsep kreativiti relatif juga diilhamkan oleh Ujian Turing, kaedah perbandingan untuk menilai kecerdasan AI dengan menilai sama ada sistem AI boleh bersaing dengan manusia Mempunyai perbualan yang tidak dapat dibezakan.
Gambar
Rajah 1: Ilustrasi kreativiti relatif dan kreativiti statistik. Dalam Rajah 1, kami menerangkan kreativiti relatif (a) dan kreativiti statistik (b). Kreativiti relatif merujuk kepada penilaian keupayaan AI untuk mencipta seni yang hampir tidak dapat dibezakan daripada pencipta manusia hipotesis, dengan mengambil kira pengaruh biografi yang sama. Kreativiti statistik, sebaliknya, dinilai dengan mengukur keupayaan ciptaan yang dihasilkan AI untuk tidak dapat dibezakan daripada pencipta manusia sedia ada, seperti yang ditentukan oleh metrik jarak pengedaran.
Kreativiti relatif mempunyai beberapa persamaan dengan ujian Turing, tetapi terdapat juga beberapa perbezaan. Persamaannya ialah semuanya berdasarkan perspektif manusia dan menilai keupayaan sistem AI dengan membandingkan prestasi sistem AI dengan manusia. Perbezaannya ialah matlamat ujian Turing adalah untuk menilai kecerdasan sistem AI, manakala matlamat kreativiti relatif adalah untuk menilai kreativiti sistem AI. Kecerdasan dan kreativiti adalah dua dimensi berbeza yang mungkin mempunyai beberapa pertindihan tetapi juga beberapa perbezaan. Sebagai contoh, sistem AI mungkin pintar tetapi tidak semestinya kreatif, dan sebaliknya. Perbezaan lain ialah penilaian Ujian Turing adalah berasaskan perbualan, manakala penilaian kreativiti relatif adalah berdasarkan kerja. Dialog ialah proses interaktif, dinamik, masa nyata, manakala kerja adalah hasil statik, tetap dan tertunda. Oleh itu, penilaian kreativiti relatif mungkin lebih sukar kerana ia memerlukan mengambil kira lebih banyak faktor, seperti gaya, kandungan, kualiti, keaslian, dan lain-lain karya. Penulis percaya bahawa kreativiti relatif adalah kaedah yang lebih komprehensif dan mendalam untuk menilai kreativiti, yang mengambil kira bukan sahaja prestasi sistem AI, tetapi juga latar belakang dan ciri-ciri pencipta manusia.
Walaupun konsep kreativiti relatif mencerahkan, ia masih kekurangan kaedah penilaian operasi. Bagi menebus kekurangan ini, penulis memperkenalkan konsep kreativiti statistik (Statistical Creativity), yang ditakrifkan sebagai: sistem AI dianggap kreatif secara statistik jika ia boleh menjana, memandangkan sekumpulan pencipta manusia, Output yang tidak dapat dibezakan daripada hasil kreatif kumpulan, maka sistem AI boleh dianggap sebagai kreatif sebagai kumpulan. Sifat "statistik" kreativiti statistik dicerminkan dalam fakta bahawa ia menilai kreativiti sistem AI berdasarkan data yang boleh diperhatikan dan bukannya piawaian abstrak.
Gambar
Pengarang mencadangkan ukuran kreativiti statistik, iaitu E0(q), iaitu ukuran empirikal yang digunakan untuk menganggarkan perbezaan antara keupayaan kreatif model AI dan sekumpulan pencipta manusia yang tidak dapat dibezakan. . Semakin rendah nilai E0(q), semakin baik model AI mampu meniru kebolehan kreatif kumpulan tersebut. Penulis juga memberikan teorem kreativiti statistik, menjelaskan keadaan di mana model AI boleh diklasifikasikan sebagai mempunyai δ-kreativiti, iaitu, E0(q) <, dan kami mempunyai set sampel yang cukup besar untuk Evaluate. Teorem ini bukan sahaja memberikan kaedah klasifikasi kreativiti, tetapi juga memberikan tahap kreativiti, iaitu δ, yang mewakili perbezaan keupayaan kreatif antara model AI dan kumpulan pencipta manusia. Penulis percaya bahawa kreativiti statistik adalah kaedah yang lebih halus dan fleksibel untuk menilai kreativiti Ia tidak memerlukan model AI untuk menyalin sepenuhnya pencipta manusia, tetapi menekankan bahawa model AI boleh mencapai tahap persamaan tertentu persamaan dinilai melalui penilaian dari perspektif pembaca. Apabila penilai adalah manusia, model AI yang berjaya secara kreatif seharusnya dapat meniru pencipta novel dengan mahir daripada perspektif penilai manusia.
Model Autoregresif ialah teknik Model Bahasa Besar (LLM) biasa yang menjana teks koheren dengan meramalkan token seterusnya berdasarkan urutan teks pengedaran kebarangkalian sebelumnya. Model autoregresif dianggap mempunyai tahap kreativiti tertentu kerana keupayaannya untuk menghasilkan teks novel seperti puisi, cerita, kod, dll. Walau bagaimanapun, cara menilai dan meningkatkan kreativiti model autoregresif masih menjadi persoalan terbuka. Penulis menggunakan konsep kreativiti statistik kepada model autoregresif dan mencadangkan ukuran kreativiti statistik untuk ramalan token seterusnya, iaitu E1(q), iaitu ukuran empirikal yang digunakan untuk menganggar model autoregresif dan Kebolehbezaan antara kebolehan kreatif kumpulan pencipta manusia. Semakin rendah nilai E1(q), semakin baik model autoregresif dapat meniru kebolehan kreatif kumpulan tersebut. . ; δ, dan kami mempunyai set sampel yang cukup besar untuk penilaian. Teorem ini bukan sahaja memberikan kaedah klasifikasi kreativiti, tetapi juga memberikan darjah kreativiti, iaitu δ, yang mewakili perbezaan antara model autoregresif dan keupayaan kreatif sekumpulan pencipta manusia. Dakwaan penulis adalah mudah: jika model autoregresif boleh menjana urutan (seperti puisi atau cerita) yang serupa dengan karya sekumpulan artis manusia, maka ia mempamerkan tahap kreativiti yang setanding dengan kumpulan itu. Untuk mengukur penilaian ini, penulis memperkenalkan metrik E1(q).
Ramalan token seterusnya ialah teknologi teras model autoregresif, yang menentukan kualiti dan kepelbagaian jujukan teks yang dijana oleh model. Kesukaran ramalan token seterusnya bergantung pada konteks yang diberikan, dan kemungkinan token sasaran. Jika konteksnya jelas dan khusus, maka meramalkan token seterusnya adalah lebih mudah kerana sesetengah token adalah lebih munasabah dan biasa. Contohnya, jika konteksnya ialah "Saya suka makan", maka teg seterusnya mungkin "epal", "roti", "ladu", dsb. Walau bagaimanapun, jika konteksnya kabur dan abstrak, maka ramalan token seterusnya adalah lebih sukar kerana banyak token boleh dilakukan tanpa kelebihan yang jelas. Contohnya, jika konteksnya ialah "Saya mahu", maka teg seterusnya mungkin "perjalanan", "belajar", "tidur", dsb. Dalam kes ini, model autoregresif memerlukan kreativiti yang lebih besar untuk menjana urutan teks yang bermakna dan menarik.
Kepentingan ramalan teg seterusnya ialah ia mencerminkan tahap kreativiti model autoregresif, dan persamaannya dengan kreativiti pencipta manusia. Model autoregresif mempamerkan kreativiti yang sama seperti pencipta manusia jika ia boleh menjana token seterusnya yang tidak dapat dibezakan daripada kerja pencipta manusia dalam konteks yang berbeza. Penilaian kreativiti ini boleh dijalankan melalui ukuran kreativiti statistik, seperti E1(q). Penulis percaya kaedah penilaian ini adalah kaedah yang lebih objektif dan saintifik yang tidak bergantung kepada pertimbangan subjektif manusia tetapi berdasarkan pengiraan data dan kebarangkalian. Penyelidikan penulis menyediakan perspektif dan kaedah baharu untuk kreativiti model autoregresif, yang membantu meningkatkan keupayaan penjanaan dan kualiti model.
Model bahasa besar (LLM) berkondisi segera ialah paradigma model canggih yang boleh memanfaatkan gesaan (prompt) ) untuk membuka kunci potensi keupayaan model. Petua ialah kaedah menyediakan format input dan output kepada model, yang boleh digunakan untuk membimbing model menyelesaikan tugasan yang berbeza, seperti pengelasan teks, penjanaan teks, ringkasan teks, dsb. Gesaan berfungsi sama seperti heuristik manusia, merangsang kreativiti dan fleksibiliti dalam model. Walau bagaimanapun, cara menilai dan meningkatkan kreativiti LLM berasaskan segera masih menjadi persoalan terbuka. Penulis menggunakan konsep kreativiti statistik kepada LLM berasaskan kiu dan mencadangkan ukuran kreativiti statistik untuk isyarat kontekstual yang berbeza, iaitu E2(q), yang merupakan ukuran empirikal yang digunakan untuk menganggarkan LLM berasaskan kiu dan kebolehbezaan keupayaan kreatif komuniti pencipta manusia. Lebih rendah nilai E2(q), lebih baik LLM berasaskan segera dapat meniru keupayaan kreatif kumpulan. Penulis juga memberikan inferens tentang kreativiti statistik LLM berasaskan segera, menjelaskan keadaan di mana LLM berasaskan segera boleh diklasifikasikan sebagai mempunyai kreativiti δ, iaitu, E2(q) <, dan kami ada a Satu set sampel yang cukup besar untuk penilaian. Inferens ini bukan sahaja memberikan kaedah klasifikasi kreativiti, tetapi juga memberikan tahap kreativiti, iaitu δ, yang mewakili perbezaan antara keupayaan kreatif LLM berasaskan segera dan kumpulan pencipta manusia. Dakwaan pengarang adalah mudah: jika LLM berasaskan segera mampu menjana karya yang tidak dapat dibezakan daripada kumpulan pencipta manusia berdasarkan petunjuk kontekstual yang berbeza, maka ia mempamerkan tahap kreativiti yang setanding dengan kumpulan itu. Untuk mengukur penilaian ini, penulis memperkenalkan metrik E2(q).
Kehilangan Kreativiti Statistik (Kehilangan Kreativiti Statistik) ialah fungsi objektif yang boleh dioptimumkan yang digunakan untuk melatih model AI kreatif. Ia ditakrifkan berdasarkan ukuran kreativiti statistik, seperti E0(q), E1(q) atau E2(q). Lebih rendah nilai kehilangan kreativiti statistik, lebih baik model AI mampu meniru keupayaan kreatif sekumpulan pencipta manusia. Penulis mencadangkan had atas kehilangan kreativiti statistik, formula (2), dan konsepnya yang berkaitan dengan generalisasi dalam pembelajaran mendalam, seperti kerumitan Rademacher, maklumat bersama, dan ε -Nombor penutup (nombor penutup ε), dsb. Penulis menganalisis had atas kehilangan kreativiti statistik sebagai fungsi log-kemungkinan ramalan token seterusnya dan jumlah data pencipta-pengeluaran yang diperlukan untuk mencapai kreativiti statistik. Penemuan pengarang menekankan kepentingan kepelbagaian dalam pasangan kerja pencipta, dan bukannya hanya mempunyai sejumlah besar data penciptaan. Wawasan ini menjadikan konsep kreativiti statistik amat terpakai dalam rangka kerja AI semasa berdasarkan ramalan tanda seterusnya. Penyelidikan penulis bukan sahaja menyediakan perspektif teori, tetapi juga membimbing perbincangan tentang kreativiti AI, menyokong penggunaan penilaian relatif untuk mempromosikan penyelidikan empirikal, dan mewujudkan rangka kerja untuk menilai dan meningkatkan keupayaan kreatif model AI.
Pengarang akhirnya meninjau karya berkaitan sebelum ini mengenai definisi dan aplikasi kreativiti, terutamanya melibatkan dua bidang penglihatan dan bahasa. Penulis ambil perhatian bahawa walaupun terdapat banyak kajian yang cuba menerapkan unsur kreativiti dalam model generatif, tiada satu pun mentakrifkan kreativiti secara langsung atau mengoptimumkannya secara langsung. Sebaliknya, penyelidikan penulis bertujuan untuk membina asas teori untuk kreativiti, rangka kerja yang secara semula jadi menggabungkan pandangan terdahulu ke dalam kepelbagaian dan kualiti penjanaan. Penulis mengharapkan sumbangan mereka untuk meletakkan asas untuk penyelidikan masa depan dan membimbing peningkatan kreativiti model.
Dalam bidang penglihatan, model penjanaan imej kreatif telah mencapai kemajuan yang ketara, menimbulkan persoalan sama ada mesin boleh menghasilkan seni kreatif. Hertzmann (2018) meneroka isu ini secara mendalam, menonjolkan persimpangan antara grafik komputer dan inovasi artistik. Xu et al. (2012a) mencadangkan kaedah pemodelan tiga dimensi yang kreatif yang boleh menghasilkan model yang pelbagai mengikut pilihan pengguna. Rangkaian musuh generatif (GAN) (Goodfellow et al., 2014) digunakan oleh Elgammal et al (2017) untuk memacu penciptaan gaya artistik yang unik dengan memaksimumkan penyelewengan daripada gaya yang diketahui. Sbai et al. (2018) meningkatkan lagi berat sebelah ini, menggalakkan model untuk menjadi gaya yang berbeza daripada set latihan. Penjanaan kreatif juga boleh dilihat sebagai proses gabungan, dengan Ge et al (2021) dan Ranaweera (2016) menekankan kepentingan penyepaduan elemen terperinci. Atas dasar ini, Vinker et al (2023) menguraikan konsep pemperibadian kepada elemen visual untuk penyusunan semula yang inovatif, memperkayakan output kreatif.
Dalam bidang bahasa, pembangunan model bahasa juga telah mendorong penyelidik untuk meneroka cara mengoptimumkan penggunaan data untuk meningkatkan kebolehsuaian model dalam bidang, tugas dan bahasa yang berbeza (Gururangan et al., 2020; Devlin et al., 2019; Conneau et al., 2020). Penyelidik juga telah menunjukkan kecenderungan untuk menggunakan model bahasa untuk mentafsir nuansa dalam komunikasi manusia (Schwartz et al., 2013; Wu et al., 2022). Wawasan ini juga telah digunakan untuk menambah baik model klasifikasi (Hovy, 2015; Flek, 2020). Dengan peningkatan populariti model generatif, orang ramai juga berminat dengan penjanaan teks yang boleh dikawal, iaitu output model mesti memenuhi beberapa kekangan, seperti kesopanan (Saha et al., 2022; Sennrich et al., 2016), emosi (Liu et al., 2016) al., 2021; Dathathri et al., 2019; He et al., 2020) atau kekangan gaya lain. Akhirnya, pemindahan gaya teks (TST), yang menukar gaya teks input kepada gaya sasaran yang ditetapkan, juga telah menjadi tugas yang popular. Gaya boleh merujuk kepada julat ciri khusus teks dan pengarang yang berbeza, seperti kesopanan (Madaan et al., 2020), formaliti (Rao dan Tetreault, 2018; Briakou et al., 2021), kesederhanaan (Zhu et al. , 2021) 2010; van den Bercken et al., 2019; Weng et al., 2019; et al., 2018) dan seterusnya (Jin et al., 2022). Walaupun semua aplikasi ini cuba menerapkan unsur kreativiti dalam model generatif, tiada satu pun yang mentakrifkan kreativiti secara langsung atau mengoptimumkannya secara langsung. Sebaliknya, mereka menumpukan pada meningkatkan prestasi model pada tugas yang telah ditetapkan sebagai proksi untuk kreativiti. Sebaliknya, penyelidikan penulis bertujuan untuk mewujudkan asas teori untuk kreativiti. Rangka kerja ini secara semula jadi menggabungkan pandangan terdahulu tentang kepelbagaian dan kualiti penjanaan. Penulis mengharapkan sumbangan mereka untuk meletakkan asas untuk penyelidikan masa depan dan membimbing peningkatan kreativiti model.
Rujukan: https://arxiv.org/abs/2401.01623
Atas ialah kandungan terperinci Bolehkah kecerdasan buatan menunjukkan kreativiti seperti manusia?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!