Rumah Peranti teknologi AI Tafsiran mendalam Nanda Yu Yang: Apakah itu 'model dunia'?

Tafsiran mendalam Nanda Yu Yang: Apakah itu 'model dunia'?

Feb 27, 2024 pm 07:50 PM
ai data

Dengan media yang menggembar-gemburkan Sora, bahan pengenalan OpenAI memanggil Sora sebagai "simulator dunia". Istilah model dunia telah muncul semula, tetapi terdapat beberapa artikel yang memperkenalkan model dunia.

Di sini kami menyemak apa itu model dunia dan membincangkan sama ada Sora ialah simulator dunia.

Apakah model dunia/model dunia

Apabila perkataan dunia/dunia dan persekitaran/persekitaran disebut dalam bidang AI, biasanya untuk membezakannya dengan ejen/ejen.

Bidang yang mempunyai penyelidikan paling banyak tentang ejen ialah pembelajaran pengukuhan dan robotik.

Jadi anda boleh melihat bahawa model dunia dan pemodelan dunia muncul paling awal dan paling kerap dalam kertas dalam bidang robotik.

Perkataan model dunia yang mempunyai impak terbesar hari ini mungkin artikel ini dinamakan "model dunia" yang disiarkan oleh Jurgen di arxiv pada 2018. Artikel itu akhirnya diterbitkan dalam NeurIPS'18.

Tafsiran mendalam Nanda Yu Yang: Apakah itu model dunia?

Makalah itu tidak mentakrifkan apakah model Dunia, tetapi membuat analogi kepada model mental otak manusia dalam sains kognitif, memetik sastera dari tahun 1971.

Tafsiran mendalam Nanda Yu Yang: Apakah itu model dunia?

model mental ialah imej cermin otak manusia tentang dunia sekeliling

Model mental yang diperkenalkan di Wikipedia dengan jelas menunjukkan bahawa ia mungkin mengambil bahagian dalam kognisi, penaakulan dan proses membuat keputusan. Dan apabila ia datang kepada model mental, ia merangkumi dua bahagian: perwakilan mental dan simulasi mental.

representasi dalaman realiti luaran, dihipotesiskan memainkan peranan utama dalam kognisi, penaakulan dan membuat keputusan Istilah ini dicipta oleh Kenneth Craik pada tahun 1943 yang mencadangkan bahawa minda membina "model berskala kecil" realiti yang. ia digunakan untuk menjangka peristiwa.

Ia masih agak mengelirukan pada ketika ini, tetapi gambar rajah struktur dalam kertas itu menerangkan dengan jelas apa itu model dunia.

Tafsiran mendalam Nanda Yu Yang: Apakah itu model dunia?

Dalam rajah, V->z menegak ialah perwakilan dimensi rendah bagi pemerhatian, yang dilaksanakan oleh VAE Mendatar M->h->M->h ialah perwakilan momen seterusnya yang diramalkan bagi jujukan , dilaksanakan dengan RNN, kedua-dua bahagian itu ditambah kepada Model Dunia.

Dalam erti kata lain, model Dunia terutamanya merangkumi perwakilan keadaan dan model peralihan, yang juga sepadan dengan perwakilan mental dan simulasi mental.

Apabila anda melihat gambar di atas, anda mungkin terfikir, bukankah semua ramalan jujukan adalah model dunia?

Sebenarnya, pelajar yang sudah biasa dengan pembelajaran pengukuhan boleh melihat secara sepintas lalu bahawa struktur gambar ini adalah salah (tidak lengkap), dan struktur sebenar adalah gambar di bawah ini bukan sahaja z, tetapi juga tindakan. Ini bukan ramalan jujukan biasa (adakah menambah tindakan membuat perbezaan besar? Ya, menambah tindakan membolehkan pengedaran data berubah secara bebas, yang membawa cabaran besar).

Tafsiran mendalam Nanda Yu Yang: Apakah itu model dunia?

Kertas Jurgen tergolong dalam bidang pembelajaran pengukuhan.

Jadi, bukankah terdapat banyak RL berasaskan model dalam pembelajaran pengukuhan Apakah perbezaan antara model dan model dunia? Jawapannya tiada beza, ia adalah perkara yang sama. Jurgen berkata sesuatu dahulu

Tafsiran mendalam Nanda Yu Yang: Apakah itu model dunia?

Maksud asasnya ialah tidak kira berapa banyak kerja RL berasaskan model yang dilakukan, saya adalah perintis RNN saya mencipta RNN untuk melakukan model, dan saya hanya mahu melakukannya.

Dalam versi awal artikel Jurgen, dia juga menyebut banyak RL berasaskan model Walaupun dia mempelajari model itu, dia tidak melatih RL sepenuhnya dalam model itu.

Tafsiran mendalam Nanda Yu Yang: Apakah itu model dunia?

Hakikat bahawa RL tidak terlatih sepenuhnya dalam model sebenarnya bukanlah perbezaan antara RL berasaskan model dan model, tetapi kekecewaan yang berpanjangan terhadap arah RL berasaskan model: model tidak cukup tepat, dan RL dilatih sepenuhnya dalam model adalah sangat berkesan. Masalah ini hanya dapat diselesaikan dalam beberapa tahun kebelakangan ini.

Smart Sutton menyedari masalah model yang tidak tepat sejak dahulu lagi. Pada tahun 1990, karya Senibina Bersepadu untuk Pembelajaran, Perancangan dan Tindakbalas berdasarkan Pengaturcaraan Dinamik yang mencadangkan rangka kerja Dyna (diterbitkan pada ICML, yang merupakan bengkel pertama yang menjadi persidangan), memanggil model ini sebagai model tindakan, menekankan meramalkan hasil pelaksanaan tindakan.

RL belajar daripada data sebenar (baris 3) sambil belajar daripada model (baris 5) untuk mengelakkan pembelajaran model yang tidak tepat daripada strategi yang lemah.

Tafsiran mendalam Nanda Yu Yang: Apakah itu model dunia?

Anda dapat melihat bahawa model dunia sangat penting untuk membuat keputusan. Jika anda boleh mendapatkan model dunia yang tepat, anda boleh mencari keputusan optimum dalam realiti melalui percubaan dan kesilapan dalam model dunia.

Ini adalah fungsi teras model dunia: penaakulan kontrafaktual, iaitu, walaupun untuk keputusan yang belum dilihat dalam data, keputusan keputusan boleh disimpulkan dalam model dunia.

Pelajar yang memahami penaakulan sebab-sebab akan terbiasa dengan istilah penaakulan kontrafaktual Dalam buku sains popular Judea Pearl yang memenangi Anugerah, sebuah tangga sebab dilukis Peringkat bawah ialah "persatuan", iaitu hari ini. Apa yang kebanyakan model ramalan lakukan terutamanya lapisan tengah ialah "intervensi", dan penerokaan dalam pembelajaran pengukuhan adalah intervensi biasa lapisan atas, menjawab soalan bagaimana jika melalui imaginasi. Gambarajah skematik yang dilukis oleh Judea untuk penalaran kontrafaktual dibayangkan oleh saintis dalam otak mereka, yang serupa dengan gambarajah skematik yang digunakan Jurgen dalam kertas kerjanya.

Tafsiran mendalam Nanda Yu Yang: Apakah itu model dunia?

Kiri: Gambar rajah skema model dunia dalam kertas Jurgen. Kanan: Tangga sebab dan akibat dalam buku Yudea.

Pada ketika ini kita boleh merumuskan bahawa mengejar model dunia oleh penyelidik AI adalah untuk cuba mengatasi data, menjalankan penaakulan berlawanan dan mengejar keupayaan untuk menjawab soalan bagaimana jika. Ini adalah kebolehan yang ada pada manusia secara semula jadi, tetapi AI semasa masih sangat lemah. Sebaik sahaja kejayaan dibuat, keupayaan membuat keputusan AI akan dipertingkatkan dengan sangat baik, membolehkan aplikasi senario seperti pemanduan autonomi sepenuhnya.

Adakah Sora simulator dunia

Perkataan simulator lebih biasa digunakan dalam bidang kejuruteraan Ia berfungsi seperti model dunia dan mencuba percubaan dan kesilapan kos tinggi dan berisiko tinggi yang sukar dilaksanakan dalam bidang. dunia sebenar. OpenAI nampaknya ingin merumuskan semula frasa tetapi mengekalkan makna yang sama.

Video yang dijana oleh Sora hanya boleh dipandu oleh kata-kata gesaan yang samar-samar, menjadikannya sukar dikawal dengan tepat. Oleh itu, ia lebih kepada alat video dan sukar digunakan sebagai alat penaakulan kontrafak untuk menjawab soalan bagaimana jika dengan tepat.

Adalah sukar untuk menilai sejauh mana kebolehan penjanaan Sora, kerana ia sama sekali tidak jelas betapa berbezanya video demo daripada data latihan.

Apa yang lebih mengecewakan ialah demo ini menunjukkan bahawa Sora tidak mempelajari undang-undang fizik dengan tepat. Saya telah melihat seseorang menunjukkan ketidakselarasan dengan undang-undang fizikal dalam video yang dihasilkan oleh Sora [OpenAI mengeluarkan model video Vincent Sora, AI boleh memahami dunia fizikal yang sedang bergerak Adakah ini model dunia? Apakah maksudnya? ]

Saya rasa demo yang dikeluarkan oleh OpenAI harus berdasarkan data latihan yang sangat mencukupi, malah termasuk data yang dijana oleh CG. Walau bagaimanapun, walaupun begitu, undang-undang fizik yang boleh dihuraikan dengan persamaan dengan beberapa pembolehubah masih tidak difahami.

OpenAI percaya bahawa Sora membuktikan laluan kepada simulator dunia fizikal, tetapi nampaknya hanya menyusun data bukanlah laluan kepada teknologi pintar yang lebih maju.

Atas ialah kandungan terperinci Tafsiran mendalam Nanda Yu Yang: Apakah itu 'model dunia'?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Kaedah apa yang digunakan untuk menukar rentetan ke dalam objek dalam vue.js? Kaedah apa yang digunakan untuk menukar rentetan ke dalam objek dalam vue.js? Apr 07, 2025 pm 09:39 PM

Apabila menukar rentetan ke objek dalam vue.js, json.parse () lebih disukai untuk rentetan json standard. Untuk rentetan JSON yang tidak standard, rentetan boleh diproses dengan menggunakan ungkapan biasa dan mengurangkan kaedah mengikut format atau url yang dikodkan. Pilih kaedah yang sesuai mengikut format rentetan dan perhatikan isu keselamatan dan pengekodan untuk mengelakkan pepijat.

Cara Menggunakan MySQL Selepas Pemasangan Cara Menggunakan MySQL Selepas Pemasangan Apr 08, 2025 am 11:48 AM

Artikel ini memperkenalkan operasi pangkalan data MySQL. Pertama, anda perlu memasang klien MySQL, seperti MySqlworkbench atau Command Line Client. 1. Gunakan perintah MySQL-Uroot-P untuk menyambung ke pelayan dan log masuk dengan kata laluan akaun root; 2. Gunakan CreateTatabase untuk membuat pangkalan data, dan gunakan Pilih pangkalan data; 3. Gunakan createtable untuk membuat jadual, menentukan medan dan jenis data; 4. Gunakan InsertInto untuk memasukkan data, data pertanyaan, kemas kini data dengan kemas kini, dan padam data dengan padam. Hanya dengan menguasai langkah -langkah ini, belajar menangani masalah biasa dan mengoptimumkan prestasi pangkalan data anda boleh menggunakan MySQL dengan cekap.

Vue.js Bagaimana untuk menukar pelbagai jenis rentetan ke dalam pelbagai objek? Vue.js Bagaimana untuk menukar pelbagai jenis rentetan ke dalam pelbagai objek? Apr 07, 2025 pm 09:36 PM

Ringkasan: Terdapat kaedah berikut untuk menukar array rentetan vue.js ke dalam tatasusunan objek: Kaedah asas: Gunakan fungsi peta yang sesuai dengan data yang diformat biasa. Permainan lanjutan: Menggunakan ungkapan biasa boleh mengendalikan format yang kompleks, tetapi mereka perlu ditulis dengan teliti dan dipertimbangkan. Pengoptimuman Prestasi: Memandangkan banyak data, operasi tak segerak atau perpustakaan pemprosesan data yang cekap boleh digunakan. Amalan Terbaik: Gaya Kod Jelas, Gunakan nama dan komen pembolehubah yang bermakna untuk memastikan kod ringkas.

Geospatial Laravel: Pengoptimuman peta interaktif dan sejumlah besar data Geospatial Laravel: Pengoptimuman peta interaktif dan sejumlah besar data Apr 08, 2025 pm 12:24 PM

Cecair memproses 7 juta rekod dan membuat peta interaktif dengan teknologi geospatial. Artikel ini meneroka cara memproses lebih dari 7 juta rekod menggunakan Laravel dan MySQL dan mengubahnya menjadi visualisasi peta interaktif. Keperluan Projek Cabaran Awal: Ekstrak Wawasan berharga menggunakan 7 juta rekod dalam pangkalan data MySQL. Ramai orang mula -mula mempertimbangkan bahasa pengaturcaraan, tetapi mengabaikan pangkalan data itu sendiri: Bolehkah ia memenuhi keperluan? Adakah penghijrahan data atau pelarasan struktur diperlukan? Bolehkah MySQL menahan beban data yang besar? Analisis awal: Penapis utama dan sifat perlu dikenalpasti. Selepas analisis, didapati bahawa hanya beberapa atribut yang berkaitan dengan penyelesaiannya. Kami mengesahkan kemungkinan penapis dan menetapkan beberapa sekatan untuk mengoptimumkan carian. Carian Peta Berdasarkan Bandar

Cara menyelesaikan MySQL tidak dapat dimulakan Cara menyelesaikan MySQL tidak dapat dimulakan Apr 08, 2025 pm 02:21 PM

Terdapat banyak sebab mengapa permulaan MySQL gagal, dan ia boleh didiagnosis dengan memeriksa log ralat. Penyebab umum termasuk konflik pelabuhan (periksa penghunian pelabuhan dan ubah suai konfigurasi), isu kebenaran (periksa keizinan pengguna yang menjalankan perkhidmatan), ralat fail konfigurasi (periksa tetapan parameter), rasuah direktori data (memulihkan data atau membina semula ruang meja), isu ruang jadual InnoDB (semak fail ibdata1) Apabila menyelesaikan masalah, anda harus menganalisisnya berdasarkan log ralat, cari punca utama masalah, dan mengembangkan tabiat sandaran data secara teratur untuk mencegah dan menyelesaikan masalah.

Cara menetapkan masa tamat vue axios Cara menetapkan masa tamat vue axios Apr 07, 2025 pm 10:03 PM

Untuk menetapkan masa untuk Vue Axios, kita boleh membuat contoh Axios dan menentukan pilihan masa tamat: dalam tetapan global: vue.prototype. $ Axios = axios.create ({timeout: 5000}); Dalam satu permintaan: ini. $ axios.get ('/api/pengguna', {timeout: 10000}).

Cara mengoptimumkan prestasi pangkalan data selepas pemasangan MySQL Cara mengoptimumkan prestasi pangkalan data selepas pemasangan MySQL Apr 08, 2025 am 11:36 AM

Pengoptimuman prestasi MySQL perlu bermula dari tiga aspek: konfigurasi pemasangan, pengindeksan dan pengoptimuman pertanyaan, pemantauan dan penalaan. 1. Selepas pemasangan, anda perlu menyesuaikan fail my.cnf mengikut konfigurasi pelayan, seperti parameter innodb_buffer_pool_size, dan tutup query_cache_size; 2. Buat indeks yang sesuai untuk mengelakkan indeks yang berlebihan, dan mengoptimumkan pernyataan pertanyaan, seperti menggunakan perintah menjelaskan untuk menganalisis pelan pelaksanaan; 3. Gunakan alat pemantauan MySQL sendiri (ShowProcessList, ShowStatus) untuk memantau kesihatan pangkalan data, dan kerap membuat semula dan mengatur pangkalan data. Hanya dengan terus mengoptimumkan langkah -langkah ini, prestasi pangkalan data MySQL diperbaiki.

Jurutera Backend Senior Remote (Platform) memerlukan kalangan Jurutera Backend Senior Remote (Platform) memerlukan kalangan Apr 08, 2025 pm 12:27 PM

Jurutera Backend Senior Remote Company Kekosongan Syarikat: Lokasi Lokasi: Jauh Pejabat Jauh Jenis: Gaji sepenuh masa: $ 130,000- $ 140,000 Penerangan Pekerjaan Mengambil bahagian dalam penyelidikan dan pembangunan aplikasi mudah alih Circle dan ciri-ciri berkaitan API awam yang meliputi keseluruhan kitaran hayat pembangunan perisian. Tanggungjawab utama kerja pembangunan secara bebas berdasarkan rubyonrails dan bekerjasama dengan pasukan react/redux/relay front-end. Membina fungsi teras dan penambahbaikan untuk aplikasi web dan bekerjasama rapat dengan pereka dan kepimpinan sepanjang proses reka bentuk berfungsi. Menggalakkan proses pembangunan positif dan mengutamakan kelajuan lelaran. Memerlukan lebih daripada 6 tahun backend aplikasi web kompleks

See all articles