Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal-AI-php.cn

Rumah

Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal

王林

Apr 28, 2024 pm 01:04 PM

industri teknologi pemampatan premiere vidu Video mockup Teknologi Shengshu

Anda berkata kotak itu harus diisi dengan berlian, jadi kotak itu dipenuhi dengan berlian, yang lebih mempesonakan daripada pukulan sebenar. Krew mana yang tidak suka kemahiran sedemikian?

Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal

Inilah "ajaib" yang dipersembahkan oleh perisian penyuntingan video Adobe Premiere Pro suatu ketika dahulu. Perisian ini memperkenalkan alat video AI seperti Sora, Runway, dan Pika untuk mencapai keupayaan untuk menambah objek, mengalih keluar objek dan menjana klip video dalam video Ini dianggap sebagai satu lagi inovasi teknologi dalam bidang video.

Dari Februari apabila Sora menyapu dunia kepada keajaiban Adobe sekali lagi, di luar negara sedang giat dijalankan. Sebaliknya, China masih dalam keadaan "menunggu" dalam bidang video, terutamanya ke arah penjanaan video yang panjang. Sejak dua bulan lalu, kami telah mendengar beberapa dakwaan mengejar Sora, tetapi masih belum melihat kemajuan domestik yang ketara. Tetapi video pendek yang baru dikeluarkan oleh Shengshu Technology hari ini memberi kami banyak kejutan.

Ini adalah video rasmi Model video "Vidu" terbaharu dikeluarkan oleh Teknologi Shengshu dan Universiti Tsinghua. Dapat dilihat bahawa video yang dihasilkannya bukan lagi "GIF" yang berdurasi beberapa saat, tetapi mencecah lebih daripada sepuluh saat (paling lama boleh mencapai kira-kira 16 saat). Sudah tentu, apa yang lebih mengejutkan ialah kesan gambar "Vidu" sangat dekat dengan Sora Ia berfungsi dengan sangat baik dalam bahasa berbilang kanta, konsistensi masa dan ruang, dan mengikut undang-undang fizikal, dan ia juga boleh . membuat realiti bahawa dunia sebenar tidak wujud , yang sukar dicapai dengan model penjanaan video semasa. Hanya dalam masa dua bulan, Teknologi Shengshu telah dapat mencapai keputusan sedemikian, yang benar-benar mengejutkan.

Model video pertama di China yang menanda aras sepenuhnya terhadap Sora

Sejak pengeluaran Sora, pertempuran untuk "Sora domestik" telah bermula. Tetapi apabila industri memberi tumpuan kepada ciri "panjang", mereka semua mengabaikan bahawa di sebalik Sora sebenarnya adalah peningkatan kesan menyeluruh, seperti konsistensi, realisme, kecantikan, dll. dalam urutan yang panjang.

Dari sudut pandangan kesan menyeluruh, "Vidu" ialah model video pertama dan satu-satunya yang menanda aras sepenuhnya terhadap Sora pada tahap kesan, bukan sahaja di dalam negara, tetapi juga di seluruh dunia, dan ia juga merupakan model video pertama yang mencapai satu kejayaan selepas Sora. Daripada kesan khusus, kita dapat melihat dengan jelas beberapa kelebihan yang jelas:

Suntikan "bahasa kanta" ke dalam video

Terdapat konsep yang sangat penting dalam penghasilan video - bahasa kanta. Ia adalah cara utama untuk meluahkan jalan cerita, mendedahkan psikologi watak, mewujudkan suasana dan membimbing emosi penonton melalui gambar. Pilihan pukulan, sudut, pergerakan dan kombinasi yang berbeza akan sangat mempengaruhi naratif dan pengalaman penonton.

Video yang dijana AI sedia ada dapat merasakan kebosanan bahasa kanta dengan jelas, dan pergerakan kanta terhad kepada tangkapan mudah seperti tolak, tarik dan anjakan sedikit. Sebab utama di sebalik ini ialah kebanyakan penjanaan kandungan video sedia ada mula-mula menjana satu bingkai dan kemudian membuat ramalan berterusan bagi bingkai sebelumnya dan seterusnya Namun, dengan laluan teknikal arus perdana, adalah sukar untuk mencapai ramalan dinamik kecil .

Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal

^{Treler untuk filem fiksyen sains "Trailer: Genesis" ("Genesis" tahun lepas yang dijana oleh Runway in July tahun lepas}

"Vidu" menerobos batasan ini. Dalam klip dengan tema "Rumah Tepi Laut", kita dapat melihat bahawa klip yang dijana oleh "Vidu" pada satu masa melibatkan berbilang tangkapan pandangan keseluruhan Terdapat rasa naratif dari dalam rumah ke koridor untuk menikmati pemandangan di tepi susur. Dapat dilihat bahawa "Vidu" boleh bertukar antara tangkapan yang berbeza seperti tangkapan jauh, tangkapan dekat, tangkapan sederhana dan dekat di sekeliling subjek bersatu dalam bingkai.

^{Petua: Di kotej tepi laut yang unik, matahari memandikan bilik, kamera perlahan-lahan beralih ke balkoni yang menghadap ke laut yang tenang, dan akhirnya kamera membeku di laut terapung, perahu layar dan awan pemantul. (Klip video penuh dikeluarkan oleh laman web rasmi produk PixWeaver Shengshu)}

Selain itu, seperti yang dapat dilihat daripada berbilang klip dalam filem pendek, "Vidu" boleh terus menjana kesan seperti peralihan, penjejakan fokus dan tangkapan panjang, termasuk keupayaan untuk menjana rakaman filem dan peringkat televisyen, menyuntik bahasa lensa ke dalam video, dan mempertingkatkan gambaran keseluruhan.

Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal

Mengekalkan konsistensi masa dan ruang

Keselarasan dan kelancaran gambar video adalah sangat penting. Di sebalik ini adalah ketekalan watak dan ketekalan sebagai watak dalam ruang Pergerakan sentiasa konsisten dan adegan tidak boleh berubah secara tiba-tiba tanpa sebarang peralihan. Ini adalah sukar untuk dicapai oleh AI, terutamanya jika ia bertahan lama.

"Vidu" mengatasi masalah ini pada tahap tertentu. Daripada video "Cat with a Pearl Earring" yang dihasilkan olehnya, kita dapat melihat bahawa semasa kamera bergerak, kucing sebagai subjek gambar sentiasa mengekalkan ekspresi dan pakaian yang sama dalam ruang 3D, dan video secara keseluruhan. sangat koheren dan lancar, mengekalkan konsistensi masa dan ruang yang baik.

^{Tips: Ini adalah potret kucing oren dengan mata biru, berputar perlahan, diilhamkan oleh Vermeer "Girl with a Pearl Earring", gambar itu memakai anting-anting mutiara dan rambut coklat seperti Holland Cap sama, latar belakang hitam, lampu studio. (Klip video penuh dikeluarkan oleh laman web rasmi produk PixWeaver di bawah Shengshu)}

Mensimulasikan dunia fizikal sebenar

Salah satu ciri hebat Sora ialah ia boleh mensimulasikan pergerakan dunia fizikal sebenar, seperti pergerakan dan interaksi objek . Salah satu kes klasik yang dikeluarkan oleh Sora - gambar "sebuah SUV lama yang memandu di lereng bukit", sangat baik meniru habuk yang ditimbulkan oleh tayar, cahaya dan bayang-bayang di dalam hutan, dan bayang-bayang berubah semasa pemanduan kereta . Di bawah perkataan segera yang sama, kesan terjana "Vidu" dan Sora sangat serupa, dan butiran seperti habuk, cahaya dan bayang-bayang sangat hampir dengan pengalaman manusia dalam dunia fizikal sebenar. ^{Petua: Kamera mengikuti SUV vintaj putih dengan rak bumbung hitam sambil memecut menuruni jalan tanah curam yang dikelilingi oleh pokok pain, tayar mengeluarkan habuk dan cahaya matahari yang menyinari SUV itu, memancarkan cahaya hangat pada SUV. keseluruhan adegan. Jalan tanah melukai perlahan-lahan ke kejauhan, tanpa kereta atau kenderaan lain kelihatan. Terdapat pokok-pokok kayu merah di kedua-dua belah jalan, dengan tompok-tompok hijau berselerak di sana-sini. Dilihat dari belakang, kereta itu mengikut selekoh dengan mudah dan kelihatan seperti memandu di atas rupa bumi yang kasar. Jalan tanah dikelilingi oleh bukit-bukit dan gunung yang curam, dengan langit biru jernih dan gumpalan awan di atasnya. (Serpihan video penuh dikeluarkan oleh laman web rasmi produk Pixweaver)}

Kesan pengeluaran Sora.

Sudah tentu, "Vidu" gagal menghasilkan butiran separa "dengan rak bumbung hitam". Tetapi kelemahannya tidak menyembunyikan kebaikannya, dan kesan keseluruhannya sangat dekat dengan dunia nyata.

🎜🎜Imaginasi yang kaya🎜🎜🎜Berbanding dengan penggambaran kehidupan sebenar, menggunakan AI untuk menjana video mempunyai kelebihan yang besar - ia boleh menjana gambar yang tidak wujud di dunia nyata. Pada masa lalu, gambar ini selalunya memerlukan banyak tenaga kerja dan sumber bahan untuk membina atau mencipta kesan khas, tetapi AI boleh menjananya secara automatik dalam masa yang singkat. 🎜

Sebagai contoh, dalam adegan di bawah, "Perahu Layar" dan "Ombak" jarang muncul di studio, dan interaksi antara ombak dan perahu layar adalah sangat semula jadi.

^{Gesaan: Sebuah kapal di studio belayar ke arah kamera. (Klip video lengkap dikeluarkan oleh tapak web rasmi produk PixWeaver Shengshu)}

Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal

Klip "gadis tangki ikan" dalam filem pendek itu juga hebat tetapi mempunyai rasa kewajaran tertentu. Keupayaan untuk mengarang imej yang tidak wujud dalam dunia nyata ini sangat membantu untuk mencipta kandungan surealis ini bukan sahaja dapat memberi inspirasi kepada pencipta dan memberikan pengalaman visual yang baru, tetapi juga meluaskan sempadan ekspresi artistik, membawakan format kandungan yang lebih kaya dan lebih Pelbagai.

Fahami unsur Cina

Selain daripada empat ciri di atas, kami juga melihat beberapa kejutan berbeza daripada filem pendek yang dikeluarkan oleh "Vidu" boleh menghasilkan gambar dengan unsur Cina yang unik, seperti panda dan naga , pemandangan istana, dsb.

^{Petua: Di tepi tasik yang tenang, seekor panda bersemangat bermain gitar, menjadikan seluruh persekitaran menjadi hidup. Dicerminkan pada perairan yang tenang di bawah langit yang cerah, pemandangan itu dirakamkan dalam tangkapan panorama yang terang yang menggabungkan realisme dengan semangat cergas panda gergasi, mewujudkan gabungan tenaga dan ketenangan yang harmoni. (Klip video lengkap dikeluarkan oleh laman web rasmi produk PixWeaver Shenshu)}

Bagaimana anda mencapai kejayaan pesat ini dalam masa dua bulan?

Shengshu Technology, pasukan R&D di belakang "Vidu", ialah pasukan keusahawanan dalam bidang model besar berbilang modal di China Ahli teras adalah daripada Institut Penyelidikan Kepintaran Buatan Universiti Tsinghua. medan penjanaan modal seperti imej, 3D dan video.

Pada Januari tahun ini, Shengshu Technology melancarkan fungsi penjanaan video pendek pada platform reka bentuk kreatif visualnya PixWeaver, menyokong kandungan video pendek 4 saat yang sangat estetik. Selepas pelancaran Sora pada bulan Februari, dilaporkan bahawa Shengshu Technology menubuhkan pasukan penyelidikan dalaman rasmi untuk mempercepatkan kemajuan penyelidikan dan pembangunan arah video asal Pada bulan Mac, ia mencapai penjanaan video 8 saat secara dalaman, dan kemudiannya berjaya generasi 16 saat pada bulan April , mencapai kejayaan dalam semua aspek kualiti dan tempoh penjanaan.

Seperti yang kita semua tahu, Sora tidak mengumumkan terlalu banyak butiran teknikal Teras di sebalik ia mampu mencapai kejayaan dalam tempoh yang singkat adalah pengumpulan teknikal yang mendalam dan banyak pencapaian asal dari 0 hingga 1, terutamanya dalam peringkat. tahap seni bina teras.

Lapisan bawah "Vidu" adalah berdasarkan seni bina U-ViT yang dibangunkan sendiri sepenuhnya, yang dicadangkan oleh pasukan pada September 2022. Ia lebih awal daripada seni bina DiT yang diterima pakai oleh Sora dan merupakan seni bina pertama di dunia yang mengintegrasikan Resapan dan Transformer.

Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal

Dua bulan sebelum kertas DiT dikeluarkan, pasukan Zhu Jun dari Universiti Tsinghua menyerahkan kertas kerja - "All are Worth Words: A ViT Backbone for Diffusion Models". Makalah ini mencadangkan seni bina rangkaian U-ViT yang menggunakan Transformer untuk menggantikan U-Net berasaskan CNN. Ini adalah asas teknikal yang paling penting bagi "Vidu".

Dari segi laluan teknikal, "Vidu" mengamalkan seni bina gabungan Diffusion dan Transformer yang betul-betul sama dengan Sora. Berbeza daripada menggunakan kaedah pemprosesan berbilang langkah untuk menginterpolasi bingkai untuk menjana video panjang, "Vidu" menggunakan laluan yang sama seperti Sora, iaitu, secara langsung menjana video berkualiti tinggi dalam satu langkah. Dari perspektif peringkat rendah, ini ialah kaedah pelaksanaan "satu langkah" yang dijana sepenuhnya berdasarkan model tunggal Ia tidak melibatkan sisipan bingkai perantaraan dan pemprosesan berbilang langkah yang lain kepada video adalah terus dan berterusan.

Selain itu, berdasarkan seni bina U-ViT, pada Mac 2023, pasukan itu melatih model berbilang modal dengan 1 bilion parameter - UniDiffuser pada set data grafik dan teks berskala besar sumber terbuka LAION-5B, dan menjadikannya sumber terbuka (lihat "

Pasukan Zhu Jun Tsinghua telah menggunakan sumber terbuka model penyebaran pelbagai mod berskala besar pertama berdasarkan Transformer, dengan teks dan imej saling beroperasi dan menulis semula semua dicapai》).

UniDiffuser mahir terutamanya dalam tugasan grafik dan teks serta boleh menyokong penjanaan dan penukaran sewenang-wenang antara mod grafik dan teks. Pelaksanaan UniDiffuser mempunyai nilai penting - ia telah mengesahkan buat pertama kalinya kebolehskalaan (Undang-undang Penskalaan) seni bina gabungan dalam tugas latihan berskala besar, yang setara dengan menjalankan semua proses seni bina U-ViT secara besar-besaran. -tugas latihan berskala . Perlu dinyatakan bahawa UniDiffuser adalah satu tahun lebih awal daripada pengenalan Stable Diffusion 3, model grafik dengan seni bina DiT yang sama.

Pengalaman kejuruteraan yang terkumpul dalam tugasan grafik dan teks telah meletakkan asas untuk pembangunan model video. Kerana video pada asasnya adalah aliran imej, ia bersamaan dengan pengembangan imej pada garis masa. Oleh itu, hasil yang dicapai dalam tugasan imej dan teks selalunya boleh digunakan semula dalam tugasan video. Sora melakukan perkara itu sahaja: ia menggunakan teknologi anotasi semula DALL・E 3 untuk menjana penerangan terperinci bagi data latihan visual, membolehkan model mengikut arahan teks pengguna untuk menjana video dengan lebih tepat. Kesan ini pasti akan berlaku pada "Vidu".

Menurut berita sebelumnya, "Vidu" juga menggunakan semula banyak pengalaman Teknologi Bioshu dalam tugasan grafik dan teks, termasuk pecutan latihan, latihan selari, latihan ingatan rendah, dll., dengan itu berjalan dengan pantas melalui proses latihan. Dilaporkan bahawa mereka menggunakan teknologi pemampatan data video untuk mengurangkan dimensi jujukan data input, dan pada masa yang sama menggunakan rangka kerja latihan teragih yang dibangunkan sendiri Sambil memastikan ketepatan pengiraan, kecekapan komunikasi digandakan, overhed memori dikurangkan sebanyak 80%, dan kelajuan latihan meningkat sebanyak 40 kali ganda.

Daripada penyatuan tugas graf kepada penyepaduan keupayaan video, "Vidu" boleh dianggap sebagai model visual umum yang boleh menyokong penjanaan kandungan video yang lebih pelbagai dan lebih panjang. Pegawai juga mendedahkan bahawa "Vidu" sedang mempercepatkan penambahbaikan berulang. Menghadapi masa hadapan, seni bina model fleksibel "Vidu" juga akan serasi dengan rangkaian keupayaan berbilang modal yang lebih luas.

Pasukan yang berkebolehan dari Universiti Tsinghua

Akhir sekali, mari kita bincangkan tentang pasukan di sebalik "Vidu" - Teknologi Shengshu Ini adalah pasukan yang berkebolehan dengan latar belakang Tsinghua.

Pasukan teras Teknologi Shengshu berasal dari Institut Penyelidikan Kepintaran Buatan Universiti Tsinghua. Ketua saintis ialah Zhu Jun, timbalan pengarah Institut Kecerdasan Buatan Tsinghua Tang Jiayu belajar di Jabatan Sains Komputer Universiti Tsinghua dan merupakan ahli kumpulan THUNLP Bao Fan ialah doktoral pelajar di Jabatan Sains Komputer Universiti Tsinghua dan Profesor Zhu Jun Seorang ahli pasukan penyelidik, beliau telah lama mengambil berat dengan penyelidikan dalam bidang model resapan Beliau mengetuai penyiapan kedua-dua U-ViT dan UniDiffuser.

Pasukan telah terlibat dalam penyelidikan tentang kecerdasan buatan generatif dan pembelajaran mesin Bayesian selama lebih daripada 20 tahun, dan menjalankan penyelidikan mendalam pada hari-hari awal penemuan model generatif mendalam. Dari segi model penyebaran, pasukan itu menerajui pelancaran penyelidikan ke arah ini di China, dan hasilnya melibatkan arahan teknologi tindanan penuh seperti rangkaian tulang belakang, algoritma inferens berkelajuan tinggi dan latihan berskala besar.

Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal

Pasukan telah menerbitkan hampir 30 kertas kerja yang berkaitan dengan bidang berbilang modal di persidangan kecerdasan buatan terkemuka seperti ICML, NeurIPS dan ICLR Antaranya, cadangan algoritma inferens tanpa latihan Analitik-DPM dan DPM-Solver telah mencapai keputusan cemerlang dan memenangi Anugerah Kertas Cemerlang ICLR, dan telah diterima pakai oleh institusi termaju asing seperti OpenAI, Apple, dan Stability.ai, dan digunakan dalam projek bintang seperti DALL・E 2 dan Stable Diffusion.

Sejak penubuhannya pada 2023, pasukan ini telah diiktiraf oleh banyak institusi perindustrian terkenal seperti Ant Group, Qiming Venture Partners, BV Baidu Ventures, Byte Jinqiu Fund, dll., dan menyelesaikan ratusan juta yuan dalam pembiayaan. Dilaporkan bahawa Shengshu Technology kini merupakan pasukan keusahawanan dengan penilaian tertinggi dalam trek model besar berbilang modal di China. Pelancaran "Vidu" adalah satu lagi inovasi dan kepimpinan Teknologi Shenshu dalam bidang model besar asli berbilang modal.

Bacaan berkaitan:

《Temu bual eksklusif dengan Tang Jiayu dari Shengshu Technology: Selepas menerima ratusan juta pembiayaan, Transformer boleh membuat model besar berbilang modal》

《Adakah ia dijangka oleh syarikat domestik? Pasukan model besar dari Universiti Tsinghua ini memberi harapan》

Atas ialah kandungan terperinci Sora domestik yang paling berkuasa pada masa ini! Pasukan Tsinghua menerobos video berdurasi 16 saat, memahami bahasa berbilang kanta dan boleh mensimulasikan undang-undang fizikal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

Assassin's Creed Shadows - Cara Mencari Orang Panda

1 bulan yang lalu By DDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

3 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7630

Tutorial CakePHP

1389

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

141

Tunjukkan Lagi

Related knowledge

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya Aug 09, 2024 pm 04:01 PM

Tetapi mungkin dia tidak dapat mengalahkan lelaki tua di taman itu? Sukan Olimpik Paris sedang rancak berlangsung, dan pingpong telah menarik perhatian ramai. Pada masa yang sama, robot juga telah membuat penemuan baru dalam bermain pingpong. Sebentar tadi, DeepMind mencadangkan ejen robot pembelajaran pertama yang boleh mencapai tahap pemain amatur manusia dalam pingpong yang kompetitif. Alamat kertas: https://arxiv.org/pdf/2408.03906 Sejauh manakah robot DeepMind bermain pingpong? Mungkin setanding dengan pemain amatur manusia: kedua-dua pukulan depan dan pukulan kilas: pihak lawan menggunakan pelbagai gaya permainan, dan robot juga boleh bertahan: servis menerima dengan putaran yang berbeza: Walau bagaimanapun, keamatan permainan nampaknya tidak begitu sengit seperti lelaki tua di taman itu. Untuk robot, pingpong

Cakar mekanikal pertama! Yuanluobao muncul di Persidangan Robot Dunia 2024 dan mengeluarkan robot catur pertama yang boleh memasuki rumah Aug 21, 2024 pm 07:33 PM

Pada 21 Ogos, Persidangan Robot Dunia 2024 telah diadakan dengan megah di Beijing. Jenama robot rumah SenseTime "Yuanluobot SenseRobot" telah memperkenalkan seluruh keluarga produknya, dan baru-baru ini mengeluarkan robot permainan catur AI Yuanluobot - Edisi Profesional Catur (selepas ini dirujuk sebagai "Yuanluobot SenseRobot"), menjadi robot catur A pertama di dunia untuk rumah. Sebagai produk robot permainan catur ketiga Yuanluobo, robot Guoxiang baharu telah melalui sejumlah besar peningkatan teknikal khas dan inovasi dalam AI dan jentera kejuruteraan Buat pertama kalinya, ia telah menyedari keupayaan untuk mengambil buah catur tiga dimensi melalui cakar mekanikal pada robot rumah, dan melaksanakan Fungsi mesin manusia seperti bermain catur, semua orang bermain catur, semakan notasi, dsb.

Claude pun dah jadi malas! Netizen: Belajar untuk memberi percutian kepada diri sendiri Sep 02, 2024 pm 01:56 PM

Permulaan sekolah akan bermula, dan bukan hanya pelajar yang akan memulakan semester baharu yang harus menjaga diri mereka sendiri, tetapi juga model AI yang besar. Beberapa ketika dahulu, Reddit dipenuhi oleh netizen yang mengadu Claude semakin malas. "Tahapnya telah banyak menurun, ia sering berhenti seketika, malah output menjadi sangat singkat. Pada minggu pertama keluaran, ia boleh menterjemah dokumen penuh 4 halaman sekaligus, tetapi kini ia tidak dapat mengeluarkan separuh halaman pun. !" https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dalam siaran bertajuk "Totally disappointed with Claude", penuh dengan

Pada Persidangan Robot Sedunia, robot domestik yang membawa 'harapan penjagaan warga tua masa depan' ini telah dikepung Aug 22, 2024 pm 10:35 PM

Pada Persidangan Robot Dunia yang diadakan di Beijing, paparan robot humanoid telah menjadi tumpuan mutlak di gerai Stardust Intelligent, pembantu robot AI S1 mempersembahkan tiga persembahan utama dulcimer, seni mempertahankan diri dan kaligrafi dalam. satu kawasan pameran, berkebolehan kedua-dua sastera dan seni mempertahankan diri, menarik sejumlah besar khalayak profesional dan media. Permainan elegan pada rentetan elastik membolehkan S1 menunjukkan operasi halus dan kawalan mutlak dengan kelajuan, kekuatan dan ketepatan. CCTV News menjalankan laporan khas mengenai pembelajaran tiruan dan kawalan pintar di sebalik "Kaligrafi Pengasas Syarikat Lai Jie menjelaskan bahawa di sebalik pergerakan sutera, bahagian perkakasan mengejar kawalan daya terbaik dan penunjuk badan yang paling menyerupai manusia (kelajuan, beban). dll.), tetapi di sisi AI, data pergerakan sebenar orang dikumpulkan, membolehkan robot menjadi lebih kuat apabila ia menghadapi situasi yang kuat dan belajar untuk berkembang dengan cepat. Dan tangkas

Anugerah ACL 2024 Diumumkan: Salah satu Kertas Terbaik mengenai Pentafsiran Oracle oleh HuaTech, Anugerah Ujian Masa GloVe Aug 15, 2024 pm 04:37 PM

Pada persidangan ACL ini, para penyumbang telah mendapat banyak keuntungan. ACL2024 selama enam hari diadakan di Bangkok, Thailand. ACL ialah persidangan antarabangsa teratas dalam bidang linguistik pengiraan dan pemprosesan bahasa semula jadi Ia dianjurkan oleh Persatuan Antarabangsa untuk Linguistik Pengiraan dan diadakan setiap tahun. ACL sentiasa menduduki tempat pertama dalam pengaruh akademik dalam bidang NLP, dan ia juga merupakan persidangan yang disyorkan CCF-A. Persidangan ACL tahun ini adalah yang ke-62 dan telah menerima lebih daripada 400 karya termaju dalam bidang NLP. Petang semalam, persidangan itu mengumumkan kertas kerja terbaik dan anugerah lain. Kali ini, terdapat 7 Anugerah Kertas Terbaik (dua tidak diterbitkan), 1 Anugerah Kertas Tema Terbaik, dan 35 Anugerah Kertas Cemerlang. Persidangan itu turut menganugerahkan 3 Anugerah Kertas Sumber (ResourceAward) dan Anugerah Impak Sosial (

Hongmeng Smart Travel S9 dan persidangan pelancaran produk baharu senario penuh, beberapa produk baharu blockbuster dikeluarkan bersama-sama Aug 08, 2024 am 07:02 AM

Petang ini, Hongmeng Zhixing secara rasmi mengalu-alukan jenama baharu dan kereta baharu. Pada 6 Ogos, Huawei mengadakan persidangan pelancaran produk baharu Hongmeng Smart Xingxing S9 dan senario penuh Huawei, membawakan sedan perdana pintar panoramik Xiangjie S9, M7Pro dan Huawei novaFlip baharu, MatePad Pro 12.2 inci, MatePad Air baharu, Huawei Bisheng With banyak produk pintar semua senario baharu termasuk pencetak laser siri X1, FreeBuds6i, WATCHFIT3 dan skrin pintar S5Pro, daripada perjalanan pintar, pejabat pintar kepada pakaian pintar, Huawei terus membina ekosistem pintar senario penuh untuk membawa pengguna pengalaman pintar Internet Segala-galanya. Hongmeng Zhixing: Pemerkasaan mendalam untuk menggalakkan peningkatan industri kereta pintar Huawei berganding bahu dengan rakan industri automotif China untuk menyediakan

Persidangan Kecerdasan Buatan Teragih DAI 2024 Call for Papers: Hari Agen, Richard Sutton, bapa pembelajaran pengukuhan, akan hadir! Yan Shuicheng, Sergey Levine dan saintis DeepMind akan memberikan ucaptama Aug 22, 2024 pm 08:02 PM

Pengenalan Persidangan Dengan perkembangan pesat sains dan teknologi, kecerdasan buatan telah menjadi kuasa penting dalam menggalakkan kemajuan sosial. Dalam era ini, kami bertuah untuk menyaksikan dan mengambil bahagian dalam inovasi dan aplikasi Kecerdasan Buatan Teragih (DAI). Kecerdasan buatan yang diedarkan adalah cabang penting dalam bidang kecerdasan buatan, yang telah menarik lebih banyak perhatian dalam beberapa tahun kebelakangan ini. Agen berdasarkan model bahasa besar (LLM) tiba-tiba muncul Dengan menggabungkan pemahaman bahasa yang kuat dan keupayaan penjanaan model besar, mereka telah menunjukkan potensi besar dalam interaksi bahasa semula jadi, penaakulan pengetahuan, perancangan tugas, dsb. AIAgent mengambil alih model bahasa besar dan telah menjadi topik hangat dalam kalangan AI semasa. Au

Pasukan Li Feifei mencadangkan ReKep untuk memberi robot kecerdasan spatial dan mengintegrasikan GPT-4o Sep 03, 2024 pm 05:18 PM

Penyepaduan mendalam penglihatan dan pembelajaran robot. Apabila dua tangan robot bekerja bersama-sama dengan lancar untuk melipat pakaian, menuang teh dan mengemas kasut, ditambah pula dengan 1X robot humanoid NEO yang telah menjadi tajuk berita baru-baru ini, anda mungkin mempunyai perasaan: kita seolah-olah memasuki zaman robot. Malah, pergerakan sutera ini adalah hasil teknologi robotik canggih + reka bentuk bingkai yang indah + model besar berbilang modal. Kami tahu bahawa robot yang berguna sering memerlukan interaksi yang kompleks dan indah dengan alam sekitar, dan persekitaran boleh diwakili sebagai kekangan dalam domain spatial dan temporal. Sebagai contoh, jika anda ingin robot menuang teh, robot terlebih dahulu perlu menggenggam pemegang teko dan memastikannya tegak tanpa menumpahkan teh, kemudian gerakkannya dengan lancar sehingga mulut periuk sejajar dengan mulut cawan. , dan kemudian condongkan teko pada sudut tertentu. ini

See all articles