Jadual Kandungan
Demonstrasi Kesan
Pengetahuan awal: Penjanaan graf adegan penuh Tugas PSG
Seni bina model RAM
Klasifikasi Perhubungan RAM
Reka bentuk RAM yang lain
Ringkasan model RAM
Rumah Peranti teknologi AI NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

May 10, 2023 am 10:22 AM
ai Model

Pada awal bulan ini, Meta melancarkan model "Split Everything", yang mengejutkan seluruh bulatan CV.

Dalam beberapa hari lalu, model pembelajaran mesin yang dipanggil "Relate-Anything-Model (RAM)" telah muncul. Ia memberikan Model Apa-apa Segmen (SAM) keupayaan untuk mengenal pasti pelbagai hubungan visual antara konsep visual yang berbeza.

Difahamkan model itu dibangunkan oleh pasukan MMLab Universiti Teknologi Nanyang dan pelajar dari Makmal VisCom King's College London dan Universiti Tongji sebagai ganti mereka masa.

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

Alamat demo: https://huggingface.co/spaces/mmlab-ntu/ relate-anything-model

Alamat kod: https://github.com/Luodian/RelateAnything

Alamat set data: https://github.com/Jingkang50/OpenPSG

Demonstrasi Kesan

Mula-mula, mari kita ambil lihat contoh aplikasi "Relate-Anything-Model (RAM)"!

Sebagai contoh, hasil analisis imej berikut bagi pelaksanaan model RAM bermain bola sepak, menari dan berkawan sangat mengagumkan dan dipamerkan dengan baik prestasi dan potensi untuk pelbagai aplikasi.

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

Pengetahuan awal: Penjanaan graf adegan penuh Tugas PSG

Model RAM berdasarkan ECCV'22 SenseHuman Workshop & Pertandingan Contoh Algoritma Antarabangsa "Penjanaan Graf Pemandangan Panotik" Juara trek program.

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

Alamat kertas: https://arxiv.org/abs/2302.02651

Cabaran PSG mempunyai hadiah bernilai jutaan dolar dan menerima pelbagai penyelesaian yang dikemukakan oleh 100 pasukan dari seluruh dunia, termasuk menggunakan kaedah pembahagian imej lanjutan dan menyelesaikan masalah long-tail. Selain itu, pertandingan itu juga menerima beberapa pendekatan inovatif, seperti teknik penambahan data khusus graf tempat kejadian.

Selepas penilaian, berdasarkan pertimbangan seperti petunjuk prestasi, kebaharuan dan kepentingan penyelesaian, GRNet pasukan Xiaohongshu menonjol sebagai kaedah kemenangan.

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

Butiran peraduan: https://github.com/Jingkang50/OpenPSG

Sebelum memperkenalkan penyelesaian, kami mula-mula memperkenalkan dua kaedah asas PSG klasik, satu daripada kaedah dua peringkat dan satu lagi kaedah satu peringkat.

Untuk kaedah garis dasar dua peringkat, seperti yang ditunjukkan dalam Rajah a, pada peringkat pertama, model segmentasi panorama pra-terlatih FPN Panoptic digunakan untuk mengekstrak ciri, pembahagian dan ramalan pengelasan daripada imej . Ciri-ciri setiap objek individu kemudiannya disalurkan kepada penjana graf adegan klasik seperti IMP untuk penjanaan graf adegan yang disesuaikan dengan tugas PSG di peringkat kedua. Pendekatan dua peringkat ini membolehkan kaedah SGG klasik disesuaikan dengan tugas PSG dengan pengubahsuaian yang minimum.

Seperti yang ditunjukkan dalam Rajah b, kaedah garis dasar satu peringkat PSGTR mula-mula menggunakan CNN untuk mengekstrak ciri imej, dan kemudian menggunakan penyahkod pengekod transformer seperti DETR untuk belajar secara langsung Triple representation. Penjodoh Hungaria digunakan untuk membandingkan tiga kali ganda yang diramalkan dengan tiga kali ganda kebenaran tanah. Kemudian, objektif pengoptimuman adalah untuk memaksimumkan kos pengiraan pemadan, dan jumlah kerugian dikira menggunakan kehilangan DICE/F-1 entropi silang untuk pelabelan dan pembahagian.

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

Seni bina model RAM

Dalam proses reka bentuk model RAM , Penulis merujuk kepada paradigma struktur dua peringkat skim juara PSG GRNet. Walaupun penyelidikan dalam artikel PSG asal menunjukkan bahawa model satu peringkat pada masa ini menunjukkan prestasi yang lebih baik daripada model dua peringkat, namun, model satu peringkat biasanya tidak dapat mencapai prestasi segmentasi sebaik model dua peringkat.

Selepas memerhati struktur model yang berbeza, adalah spekulasi bahawa prestasi cemerlang model satu peringkat dalam meramalkan tiga kali ganda hubungan mungkin disebabkan oleh pengawasan langsung daripada imej peta ciri Isyarat bagus untuk menangkap perhubungan.

Berdasarkan pemerhatian ini, reka bentuk RAM, seperti GRNet, bertujuan untuk mencari pertukaran antara kedua-dua mod, dengan memfokuskan pada dua peringkat paradigma dan memberikannya yang serupa Ini dicapai dengan keupayaan untuk mendapatkan konteks global dalam paradigma satu peringkat.

Secara khusus, Segmen Anything Model (SAM) mula-mula digunakan sebagai pengekstrak ciri untuk mengenal pasti dan membahagikan objek dalam imej, dan ciri khusus daripada segmenter SAM adalah Peta ciri perantaraan objek digabungkan dengan pembahagian yang sepadan untuk mendapatkan ciri peringkat objek.

Selepas itu, Transformer digunakan sebagai modul konteks global, dan ciri peringkat objek yang diperoleh dimasukkan ke dalamnya selepas pemetaan linear. Melalui mekanisme perhatian silang dalam pengekod Transformer, ciri objek output mengumpul lebih banyak maklumat global daripada objek lain.

Akhir sekali, untuk setiap output ciri peringkat objek oleh Transformer, mekanisme perhatian kendiri digunakan untuk memperkayakan lagi maklumat kontekstual dan melengkapkan interaksi antara setiap objek.

Perhatikan bahawa pembenaman kategori juga ditambahkan di sini untuk menunjukkan kategori objek, dan daripada ini kita mendapat ramalan pasangan objek dan hubungannya .

Klasifikasi Perhubungan RAM

Semasa proses latihan, bagi setiap kategori perhubungan, tugas pengelasan binari perhubungan perlu dilakukan untuk menentukan objek berpasangan sama ada terdapat hubungan antara mereka.

Sama seperti GRNet, terdapat beberapa pertimbangan khas untuk tugas pengelasan binari hubungan. Sebagai contoh, set data PSG biasanya mengandungi dua objek dengan berbilang hubungan, seperti "orang melihat gajah" dan "orang memberi makan gajah" wujud serentak. Untuk menyelesaikan masalah berbilang label, penulis menukar ramalan perhubungan daripada masalah pengelasan label tunggal kepada masalah pengelasan berbilang label.

Tambahan pula, memandangkan set data PSG Pencarian ketepatan dan korelasi mungkin tidak sesuai untuk mempelajari hubungan sempadan (seperti "dalam" dan "berhenti di" sebenarnya wujud pada masa yang sama). Untuk menyelesaikan masalah ini, RAM menggunakan strategi latihan kendiri yang menggunakan label suling sendiri untuk klasifikasi perhubungan dan menggunakan purata bergerak eksponen untuk mengemas kini label secara dinamik.

Reka bentuk RAM yang lain

Apabila mengira kehilangan klasifikasi binari hubungan, setiap objek yang diramalkan mesti dipasangkan dengan objek kebenaran tanah yang sepadan. Algoritma padanan Hungary digunakan untuk tujuan ini.

Walau bagaimanapun, algoritma ini terdedah kepada ketidakstabilan, terutamanya pada peringkat latihan awal apabila ketepatan rangkaian adalah rendah. Ini boleh membawa kepada hasil padanan yang berbeza untuk input yang sama, membawa kepada arah pengoptimuman rangkaian yang tidak konsisten dan menjadikan latihan lebih sukar.

Dalam RAM, tidak seperti penyelesaian sebelumnya, penulis boleh melakukan segmentasi lengkap dan terperinci bagi hampir semua gambar dengan bantuan model SAM yang berkuasa, dalam Dalam proses memadankan ramalan dan GT, RAM secara semula jadi mereka bentuk kaedah pemadanan GT baharu: menggunakan set data PSG untuk melatih model.

Untuk setiap imej latihan, SAM membahagikan berbilang objek, tetapi hanya beberapa yang sepadan dengan topeng ground truth (GT) PSG. Pengarang melakukan padanan mudah berdasarkan skor intersection-union (IOU) mereka supaya (hampir) setiap topeng GT diperuntukkan kepada topeng SAM. Selepas itu, penulis menjana semula rajah hubungan berdasarkan topeng SAM, yang secara semula jadi sepadan dengan ramalan model.

Ringkasan model RAM

Dalam model RAM, pengarang menggunakan Segment Anything Model (SAM) untuk mengenal pasti dan membahagikan objek dalam imej , dan Ekstrak ciri setiap objek tersegmen. Modul Transformer kemudiannya digunakan untuk berinteraksi antara objek tersegmen untuk mendapatkan ciri baharu. Akhir sekali, selepas ciri-ciri ini dibenamkan ke dalam kategori, keputusan ramalan dikeluarkan melalui mekanisme perhatian kendiri.

Semasa proses latihan, khususnya, penulis mencadangkan kaedah pemadanan GT baharu dan berdasarkan kaedah ini, mengira hubungan pasangan antara ramalan dan GT dan dikelaskan hubungan sesama mereka. Dalam proses pembelajaran klasifikasi hubungan yang diselia, penulis menganggapnya sebagai masalah klasifikasi pelbagai label dan menggunakan strategi latihan kendiri untuk mempelajari hubungan sempadan label.

Akhir sekali, saya harap model RAM dapat membawa lebih banyak inspirasi dan inovasi kepada anda. Jika anda juga ingin melatih model pembelajaran mesin yang boleh mencari perhubungan, anda boleh mengikuti kerja pasukan ini dan memberi maklum balas serta cadangan pada bila-bila masa.

NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!

Alamat projek: https://github.com/Jingkang50/OpenPSG

Atas ialah kandungan terperinci NTU mencadangkan model RAM baharu, menggunakan Meta untuk membahagikan segala-galanya untuk mendapatkan perhubungan, dan kesan serangan menyelinap menyanyi dan menari adalah sangat baik!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Geospatial Laravel: Pengoptimuman peta interaktif dan sejumlah besar data Geospatial Laravel: Pengoptimuman peta interaktif dan sejumlah besar data Apr 08, 2025 pm 12:24 PM

Cecair memproses 7 juta rekod dan membuat peta interaktif dengan teknologi geospatial. Artikel ini meneroka cara memproses lebih dari 7 juta rekod menggunakan Laravel dan MySQL dan mengubahnya menjadi visualisasi peta interaktif. Keperluan Projek Cabaran Awal: Ekstrak Wawasan berharga menggunakan 7 juta rekod dalam pangkalan data MySQL. Ramai orang mula -mula mempertimbangkan bahasa pengaturcaraan, tetapi mengabaikan pangkalan data itu sendiri: Bolehkah ia memenuhi keperluan? Adakah penghijrahan data atau pelarasan struktur diperlukan? Bolehkah MySQL menahan beban data yang besar? Analisis awal: Penapis utama dan sifat perlu dikenalpasti. Selepas analisis, didapati bahawa hanya beberapa atribut yang berkaitan dengan penyelesaiannya. Kami mengesahkan kemungkinan penapis dan menetapkan beberapa sekatan untuk mengoptimumkan carian. Carian Peta Berdasarkan Bandar

Cara menetapkan masa tamat vue axios Cara menetapkan masa tamat vue axios Apr 07, 2025 pm 10:03 PM

Untuk menetapkan masa untuk Vue Axios, kita boleh membuat contoh Axios dan menentukan pilihan masa tamat: dalam tetapan global: vue.prototype. $ Axios = axios.create ({timeout: 5000}); Dalam satu permintaan: ini. $ axios.get ('/api/pengguna', {timeout: 10000}).

Cara menyelesaikan MySQL tidak dapat dimulakan Cara menyelesaikan MySQL tidak dapat dimulakan Apr 08, 2025 pm 02:21 PM

Terdapat banyak sebab mengapa permulaan MySQL gagal, dan ia boleh didiagnosis dengan memeriksa log ralat. Penyebab umum termasuk konflik pelabuhan (periksa penghunian pelabuhan dan ubah suai konfigurasi), isu kebenaran (periksa keizinan pengguna yang menjalankan perkhidmatan), ralat fail konfigurasi (periksa tetapan parameter), rasuah direktori data (memulihkan data atau membina semula ruang meja), isu ruang jadual InnoDB (semak fail ibdata1) Apabila menyelesaikan masalah, anda harus menganalisisnya berdasarkan log ralat, cari punca utama masalah, dan mengembangkan tabiat sandaran data secara teratur untuk mencegah dan menyelesaikan masalah.

Cara Menggunakan MySQL Selepas Pemasangan Cara Menggunakan MySQL Selepas Pemasangan Apr 08, 2025 am 11:48 AM

Artikel ini memperkenalkan operasi pangkalan data MySQL. Pertama, anda perlu memasang klien MySQL, seperti MySqlworkbench atau Command Line Client. 1. Gunakan perintah MySQL-Uroot-P untuk menyambung ke pelayan dan log masuk dengan kata laluan akaun root; 2. Gunakan CreateTatabase untuk membuat pangkalan data, dan gunakan Pilih pangkalan data; 3. Gunakan createtable untuk membuat jadual, menentukan medan dan jenis data; 4. Gunakan InsertInto untuk memasukkan data, data pertanyaan, kemas kini data dengan kemas kini, dan padam data dengan padam. Hanya dengan menguasai langkah -langkah ini, belajar menangani masalah biasa dan mengoptimumkan prestasi pangkalan data anda boleh menggunakan MySQL dengan cekap.

Jurutera Backend Senior Remote (Platform) memerlukan kalangan Jurutera Backend Senior Remote (Platform) memerlukan kalangan Apr 08, 2025 pm 12:27 PM

Jurutera Backend Senior Remote Company Kekosongan Syarikat: Lokasi Lokasi: Jauh Pejabat Jauh Jenis: Gaji sepenuh masa: $ 130,000- $ 140,000 Penerangan Pekerjaan Mengambil bahagian dalam penyelidikan dan pembangunan aplikasi mudah alih Circle dan ciri-ciri berkaitan API awam yang meliputi keseluruhan kitaran hayat pembangunan perisian. Tanggungjawab utama kerja pembangunan secara bebas berdasarkan rubyonrails dan bekerjasama dengan pasukan react/redux/relay front-end. Membina fungsi teras dan penambahbaikan untuk aplikasi web dan bekerjasama rapat dengan pereka dan kepimpinan sepanjang proses reka bentuk berfungsi. Menggalakkan proses pembangunan positif dan mengutamakan kelajuan lelaran. Memerlukan lebih daripada 6 tahun backend aplikasi web kompleks

Bolehkah mysql kembali json Bolehkah mysql kembali json Apr 08, 2025 pm 03:09 PM

MySQL boleh mengembalikan data JSON. Fungsi JSON_EXTRACT mengekstrak nilai medan. Untuk pertanyaan yang kompleks, pertimbangkan untuk menggunakan klausa WHERE untuk menapis data JSON, tetapi perhatikan kesan prestasinya. Sokongan MySQL untuk JSON sentiasa meningkat, dan disyorkan untuk memberi perhatian kepada versi dan ciri terkini.

Memahami sifat asid: tiang pangkalan data yang boleh dipercayai Memahami sifat asid: tiang pangkalan data yang boleh dipercayai Apr 08, 2025 pm 06:33 PM

Penjelasan terperinci mengenai atribut asid asid pangkalan data adalah satu set peraturan untuk memastikan kebolehpercayaan dan konsistensi urus niaga pangkalan data. Mereka menentukan bagaimana sistem pangkalan data mengendalikan urus niaga, dan memastikan integriti dan ketepatan data walaupun dalam hal kemalangan sistem, gangguan kuasa, atau pelbagai pengguna akses serentak. Gambaran keseluruhan atribut asid Atomicity: Transaksi dianggap sebagai unit yang tidak dapat dipisahkan. Mana -mana bahagian gagal, keseluruhan transaksi dilancarkan kembali, dan pangkalan data tidak mengekalkan sebarang perubahan. Sebagai contoh, jika pemindahan bank ditolak dari satu akaun tetapi tidak meningkat kepada yang lain, keseluruhan operasi dibatalkan. Begintransaction; UpdateAcCountSsetBalance = Balance-100Wh

Kunci utama MySQL boleh menjadi batal Kunci utama MySQL boleh menjadi batal Apr 08, 2025 pm 03:03 PM

Kunci utama MySQL tidak boleh kosong kerana kunci utama adalah atribut utama yang secara unik mengenal pasti setiap baris dalam pangkalan data. Jika kunci utama boleh kosong, rekod tidak dapat dikenal pasti secara unik, yang akan membawa kepada kekeliruan data. Apabila menggunakan lajur integer sendiri atau UUIDs sebagai kunci utama, anda harus mempertimbangkan faktor-faktor seperti kecekapan dan penghunian ruang dan memilih penyelesaian yang sesuai.

See all articles