Jadual Kandungan
Graph Neural Network (GNN) ialah sejenis model pembelajaran mendalam yang direka khusus untuk memproses data berstruktur graf. Model ini mengeksploitasi topologi graf untuk mempelajari perwakilan yang bermakna bagi nod dan tepi graf. Rangkaian saraf graf ialah lanjutan daripada rangkaian saraf konvolusi tradisional dan telah terbukti berkesan dalam tugas seperti pengelasan graf, pengelasan nod dan ramalan pautan. Salah satu kelebihan utama GNN ialah ia mengekalkan prestasi yang baik walaupun saiz graf asas berkembang, kerana bilangan parameter yang boleh dipelajari adalah bebas daripada bilangan nod dalam graf. Rangkaian saraf graf (GNN) telah digunakan secara meluas dalam pelbagai bidang seperti sistem pengesyoran, penemuan ubat dan biologi, dan peruntukan sumber dalam sistem autonomi. Walau bagaimanapun, model ini terhad kepada data graf statik, di mana struktur graf ditetapkan. Dalam tahun-tahun kebelakangan ini, data graf yang berubah-ubah masa telah menarik perhatian yang semakin meningkat, muncul dalam pelbagai sistem dan membawa maklumat temporal yang berharga. Aplikasi data graf yang berubah-ubah masa termasuk data siri masa berbilang variasi, rangkaian sosial, sistem audio-visual, dsb.
Dari perspektif algoritma, rangkaian saraf graf spatiotemporal boleh dibahagikan kepada dua kategori: berasaskan spektrum dan berasaskan ruang. Kategori pengelasan lain ialah kaedah yang memperkenalkan variasi masa: algoritma pembelajaran mesin lain atau menentukan masa dalam struktur graf.
Rangkaian neural graf spatiotemporal hibrid terdiri daripada dua komponen utama: komponen spatial dan komponen temporal. Dalam rangkaian neural graf spatiotemporal hibrid, algoritma rangkaian neural graf digunakan untuk memodelkan kebergantungan spatial dalam data.
Cara lain untuk memodelkan masa dalam rangkaian neural graf spatio-temporal adalah dengan mentakrifkan rangka masa dalam GNN itu sendiri . Pelbagai kaedah telah dicadangkan, termasuk: mentakrifkan masa sebagai tepi, memasukkan masa sebagai isyarat ke dalam GNN, memodelkan masa sebagai subgraf, dan mengapit seni bina pembelajaran mesin lain ke dalam GNN (Rajah 2).
3.1 Ramalan siri masa berbilang pembolehubah
diproses oleh rangkaian saraf graf Diilhamkan. dengan keupayaan pergantungan hubungan [10], rangkaian neural graf spatiotemporal digunakan secara meluas dalam ramalan siri masa multivariate. Aplikasi termasuk ramalan trafik, ramalan Covid, penggunaan kuasa fotovoltaik, komunikasi RSU dan aplikasi seismik.
3.2 Interaksi watak
3.3 Perwakilan graf dinamik
3.4 Tafsiran Bahasa Isyarat
3.5 Kedudukan Pertumbuhan Teknologi
4. Kesimpulan
Rumah Peranti teknologi AI Bagaimanakah maklumat spatiotemporal model GNN? Kajian semula 'Rangkaian Neural Graf Spatial-temporal' di Queen Mary University of London, penjelasan ringkas tentang kaedah rangkaian saraf graf spatio-temporal

Bagaimanakah maklumat spatiotemporal model GNN? Kajian semula 'Rangkaian Neural Graf Spatial-temporal' di Queen Mary University of London, penjelasan ringkas tentang kaedah rangkaian saraf graf spatio-temporal

Apr 13, 2023 am 11:43 AM
rangkaian saraf pembelajaran yang mendalam gnn

​Algoritma berkuasa ini telah mendapat minat yang besar sejak beberapa tahun lalu. Walau bagaimanapun, prestasi ini adalah berdasarkan andaian struktur graf statik, yang mengehadkan prestasi rangkaian saraf graf apabila data berubah dari semasa ke semasa. Rangkaian saraf graf berjujukan ialah lanjutan rangkaian saraf graf yang mengambil kira faktor masa.

Dalam beberapa tahun kebelakangan ini, pelbagai algoritma rangkaian saraf graf berjujukan telah dicadangkan dan telah mencapai prestasi yang lebih baik daripada algoritma pembelajaran mendalam yang lain dalam pelbagai aplikasi berkaitan masa. Kajian ini membincangkan topik menarik yang berkaitan dengan rangkaian neural graf spatiotemporal, termasuk algoritma, aplikasi dan cabaran terbuka.

Bagaimanakah maklumat spatiotemporal model GNN? Kajian semula Rangkaian Neural Graf Spatial-temporal di Queen Mary University of London, penjelasan ringkas tentang kaedah rangkaian saraf graf spatio-temporal

Alamat kertas: https://www.php.cn/link/1915523773b16865a73a38acc952ccda

Graph Neural Network (GNN) ialah sejenis model pembelajaran mendalam yang direka khusus untuk memproses data berstruktur graf. Model ini mengeksploitasi topologi graf untuk mempelajari perwakilan yang bermakna bagi nod dan tepi graf. Rangkaian saraf graf ialah lanjutan daripada rangkaian saraf konvolusi tradisional dan telah terbukti berkesan dalam tugas seperti pengelasan graf, pengelasan nod dan ramalan pautan. Salah satu kelebihan utama GNN ialah ia mengekalkan prestasi yang baik walaupun saiz graf asas berkembang, kerana bilangan parameter yang boleh dipelajari adalah bebas daripada bilangan nod dalam graf. Rangkaian saraf graf (GNN) telah digunakan secara meluas dalam pelbagai bidang seperti sistem pengesyoran, penemuan ubat dan biologi, dan peruntukan sumber dalam sistem autonomi. Walau bagaimanapun, model ini terhad kepada data graf statik, di mana struktur graf ditetapkan. Dalam tahun-tahun kebelakangan ini, data graf yang berubah-ubah masa telah menarik perhatian yang semakin meningkat, muncul dalam pelbagai sistem dan membawa maklumat temporal yang berharga. Aplikasi data graf yang berubah-ubah masa termasuk data siri masa berbilang variasi, rangkaian sosial, sistem audio-visual, dsb.

Untuk memenuhi permintaan ini, keluarga GNN baharu telah muncul: GNN spatiotemporal, yang mengambil kira kedua-dua dimensi spatial dan temporal data dengan mempelajari perwakilan temporal struktur graf. Makalah ini menyediakan ulasan komprehensif mengenai rangkaian neural graf spatiotemporal yang terkini. Artikel ini bermula dengan gambaran ringkas tentang pelbagai jenis rangkaian saraf graf spatiotemporal dan andaian asasnya. Algoritma khusus yang digunakan dalam GNN spatiotemporal dikaji dengan lebih terperinci, sambil turut menyediakan taksonomi yang berguna untuk mengumpulkan model ini. Kertas kerja ini juga menyediakan gambaran keseluruhan tentang pelbagai aplikasi GNN spatiotemporal, yang menonjolkan bidang utama di mana model ini telah digunakan untuk mencapai hasil yang terkini. Akhir sekali, cabaran yang dihadapi di lapangan dan hala tuju penyelidikan masa depan dibincangkan. Kesimpulannya, semakan ini bertujuan untuk menyediakan kajian menyeluruh dan mendalam mengenai rangkaian saraf graf spatiotemporal, menonjolkan keadaan semasa bidang, cabaran utama yang masih perlu ditangani, dan kemungkinan masa depan yang menarik bagi model ini.

2. Algoritma

Dari perspektif algoritma, rangkaian saraf graf spatiotemporal boleh dibahagikan kepada dua kategori: berasaskan spektrum dan berasaskan ruang. Kategori pengelasan lain ialah kaedah yang memperkenalkan variasi masa: algoritma pembelajaran mesin lain atau menentukan masa dalam struktur graf.

2.1 Rangkaian neural graf spatiotemporal hibrid

Rangkaian neural graf spatiotemporal hibrid terdiri daripada dua komponen utama: komponen spatial dan komponen temporal. Dalam rangkaian neural graf spatiotemporal hibrid, algoritma rangkaian neural graf digunakan untuk memodelkan kebergantungan spatial dalam data.

Bagaimanakah maklumat spatiotemporal model GNN? Kajian semula Rangkaian Neural Graf Spatial-temporal di Queen Mary University of London, penjelasan ringkas tentang kaedah rangkaian saraf graf spatio-temporal2.2 Rangkaian Neural Graf Solo

Cara lain untuk memodelkan masa dalam rangkaian neural graf spatio-temporal adalah dengan mentakrifkan rangka masa dalam GNN itu sendiri . Pelbagai kaedah telah dicadangkan, termasuk: mentakrifkan masa sebagai tepi, memasukkan masa sebagai isyarat ke dalam GNN, memodelkan masa sebagai subgraf, dan mengapit seni bina pembelajaran mesin lain ke dalam GNN (Rajah 2).

Bagaimanakah maklumat spatiotemporal model GNN? Kajian semula Rangkaian Neural Graf Spatial-temporal di Queen Mary University of London, penjelasan ringkas tentang kaedah rangkaian saraf graf spatio-temporal

Bagaimanakah maklumat spatiotemporal model GNN? Kajian semula Rangkaian Neural Graf Spatial-temporal di Queen Mary University of London, penjelasan ringkas tentang kaedah rangkaian saraf graf spatio-temporal3 Aplikasi

3.1 Ramalan siri masa berbilang pembolehubah

diproses oleh rangkaian saraf graf Diilhamkan. dengan keupayaan pergantungan hubungan [10], rangkaian neural graf spatiotemporal digunakan secara meluas dalam ramalan siri masa multivariate. Aplikasi termasuk ramalan trafik, ramalan Covid, penggunaan kuasa fotovoltaik, komunikasi RSU dan aplikasi seismik.

3.2 Interaksi watak

Dalam pembelajaran mesin dan penglihatan komputer, pembelajaran domain spatiotemporal masih merupakan masalah yang sangat mencabar. Cabaran utama ialah bagaimana untuk memodelkan interaksi antara objek dan konsep peringkat lebih tinggi dalam konteks spatiotemporal yang besar [18]. Dalam tugasan pembelajaran yang begitu sukar, adalah penting untuk memodelkan hubungan ruang, penampilan setempat dan interaksi dan perubahan yang kompleks dengan berkesan dari semasa ke semasa. [18] memperkenalkan model rangkaian neural graf spatiotemporal yang bergelung dalam ruang dan masa, sesuai untuk menangkap penampilan tempatan dan interaksi peringkat tinggi yang kompleks bagi entiti dan objek yang berbeza dalam mengubah pemandangan dunia [18].

3.3 Perwakilan graf dinamik

Pembelajaran perwakilan graf berurutan sentiasa dianggap sebagai aspek yang sangat penting dalam pembelajaran mesin graf [15,31]. Bertujuan pada had bahawa kaedah sedia ada bergantung pada gambar rajah jujukan diskret dan tidak dapat menangkap perwakilan yang berkuasa, [3] mencadangkan kaedah pembelajaran perwakilan graf dinamik berdasarkan rangkaian saraf graf spatiotemporal. Tambahan pula, [15] kini menggunakan GNN spatiotemporal untuk mewakili peta otak secara dinamik. Penjejakan berbilang sasaran Penjejakan berbilang sasaran dalam video sangat bergantung pada pemodelan interaksi spatio-temporal antara sasaran [16]. [16] mencadangkan algoritma rangkaian saraf graf spatiotemporal untuk memodelkan interaksi spatial dan temporal antara objek.

3.4 Tafsiran Bahasa Isyarat

Bahasa isyarat menggunakan kaedah visual-manual untuk menyampaikan maksud dan merupakan alat komunikasi utama bagi kumpulan pekak dan kurang pendengaran. Untuk merapatkan jurang komunikasi antara pengguna bahasa pertuturan dan pengguna bahasa isyarat, teknologi pembelajaran mesin diperkenalkan. Secara tradisinya, terjemahan mesin saraf telah diterima pakai secara meluas, tetapi kaedah yang lebih maju diperlukan untuk menangkap sifat spatial bahasa isyarat. [13] mencadangkan sistem terjemahan bahasa isyarat berdasarkan rangkaian neural graf spatiotemporal, yang mempunyai keupayaan yang kuat untuk menangkap struktur spatiotemporal bahasa isyarat dan mencapai prestasi terbaik berbanding kaedah terjemahan mesin saraf tradisional [13].

3.5 Kedudukan Pertumbuhan Teknologi

Memahami kadar pertumbuhan teknologi ialah kunci teras kepada strategi perniagaan jabatan teknologi. Selain itu, meramalkan kadar pertumbuhan teknologi dan hubungannya antara satu sama lain boleh membantu keputusan perniagaan dalam definisi produk, strategi pemasaran dan R&D. [32] mencadangkan kaedah ramalan untuk kedudukan pertumbuhan teknologi rangkaian sosial berdasarkan rangkaian neural graf spatiotemporal.

4. Kesimpulan

Rangkaian saraf graf telah mendapat minat yang besar dalam beberapa tahun kebelakangan ini. Algoritma berkuasa ini memanjangkan model pembelajaran mendalam kepada ruang bukan Euclidean. Walau bagaimanapun, rangkaian saraf graf terhad kepada andaian struktur graf statik, yang mengehadkan prestasi rangkaian saraf graf apabila data berubah dari semasa ke semasa. Rangkaian saraf graf berjujukan ialah lanjutan rangkaian saraf graf yang mengambil kira faktor masa. Artikel ini menyediakan gambaran keseluruhan komprehensif rangkaian neural graf spatiotemporal. Makalah ini mencadangkan taksonomi yang membahagikan rangkaian saraf graf spatiotemporal kepada dua kategori berdasarkan kaedah pembolehubah masa. Pelbagai aplikasi rangkaian neural graf spatiotemporal juga dibincangkan. Akhirnya, hala tuju penyelidikan masa depan dicadangkan berdasarkan cabaran terbuka yang sedang dihadapi oleh rangkaian saraf graf spatiotemporal.

Rujukan:​​https://www.php.cn/link/1915523773b16865a73a38acc952ccda​

Atas ialah kandungan terperinci Bagaimanakah maklumat spatiotemporal model GNN? Kajian semula 'Rangkaian Neural Graf Spatial-temporal' di Queen Mary University of London, penjelasan ringkas tentang kaedah rangkaian saraf graf spatio-temporal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Repo: Cara menghidupkan semula rakan sepasukan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Cara mendapatkan biji gergasi
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Kaedah dan langkah untuk menggunakan BERT untuk analisis sentimen dalam Python Kaedah dan langkah untuk menggunakan BERT untuk analisis sentimen dalam Python Jan 22, 2024 pm 04:24 PM

BERT ialah model bahasa pembelajaran mendalam pra-latihan yang dicadangkan oleh Google pada 2018. Nama penuh ialah BidirectionalEncoderRepresentationsfromTransformers, yang berdasarkan seni bina Transformer dan mempunyai ciri pengekodan dwiarah. Berbanding dengan model pengekodan sehala tradisional, BERT boleh mempertimbangkan maklumat kontekstual pada masa yang sama semasa memproses teks, jadi ia berfungsi dengan baik dalam tugas pemprosesan bahasa semula jadi. Dwiarahnya membolehkan BERT memahami dengan lebih baik hubungan semantik dalam ayat, dengan itu meningkatkan keupayaan ekspresif model. Melalui kaedah pra-latihan dan penalaan halus, BERT boleh digunakan untuk pelbagai tugas pemprosesan bahasa semula jadi, seperti analisis sentimen, penamaan.

YOLO adalah abadi! YOLOv9 dikeluarkan: prestasi dan kelajuan SOTA~ YOLO adalah abadi! YOLOv9 dikeluarkan: prestasi dan kelajuan SOTA~ Feb 26, 2024 am 11:31 AM

Kaedah pembelajaran mendalam hari ini memberi tumpuan kepada mereka bentuk fungsi objektif yang paling sesuai supaya keputusan ramalan model paling hampir dengan situasi sebenar. Pada masa yang sama, seni bina yang sesuai mesti direka bentuk untuk mendapatkan maklumat yang mencukupi untuk ramalan. Kaedah sedia ada mengabaikan fakta bahawa apabila data input mengalami pengekstrakan ciri lapisan demi lapisan dan transformasi spatial, sejumlah besar maklumat akan hilang. Artikel ini akan menyelidiki isu penting apabila menghantar data melalui rangkaian dalam, iaitu kesesakan maklumat dan fungsi boleh balik. Berdasarkan ini, konsep maklumat kecerunan boleh atur cara (PGI) dicadangkan untuk menghadapi pelbagai perubahan yang diperlukan oleh rangkaian dalam untuk mencapai pelbagai objektif. PGI boleh menyediakan maklumat input lengkap untuk tugas sasaran untuk mengira fungsi objektif, dengan itu mendapatkan maklumat kecerunan yang boleh dipercayai untuk mengemas kini berat rangkaian. Di samping itu, rangka kerja rangkaian ringan baharu direka bentuk

Di luar ORB-SLAM3! SL-SLAM: Adegan bertekstur lemah ringan, kegelisahan teruk dan lemah semuanya dikendalikan Di luar ORB-SLAM3! SL-SLAM: Adegan bertekstur lemah ringan, kegelisahan teruk dan lemah semuanya dikendalikan May 30, 2024 am 09:35 AM

Ditulis sebelum ini, hari ini kita membincangkan bagaimana teknologi pembelajaran mendalam boleh meningkatkan prestasi SLAM berasaskan penglihatan (penyetempatan dan pemetaan serentak) dalam persekitaran yang kompleks. Dengan menggabungkan kaedah pengekstrakan ciri dalam dan pemadanan kedalaman, di sini kami memperkenalkan sistem SLAM visual hibrid serba boleh yang direka untuk meningkatkan penyesuaian dalam senario yang mencabar seperti keadaan cahaya malap, pencahayaan dinamik, kawasan bertekstur lemah dan seks yang teruk. Sistem kami menyokong berbilang mod, termasuk konfigurasi monokular, stereo, monokular-inersia dan stereo-inersia lanjutan. Selain itu, ia juga menganalisis cara menggabungkan SLAM visual dengan kaedah pembelajaran mendalam untuk memberi inspirasi kepada penyelidikan lain. Melalui percubaan yang meluas pada set data awam dan data sampel sendiri, kami menunjukkan keunggulan SL-SLAM dari segi ketepatan kedudukan dan keteguhan penjejakan.

Pembenaman ruang terpendam: penjelasan dan demonstrasi Pembenaman ruang terpendam: penjelasan dan demonstrasi Jan 22, 2024 pm 05:30 PM

Pembenaman Ruang Terpendam (LatentSpaceEmbedding) ialah proses memetakan data berdimensi tinggi kepada ruang berdimensi rendah. Dalam bidang pembelajaran mesin dan pembelajaran mendalam, pembenaman ruang terpendam biasanya merupakan model rangkaian saraf yang memetakan data input berdimensi tinggi ke dalam set perwakilan vektor berdimensi rendah ini sering dipanggil "vektor terpendam" atau "terpendam pengekodan". Tujuan pembenaman ruang terpendam adalah untuk menangkap ciri penting dalam data dan mewakilinya ke dalam bentuk yang lebih ringkas dan mudah difahami. Melalui pembenaman ruang terpendam, kami boleh melakukan operasi seperti memvisualisasikan, mengelaskan dan mengelompokkan data dalam ruang dimensi rendah untuk memahami dan menggunakan data dengan lebih baik. Pembenaman ruang terpendam mempunyai aplikasi yang luas dalam banyak bidang, seperti penjanaan imej, pengekstrakan ciri, pengurangan dimensi, dsb. Pembenaman ruang terpendam adalah yang utama

Fahami dalam satu artikel: kaitan dan perbezaan antara AI, pembelajaran mesin dan pembelajaran mendalam Fahami dalam satu artikel: kaitan dan perbezaan antara AI, pembelajaran mesin dan pembelajaran mendalam Mar 02, 2024 am 11:19 AM

Dalam gelombang perubahan teknologi yang pesat hari ini, Kecerdasan Buatan (AI), Pembelajaran Mesin (ML) dan Pembelajaran Dalam (DL) adalah seperti bintang terang, menerajui gelombang baharu teknologi maklumat. Ketiga-tiga perkataan ini sering muncul dalam pelbagai perbincangan dan aplikasi praktikal yang canggih, tetapi bagi kebanyakan peneroka yang baru dalam bidang ini, makna khusus dan hubungan dalaman mereka mungkin masih diselubungi misteri. Jadi mari kita lihat gambar ini dahulu. Dapat dilihat bahawa terdapat korelasi rapat dan hubungan progresif antara pembelajaran mendalam, pembelajaran mesin dan kecerdasan buatan. Pembelajaran mendalam ialah bidang khusus pembelajaran mesin dan pembelajaran mesin

Super kuat! 10 algoritma pembelajaran mendalam teratas! Super kuat! 10 algoritma pembelajaran mendalam teratas! Mar 15, 2024 pm 03:46 PM

Hampir 20 tahun telah berlalu sejak konsep pembelajaran mendalam dicadangkan pada tahun 2006. Pembelajaran mendalam, sebagai revolusi dalam bidang kecerdasan buatan, telah melahirkan banyak algoritma yang berpengaruh. Jadi, pada pendapat anda, apakah 10 algoritma teratas untuk pembelajaran mendalam? Berikut adalah algoritma teratas untuk pembelajaran mendalam pada pendapat saya Mereka semua menduduki kedudukan penting dari segi inovasi, nilai aplikasi dan pengaruh. 1. Latar belakang rangkaian saraf dalam (DNN): Rangkaian saraf dalam (DNN), juga dipanggil perceptron berbilang lapisan, adalah algoritma pembelajaran mendalam yang paling biasa Apabila ia mula-mula dicipta, ia dipersoalkan kerana kesesakan kuasa pengkomputeran tahun, kuasa pengkomputeran, Kejayaan datang dengan letupan data. DNN ialah model rangkaian saraf yang mengandungi berbilang lapisan tersembunyi. Dalam model ini, setiap lapisan menghantar input ke lapisan seterusnya dan

1.3ms mengambil masa 1.3ms! Seni bina rangkaian neural mudah alih sumber terbuka terbaru Tsinghua RepViT 1.3ms mengambil masa 1.3ms! Seni bina rangkaian neural mudah alih sumber terbuka terbaru Tsinghua RepViT Mar 11, 2024 pm 12:07 PM

Alamat kertas: https://arxiv.org/abs/2307.09283 Alamat kod: https://github.com/THU-MIG/RepViTRepViT berprestasi baik dalam seni bina ViT mudah alih dan menunjukkan kelebihan yang ketara. Seterusnya, kami meneroka sumbangan kajian ini. Disebutkan dalam artikel bahawa ViT ringan biasanya berprestasi lebih baik daripada CNN ringan pada tugas visual, terutamanya disebabkan oleh modul perhatian diri berbilang kepala (MSHA) mereka yang membolehkan model mempelajari perwakilan global. Walau bagaimanapun, perbezaan seni bina antara ViT ringan dan CNN ringan belum dikaji sepenuhnya. Dalam kajian ini, penulis menyepadukan ViT ringan ke dalam yang berkesan

Cara menggunakan model hibrid CNN dan Transformer untuk meningkatkan prestasi Cara menggunakan model hibrid CNN dan Transformer untuk meningkatkan prestasi Jan 24, 2024 am 10:33 AM

Rangkaian Neural Konvolusi (CNN) dan Transformer ialah dua model pembelajaran mendalam berbeza yang telah menunjukkan prestasi cemerlang pada tugasan yang berbeza. CNN digunakan terutamanya untuk tugas penglihatan komputer seperti klasifikasi imej, pengesanan sasaran dan pembahagian imej. Ia mengekstrak ciri tempatan pada imej melalui operasi lilitan, dan melakukan pengurangan dimensi ciri dan invarian ruang melalui operasi pengumpulan. Sebaliknya, Transformer digunakan terutamanya untuk tugas pemprosesan bahasa semula jadi (NLP) seperti terjemahan mesin, klasifikasi teks dan pengecaman pertuturan. Ia menggunakan mekanisme perhatian kendiri untuk memodelkan kebergantungan dalam jujukan, mengelakkan pengiraan berjujukan dalam rangkaian saraf berulang tradisional. Walaupun kedua-dua model ini digunakan untuk tugasan yang berbeza, ia mempunyai persamaan dalam pemodelan jujukan, jadi

See all articles