


Penerangan video tentang mata pengetahuan algoritma yang mesti dikuasai oleh pengaturcara
Dengan populariti ChatGPT, orang ramai menjadi sangat berminat dalam pembangunan bidang kecerdasan buatan. Ramai pakar percaya bahawa era kecerdasan buatan akan datang dengan perkembangan pesat teknologi perisian dan perkakasan. Kemudian, sebagai perintis dalam bidang teknologi maklumat, pembelajaran teknologi kecerdasan buatan telah menjadi topik yang tidak dapat dielakkan untuk pengaturcara.
Secara umumnya, kecerdasan buatan boleh dibahagikan kepada tiga arah penyelidikan: kecerdasan pengiraan, kecerdasan persepsi dan kecerdasan kognitif.
Kecerdasan pengiraan ialah operasi rutin komputer yang biasa digunakan oleh orang ramai, seperti operasi berangka, penguraian matriks, pengiraan kalkulus, dsb.
Kecerdasan persepsi merujuk kepada memetakan isyarat dari dunia fizikal ke dunia digital melalui kamera, mikrofon atau peranti perkakasan sensor lain, dengan bantuan teknologi canggih seperti pengecaman suara dan pengecaman imej, dan kemudian menambah baik lagi. maklumat digital ini ke tahap yang boleh menjadi Tahap kognisi, seperti ingatan, pemahaman, perancangan, membuat keputusan, dsb.
Kecerdasan kognitif lebih serupa dengan pemahaman pemikiran manusia, perkongsian pengetahuan, kerjasama tindakan atau permainan, dsb., iaitu berfikir dan membuat keputusan berdasarkan maklumat yang diperoleh. Peringkat ini memerlukan penggunaan kecerdasan pengiraan, kecerdasan persepsi, pembersihan data, pengecaman imej dan keupayaan lain. Di samping itu, anda juga perlu mempunyai pemahaman tentang keperluan perniagaan dan keupayaan untuk menyelaras dan mengurus data dan pengetahuan yang tersebar, supaya dapat membina strategi dan membuat keputusan berdasarkan senario perniagaan.
Pada masa ini, sejumlah besar kerja kecerdasan buatan tertumpu pada peringkat kecerdasan persepsi Untuk kecerdasan kognitif, kemajuan agak perlahan.
Dalam bidang kecerdasan kognitif, teknologi yang paling hampir dengan kehidupan manusia ialah teknologi penerangan video. Melalui klasifikasi video, pengesanan objek dan teknologi lain dalam teknologi kecerdasan persepsi, kami boleh mengenal pasti objek yang muncul dalam video. Tetapi ini tidak membenarkan orang ramai memahami apa yang diterangkan oleh video itu. Ia hanya boleh menggambarkan lelaki berwajah merah, pisau dan kuda merah secara mekanikal.
Penerangan video perlu mengenal pasti objek dalam video dan memahami hubungan antara objek Pada masa yang sama, ia juga perlu memahami perbezaan dalam adegan, pergerakan objek dan tingkah laku, dan menggabungkan pengetahuan tersimpan yang sepadan. untuk membuat huraian yang menepati pelaksanaan . Ini semua membawa cabaran teknikal yang hebat. Ia adalah teknologi komprehensif yang menyepadukan penglihatan komputer dan pemprosesan bahasa semula jadi, sama seperti menterjemah video ke dalam ayat. Ia bukan sahaja perlu untuk memahami kandungan video dengan betul, tetapi juga menggunakan bahasa semula jadi untuk menyatakan hubungan antara objek dalam video.
Algoritma perihalan kandungan video semasa terutamanya dibahagikan kepada kaedah berasaskan templat bahasa, kaedah berasaskan perolehan dan kaedah penyahkod pengekod asas. Mari perkenalkan mereka secara berasingan di bawah.
1. Kaedah berasaskan templat bahasa
Kaedah berasaskan templat bahasa mula-mula mengesan sasaran, atribut, tindakan dan hubungan antara sasaran dalam video melalui kaedah seperti pengelasan video atau pengesanan sasaran objek yang dikesan diisi dalam templat bahasa yang telah ditetapkan mengikut peraturan tertentu untuk membentuk ayat huraian yang lengkap.
Kaedah berdasarkan templat bahasa adalah mudah dan intuitif, tetapi disebabkan oleh pengehadan templat tetap, ayat yang dijana mempunyai struktur tatabahasa tunggal dan tidak mempunyai fleksibiliti dalam bentuk ungkapan. Pada masa yang sama, kaedah ini mesti menjalankan kerja anotasi terperinci pada peringkat awal dan merumuskan label kategori bersatu untuk setiap objek, tindakan, atribut, dsb. yang terkandung dalam video. Selain itu, kaedah ini akan memberikan hasil yang sangat berbeza untuk video di luar julat templat.
2. Kaedah berasaskan pengambilan semula
Kaedah berasaskan perolehan terlebih dahulu perlu mewujudkan pangkalan data, dan setiap video dalam pangkalan data Terdapat label perihalan pernyataan yang sepadan. Masukkan video untuk diterangkan, dan kemudian cari video yang paling serupa dalam pangkalan data Selepas meringkaskan dan menetapkan semula, ayat huraian yang sepadan dengan video yang serupa dipindahkan ke video yang akan diterangkan.
Secara amnya, ayat huraian yang dihasilkan oleh kaedah cari semula adalah lebih dekat dengan bentuk ungkapan bahasa semula jadi manusia, dan struktur ayatnya lebih fleksibel. Walau bagaimanapun, kaedah ini sangat bergantung pada saiz pangkalan data Apabila terdapat kekurangan video yang serupa dengan video yang akan diterangkan dalam pangkalan data, ayat huraian yang dihasilkan akan mempunyai ralat yang besar dengan kandungan video. Kedua-dua kaedah di atas sangat bergantung pada pemprosesan visual yang kompleks pada peringkat awal, dan terdapat masalah pengoptimuman model bahasa yang tidak mencukupi untuk ayat yang dijana kemudian. Untuk masalah penerangan video, kedua-dua jenis kaedah sukar untuk menghasilkan ayat berkualiti tinggi dengan penerangan yang tepat dan ungkapan yang pelbagai.
3. Kaedah berasaskan penyahkod pengekod
Kaedah berasaskan codec kini merupakan kaedah arus perdana dalam bidang penerangan video. Ini terutamanya mendapat manfaat daripada kemajuan terobosan yang dibuat dalam bidang terjemahan mesin dengan mengekod dan menyahkod model berdasarkan rangkaian saraf dalam.
Idea asas terjemahan mesin ialah: mewakili ayat sumber input dan ayat sasaran dalam ruang vektor yang sama, mula-mula gunakan pengekod untuk mengekod ayat sumber menjadi vektor perantaraan, dan kemudian gunakan penyahkod untuk menyahkod vektor perantaraan ialah pernyataan sasaran.
Masalah penerangan video pada asasnya boleh dianggap sebagai masalah "terjemahan", iaitu, menterjemah video ke dalam bahasa semula jadi. Kaedah ini tidak memerlukan pemprosesan video yang rumit pada peringkat awal Ia boleh mempelajari secara langsung hubungan pemetaan antara video dan bahasa penerangan daripada sejumlah besar data latihan, mencapai latihan hujung ke hujung, dan menghasilkan video dengan lebih tepat. kandungan, tatabahasa yang fleksibel dan bentuk yang pelbagai.
Atas ialah kandungan terperinci Penerangan video tentang mata pengetahuan algoritma yang mesti dikuasai oleh pengaturcara. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Dengan peningkatan platform video pendek, Douyin telah menjadi bahagian yang sangat diperlukan dalam kehidupan seharian setiap orang. Di TikTok, kita boleh melihat video menarik dari seluruh dunia. Sesetengah orang suka menyiarkan video orang lain, yang menimbulkan persoalan: Adakah Douyin melanggar apabila menyiarkan video orang lain? Artikel ini akan membincangkan isu ini dan memberitahu anda cara mengedit video tanpa pelanggaran dan cara mengelakkan isu pelanggaran. 1. Adakah ia melanggar penyiaran video orang lain oleh Douyin? Menurut peruntukan Undang-undang Hak Cipta negara saya, penggunaan tanpa kebenaran karya pemilik hak cipta tanpa kebenaran pemilik hak cipta adalah satu pelanggaran. Oleh itu, menyiarkan video orang lain di Douyin tanpa kebenaran pengarang asal atau pemilik hak cipta adalah satu pelanggaran. 2. Bagaimana untuk mengedit video tanpa pelanggaran? 1. Penggunaan domain awam atau kandungan berlesen: Awam

Douyin, platform video pendek kebangsaan, bukan sahaja membolehkan kami menikmati pelbagai video pendek yang menarik dan novel pada masa lapang kami, tetapi juga memberi kami pentas untuk menunjukkan diri kami dan merealisasikan nilai kami. Jadi, bagaimana untuk membuat wang dengan menyiarkan video di Douyin? Artikel ini akan menjawab soalan ini secara terperinci dan membantu anda menjana lebih banyak wang di TikTok. 1. Bagaimana untuk membuat wang daripada menyiarkan video di Douyin? Selepas menyiarkan video dan mendapat jumlah tontonan tertentu pada Douyin, anda akan berpeluang untuk mengambil bahagian dalam pelan perkongsian pengiklanan. Kaedah pendapatan ini adalah salah satu yang paling biasa kepada pengguna Douyin dan juga merupakan sumber pendapatan utama bagi banyak pencipta. Douyin memutuskan sama ada untuk menyediakan peluang perkongsian pengiklanan berdasarkan pelbagai faktor seperti berat akaun, kandungan video dan maklum balas khalayak. Platform TikTok membolehkan penonton menyokong pencipta kegemaran mereka dengan menghantar hadiah,

Ditulis di atas & pemahaman peribadi penulis: Pada masa ini, dalam keseluruhan sistem pemanduan autonomi, modul persepsi memainkan peranan penting Hanya selepas kenderaan pemanduan autonomi yang memandu di jalan raya memperoleh keputusan persepsi yang tepat melalui modul persepsi boleh Peraturan hiliran dan. modul kawalan dalam sistem pemanduan autonomi membuat pertimbangan dan keputusan tingkah laku yang tepat pada masanya dan betul. Pada masa ini, kereta dengan fungsi pemanduan autonomi biasanya dilengkapi dengan pelbagai penderia maklumat data termasuk penderia kamera pandangan sekeliling, penderia lidar dan penderia radar gelombang milimeter untuk mengumpul maklumat dalam modaliti yang berbeza untuk mencapai tugas persepsi yang tepat. Algoritma persepsi BEV berdasarkan penglihatan tulen digemari oleh industri kerana kos perkakasannya yang rendah dan penggunaan mudah, dan hasil keluarannya boleh digunakan dengan mudah untuk pelbagai tugas hiliran.

Dengan kemunculan platform video pendek, Xiaohongshu telah menjadi platform untuk ramai orang berkongsi kehidupan mereka, meluahkan perasaan mereka dan mendapatkan trafik. Pada platform ini, menerbitkan karya video ialah cara interaksi yang sangat popular. Jadi, bagaimana untuk menerbitkan karya video Xiaohongshu? 1. Bagaimana untuk menerbitkan karya video Xiaohongshu? Mula-mula, pastikan anda mempunyai kandungan video yang sedia untuk dikongsi. Anda boleh menggunakan telefon bimbit anda atau peralatan kamera lain untuk merakam, tetapi anda perlu memberi perhatian kepada kualiti imej dan kejelasan bunyi. 2. Edit video: Untuk menjadikan kerja lebih menarik, anda boleh mengedit video. Anda boleh menggunakan perisian penyuntingan video profesional, seperti Douyin, Kuaishou, dsb., untuk menambah penapis, muzik, sari kata dan elemen lain. 3. Pilih kulit muka: Kulit adalah kunci untuk menarik pengguna untuk mengklik.

1. Mula-mula buka Weibo pada telefon mudah alih anda dan klik [Saya] di sudut kanan bawah (seperti yang ditunjukkan dalam gambar). 2. Kemudian klik [Gear] di penjuru kanan sebelah atas untuk membuka tetapan (seperti yang ditunjukkan dalam gambar). 3. Kemudian cari dan buka [Tetapan Umum] (seperti yang ditunjukkan dalam gambar). 4. Kemudian masukkan pilihan [Video Follow] (seperti yang ditunjukkan dalam gambar). 5. Kemudian buka tetapan [Video Upload Resolution] (seperti yang ditunjukkan dalam gambar). 6. Akhir sekali, pilih [Kualiti Imej Asal] untuk mengelakkan pemampatan (seperti yang ditunjukkan dalam gambar).

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

Pada 3 Mac 2022, kurang daripada sebulan selepas kelahiran pengaturcara AI pertama di dunia, Devin, pasukan NLP Universiti Princeton membangunkan pengaturcara AI sumber terbuka ejen SWE. Ia memanfaatkan model GPT-4 untuk menyelesaikan isu secara automatik dalam repositori GitHub. Prestasi ejen SWE pada set ujian bangku SWE adalah serupa dengan Devin, mengambil purata 93 saat dan menyelesaikan 12.29% masalah. Dengan berinteraksi dengan terminal khusus, ejen SWE boleh membuka dan mencari kandungan fail, menggunakan semakan sintaks automatik, mengedit baris tertentu dan menulis serta melaksanakan ujian. (Nota: Kandungan di atas adalah sedikit pelarasan bagi kandungan asal, tetapi maklumat utama dalam teks asal dikekalkan dan tidak melebihi had perkataan yang ditentukan.) SWE-A

Lapisan bawah fungsi C++ sort menggunakan isihan gabungan, kerumitannya ialah O(nlogn), dan menyediakan pilihan algoritma pengisihan yang berbeza, termasuk isihan pantas, isihan timbunan dan isihan stabil.
