Teknologi penglihatan komputer akan mengalami perubahan besar
Adakah visi komputer mencipta semula dirinya semula?
Ryad Benosman, seorang profesor oftalmologi di Universiti Pittsburgh dan seorang profesor tambahan di Institut Robotik CMU, berpendapat perkara ini memang berlaku. Sebagai salah seorang pengasas teknologi penglihatan berasaskan acara, Benosman menjangkakan penglihatan neuromorfik—penglihatan komputer berdasarkan kamera berasaskan acara—untuk menjadi arah seterusnya dalam penglihatan komputer.
"Penglihatan komputer telah dicipta semula berkali-kali," kata Benosman. "Saya telah melihatnya dicipta semula sekurang-kurangnya dua kali
Benosman memetik peralihan daripada pemprosesan imej dengan sedikit fotogrametri kepada kaedah berasaskan geometri pada tahun 1990-an, dan kemudian kemajuan pesat dalam pembelajaran mesin hari ini. Walaupun terdapat perubahan ini, teknologi penglihatan komputer moden masih berasaskan penderia imej—kamera yang menghasilkan imej yang serupa dengan yang dilihat oleh mata manusia.
Menurut Benosman, paradigma penderiaan imej akan menghalang inovasi dalam teknologi alternatif sehingga ia tidak lagi berguna. Pembangunan pemproses berprestasi tinggi (cth., GPU) melengahkan keperluan untuk mencari penyelesaian alternatif, sekali gus memanjangkan kesan ini.
"Mengapa kita menggunakan imej untuk penglihatan komputer? Itulah soalan berjuta-juta dolar," katanya. "Kami tidak mempunyai sebab untuk menggunakan imej - ia hanya kerana momentum sejarah. Walaupun sebelum ada kamera, imej mempunyai momentum
Kamera Imej
Sejak kemunculan kamera lubang jarum di dalam." abad kelima B.C. Kamera imej telah wujud sejak tahun 1500-an, dengan artis menggunakan peranti bersaiz bilik untuk mengesan imej orang atau pemandangan di luar bilik ke atas kanvas. Selama bertahun-tahun, lukisan itu digantikan dengan filem untuk merakam imej. Inovasi seperti fotografi digital akhirnya memudahkan kamera imej menjadi asas teknologi penglihatan komputer moden.
Walau bagaimanapun, Benosman percaya bahawa teknologi penglihatan komputer berdasarkan kamera imej adalah amat tidak cekap. Analoginya adalah sistem pertahanan istana zaman pertengahan: pengawal yang diletakkan di sekeliling dinding melihat keluar untuk menghampiri musuh. Pemain dram itu memukul dengan mantap, dan dengan setiap pukulan, setiap pengawal menjerit apa yang mereka lihat. Betapa mudahnya untuk mendengar seorang pengawal melihat musuh di pinggir hutan yang jauh di tengah-tengah kekecohan?
Perkakasan abad ke-21 yang setara dengan pukulan dram ialah isyarat jam elektronik, dan pengawalnya ialah piksel. Sebilangan besar data dicipta dan mesti disemak setiap kitaran jam, yang mengakibatkan sejumlah besar maklumat berlebihan dan dengan itu memerlukan banyak pengiraan yang tidak perlu.
"Orang ramai membakar begitu banyak tenaga, ia mengambil keseluruhan kuasa pengkomputeran istana untuk melindungi diri mereka sendiri," kata Benosman. Jika peristiwa menarik ditemui - diwakili oleh musuh dalam analogi ini - "anda perlu bergerak mengumpul maklumat yang tidak berguna, orang ramai menjerit di mana-mana, jadi terdapat banyak lebar jalur... Sekarang bayangkan anda mempunyai istana yang kompleks. Semua orang ini mesti didengari. ”
Masukkan Penglihatan Neuromorfik. Idea asas diilhamkan oleh cara sistem biologi berfungsi, iaitu untuk mengesan perubahan dalam dinamik adegan dan bukannya menganalisis keseluruhan adegan secara berterusan. Dalam analogi istana kami, ini bermakna menjaga pengawal senyap sehingga mereka melihat sesuatu yang menarik, kemudian memanggil lokasi mereka untuk meningkatkan penggera. Dalam bentuk elektronik, ini bermakna membiarkan piksel individu menentukan sama ada mereka melihat sesuatu yang berkaitan.
"Pixel boleh memutuskan sendiri maklumat yang harus mereka hantar," kata Benosman.
"Daripada mendapatkan maklumat sistem, mereka boleh mencari maklumat yang bermakna - ciri. Itulah yang membezakannya." kit dibangunkan dengan kerjasama Sony. Benosman ialah pengasas bersama Prophesee.
Pendekatan berasaskan peristiwa ini boleh menjimatkan kuasa yang ketara dan mengurangkan kependaman berbanding pemerolehan sistem frekuensi tetap.
Diilhamkan Neurosains
Teknologi Neuromorfik ialah teknologi yang diilhamkan oleh sistem biologi, termasuk komputer muktamad: otak dan neuronnya, atau elemen pengiraan. Masalahnya ialah tiada siapa yang memahami sepenuhnya bagaimana neuron berfungsi. Walaupun kita tahu bahawa neuron bertindak balas kepada isyarat elektrik masuk yang dipanggil pancang, sehingga baru-baru ini, penyelidik telah menggambarkan neuron sebagai agak tergesa-gesa, dengan mengandaikan bahawa hanya bilangan pancang yang penting. Hipotesis ini berterusan selama beberapa dekad, tetapi kerja baru-baru ini telah membuktikan bahawa masa pancang ini benar-benar kritikal dan otak distrukturkan untuk membuat kelewatan dalam pancang ini untuk mengekod maklumat.
Rangkaian neural spiking hari ini mensimulasikan pancang yang dilihat dalam otak dan merupakan versi ringkas bagi perkara sebenar—biasanya perwakilan binari bagi pancang. "Saya menerima 1, saya bangun, saya mengira, saya tidur," jelas Benosman. Realitinya jauh lebih kompleks. Apabila spike tiba, neuron mula mengintegrasikan nilai spike dari semasa ke semasa neuron juga bocor, bermakna hasilnya adalah dinamik. Selain itu, terdapat kira-kira 50 jenis neuron yang berbeza dengan 50 profil integrasi yang berbeza.
Versi elektronik semasa tidak mempunyai laluan dinamik bersepadu, ketersambungan antara neuron dan berat serta kelewatan yang berbeza. "Masalahnya ialah untuk membuat produk yang berfungsi, anda tidak boleh [meniru] semua kerumitan kerana kami tidak memahaminya," katanya. "Jika kami mempunyai teori otak yang baik, kami akan menyelesaikannya. Masalahnya, kami tidak tahu
Bensoman menjalankan makmal unik yang khusus untuk memahami matematik di sebalik pengiraan kortikal, bertujuan untuk." sebelum mencipta model matematik baharu dan mereplikasinya ke dalam peranti silikon. Ini melibatkan pemantauan langsung pancang dari retina sebenar.
Pada masa ini, Bensoman menentang setia mereplikasi neuron biologi, memanggil pendekatan itu ketinggalan zaman.
"Idea untuk mereplikasi neuron dalam silikon tercetus kerana orang melihat transistor dan melihat mekanisme yang kelihatan seperti neuron sebenar, jadi terdapat beberapa pemikiran di sebaliknya pada mulanya," katanya. "Kami tidak mempunyai sel; kami mempunyai silikon. Anda perlu menyesuaikan substrat pengkomputeran anda, bukan sebaliknya... Jika saya tahu apa yang saya pengkomputeran dan saya mempunyai cip, saya boleh mengoptimumkan persamaan ini dan melakukannya pada kos terendah, penggunaan kuasa terendah, Latensi terendah untuk menjalankannya ”
Kuasa Pemprosesan
Kesedaran bahawa replika neuron yang tepat tidak diperlukan dan pembangunan kamera DVS adalah pemacu. kuasa di sebalik sistem penglihatan hari ini. Walaupun sistem sudah tersedia secara komersial, kemajuan diperlukan sebelum penglihatan sepenuhnya seperti manusia boleh digunakan secara komersial.
Benosman berkata kamera DVS asal mempunyai "piksel yang besar dan tebal" kerana komponen yang mengelilingi fotodiod itu sendiri sangat mengurangkan faktor isian. Walaupun pelaburan dalam membangunkan kamera ini telah mempercepatkan teknologi, Benosman menjelaskan bahawa kamera kejadian hari ini hanyalah penambahbaikan pada peralatan penyelidikan asal yang dibangunkan pada tahun 2000. Kamera DVS paling canggih daripada Sony, Samsung dan Omnivision mempunyai piksel kecil yang menggabungkan teknologi canggih seperti susun 3D dan mengurangkan hingar. Kebimbangan Benosman ialah sama ada jenis penderia yang digunakan hari ini boleh berjaya skala.
"Masalahnya, sebaik sahaja anda meningkatkan bilangan piksel, anda mendapat banyak data kerana anda masih sangat pantas," katanya. "Anda mungkin masih boleh memprosesnya dalam masa nyata, tetapi anda akan mendapat terlalu banyak perubahan relatif daripada terlalu banyak piksel. Itu membunuh semua orang sekarang kerana mereka melihat potensi, tetapi mereka tidak mempunyai pemproses yang sesuai untuk menyokongnya."
Contoh aplikasi pelanggan Prophesee ini menunjukkan perbezaan antara kamera imej (sudut kiri atas setiap kotak) dan output sensor DVS.
Pemproses neuromorfik tujuan am ketinggalan berbanding rakan kamera DVS mereka. Usaha oleh beberapa pemain terbesar industri (IBM Truenorth, Intel Loihi) masih diteruskan. Pemproses yang betul dan sensor yang betul akan menjadi gabungan yang tiada tandingan, kata Benosman.
"Penderia [DVS hari ini] sangat pantas, mempunyai lebar jalur ultra rendah dan mempunyai julat dinamik yang tinggi supaya anda boleh melihat di dalam dan di luar," kata Benosman. "Ini adalah masa depan. Adakah ia akan berlepas? Benar-benar
"Sesiapa yang boleh meletakkan pemproses di sana dan menghantar tindanan penuh menang kerana ia akan menjadi tiada tandingan," tambahnya road.
Atas ialah kandungan terperinci Teknologi penglihatan komputer akan mengalami perubahan besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Laman web ini melaporkan pada 27 Jun bahawa Jianying ialah perisian penyuntingan video yang dibangunkan oleh FaceMeng Technology, anak syarikat ByteDance Ia bergantung pada platform Douyin dan pada asasnya menghasilkan kandungan video pendek untuk pengguna platform tersebut Windows , MacOS dan sistem pengendalian lain. Jianying secara rasmi mengumumkan peningkatan sistem keahliannya dan melancarkan SVIP baharu, yang merangkumi pelbagai teknologi hitam AI, seperti terjemahan pintar, penonjolan pintar, pembungkusan pintar, sintesis manusia digital, dsb. Dari segi harga, yuran bulanan untuk keratan SVIP ialah 79 yuan, yuran tahunan ialah 599 yuan (nota di laman web ini: bersamaan dengan 49.9 yuan sebulan), langganan bulanan berterusan ialah 59 yuan sebulan, dan langganan tahunan berterusan ialah 499 yuan setahun (bersamaan dengan 41.6 yuan sebulan) . Di samping itu, pegawai yang dipotong juga menyatakan bahawa untuk meningkatkan pengalaman pengguna, mereka yang telah melanggan VIP asal

Tingkatkan produktiviti, kecekapan dan ketepatan pembangun dengan menggabungkan penjanaan dipertingkatkan semula dan memori semantik ke dalam pembantu pengekodan AI. Diterjemah daripada EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, pengarang JanakiramMSV. Walaupun pembantu pengaturcaraan AI asas secara semulajadi membantu, mereka sering gagal memberikan cadangan kod yang paling relevan dan betul kerana mereka bergantung pada pemahaman umum bahasa perisian dan corak penulisan perisian yang paling biasa. Kod yang dijana oleh pembantu pengekodan ini sesuai untuk menyelesaikan masalah yang mereka bertanggungjawab untuk menyelesaikannya, tetapi selalunya tidak mematuhi piawaian pengekodan, konvensyen dan gaya pasukan individu. Ini selalunya menghasilkan cadangan yang perlu diubah suai atau diperhalusi agar kod itu diterima ke dalam aplikasi

Model Bahasa Besar (LLM) dilatih pada pangkalan data teks yang besar, di mana mereka memperoleh sejumlah besar pengetahuan dunia sebenar. Pengetahuan ini dibenamkan ke dalam parameter mereka dan kemudiannya boleh digunakan apabila diperlukan. Pengetahuan tentang model ini "diperbaharui" pada akhir latihan. Pada akhir pra-latihan, model sebenarnya berhenti belajar. Selaraskan atau perhalusi model untuk mempelajari cara memanfaatkan pengetahuan ini dan bertindak balas dengan lebih semula jadi kepada soalan pengguna. Tetapi kadangkala pengetahuan model tidak mencukupi, dan walaupun model boleh mengakses kandungan luaran melalui RAG, ia dianggap berfaedah untuk menyesuaikan model kepada domain baharu melalui penalaan halus. Penalaan halus ini dilakukan menggunakan input daripada anotasi manusia atau ciptaan LLM lain, di mana model menemui pengetahuan dunia sebenar tambahan dan menyepadukannya

Untuk mengetahui lebih lanjut tentang AIGC, sila layari: 51CTOAI.x Komuniti https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou berbeza daripada bank soalan tradisional yang boleh dilihat di mana-mana sahaja di Internet memerlukan pemikiran di luar kotak. Model Bahasa Besar (LLM) semakin penting dalam bidang sains data, kecerdasan buatan generatif (GenAI) dan kecerdasan buatan. Algoritma kompleks ini meningkatkan kemahiran manusia dan memacu kecekapan dan inovasi dalam banyak industri, menjadi kunci kepada syarikat untuk kekal berdaya saing. LLM mempunyai pelbagai aplikasi Ia boleh digunakan dalam bidang seperti pemprosesan bahasa semula jadi, penjanaan teks, pengecaman pertuturan dan sistem pengesyoran. Dengan belajar daripada sejumlah besar data, LLM dapat menjana teks

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

Editor |. KX Dalam bidang penyelidikan dan pembangunan ubat, meramalkan pertalian pengikatan protein dan ligan dengan tepat dan berkesan adalah penting untuk pemeriksaan dan pengoptimuman ubat. Walau bagaimanapun, kajian semasa tidak mengambil kira peranan penting maklumat permukaan molekul dalam interaksi protein-ligan. Berdasarkan ini, penyelidik dari Universiti Xiamen mencadangkan rangka kerja pengekstrakan ciri berbilang mod (MFE) novel, yang buat pertama kalinya menggabungkan maklumat mengenai permukaan protein, struktur dan jujukan 3D, dan menggunakan mekanisme perhatian silang untuk membandingkan ciri modaliti yang berbeza penjajaran. Keputusan eksperimen menunjukkan bahawa kaedah ini mencapai prestasi terkini dalam meramalkan pertalian mengikat protein-ligan. Tambahan pula, kajian ablasi menunjukkan keberkesanan dan keperluan maklumat permukaan protein dan penjajaran ciri multimodal dalam rangka kerja ini. Penyelidikan berkaitan bermula dengan "S

Menurut berita dari laman web ini pada 1 Ogos, SK Hynix mengeluarkan catatan blog hari ini (1 Ogos), mengumumkan bahawa ia akan menghadiri Global Semiconductor Memory Summit FMS2024 yang akan diadakan di Santa Clara, California, Amerika Syarikat dari 6 hingga 8 Ogos, mempamerkan banyak produk penjanaan teknologi baru. Pengenalan kepada Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage), dahulunya Sidang Kemuncak Memori Flash (FlashMemorySummit) terutamanya untuk pembekal NAND, dalam konteks peningkatan perhatian kepada teknologi kecerdasan buatan, tahun ini dinamakan semula sebagai Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage) kepada jemput vendor DRAM dan storan serta ramai lagi pemain. Produk baharu SK hynix dilancarkan tahun lepas
