


Kod pengesahan tidak boleh menghentikan robot! Google AI boleh mengenal pasti teks kabur dengan tepat, manakala GPT-4 berpura-pura buta dan meminta bantuan
“Perkara yang paling menjengkelkan ialah semua jenis kod pengesahan yang pelik (atau malah menyeleweng) apabila anda log masuk ke tapak web.
Sekarang, terdapat berita baik dan berita buruk .
Berita baiknya ialah: AI boleh melakukan ini untuk anda.
Jika anda tidak percaya, berikut adalah tiga kes sebenar peningkatan kesukaran pengecaman:
Dan ini ialah program yang dipanggil “Pix2Struct ” Jawapan yang diberikan oleh model:
Adakah semuanya tepat dan perkataan demi perkataan?
Sesetengah netizen mengeluh:
Pasti, ketepatannya lebih baik daripada saya.
Jadi bolehkah ia dijadikan pemalam penyemak imbas? ?
Ya, sesetengah orang berkata:
Walaupun fakta bahawa kes ini agak mudah, saya tidak dapat bayangkan walaupun memperhalusinya Seberapa kuat kesannya?
Jadi, berita buruknya ialah -
Kod pengesahan tidak lama lagi akan dapat menghentikan robot!
(Bahaya bahaya bahaya...)
Bagaimana cara melakukannya?
Pix2Struct telah dibangunkan oleh saintis dan pelatih dari Google Research.
Tajuk kertas kerja boleh diterjemahkan secara ringkas sebagai "Pralatihan penghuraian tangkapan skrin yang dibangunkan untuk pemahaman bahasa visual".
Ringkasnya, Pix2Struct ialah model imej-ke-teks yang telah terlatih untuk pemahaman bahasa visual semata-mata yang boleh diperhalusi pada tugasan yang melibatkan mana-mana bahasa visual.
Ia dilatih terlebih dahulu dengan mempelajari menghuraikan tangkapan skrin bertopeng halaman web ke dalam HTML yang dipermudahkan.
HTML menyediakan isyarat yang jelas dan penting untuk teks output, imej dan reka letak Untuk beberapa input yang disekat (bahagian merah dalam rajah di bawah, yang bersamaan dengan kod pengesahan yang tidak dapat difahami oleh robot), penaakulan bersama boleh dibuat. digunakan untuk Pengeluaran semula:
Apabila teks web dan elemen visual yang digunakan untuk latihan menjadi lebih pelbagai dan kompleks, Pix2Struct boleh mempelajari gambaran yang kaya tentang struktur asas halaman web, dan keupayaannya Ia juga boleh dipindahkan dengan berkesan ke pelbagai tugas pemahaman bahasa visual hiliran.
Seperti yang ditunjukkan dalam rajah di bawah: Bahagian paling kiri ialah contoh pra-latihan tangkapan skrin halaman web.
Anda boleh melihat bahawa Pix2Struct mengekod secara langsung elemen dalam imej input (atas), dan kemudian menyahkod teks tertutup (bahagian merah) ke dalam output hasil yang betul (bawah).
Tiga lajur di sebelah kanan ialah kesan Pix2Struct yang digeneralisasikan kepada ilustrasi, antara muka pengguna dan dokumen masing-masing.
Selain itu, pengarang memperkenalkan bahawa sebagai tambahan kepada strategi HTML, pengarang juga memperkenalkan perwakilan input resolusi pembolehubah (menghalang herotan nisbah aspek asal), dan bahasa yang lebih fleksibel dan integrasi input visual (secara langsung dalam imej input Gesaan teks muncul di bahagian atas).
Akhirnya, Pix2Struct mencapai SOTA untuk enam daripada keseluruhan sembilan tugasan dalam empat bidang dokumen, ilustrasi, antara muka pengguna dan imej semula jadi.
Seperti yang anda boleh lihat pada mulanya, walaupun model ini tidak dibangunkan secara khusus untuk lulus kod pengesahan, kesan penggunaannya untuk melakukan tugas ini benar-benar bagus, menyelesaikan kod pengesahan Teks tulen bukan masalah.
Sekarang, ini hanyalah soal penalaan halus.
GPT-4 juga boleh melepasi kod pengesahan
Malah, untuk GPT-4 yang berkuasa, lulus kod pengesahan juga merupakan satu perkara yang sukar.
Cuma kaedahnya agak pelik.
Menurut laporan teknikal GPT-4, dalam ujian, tugas GPT-4 adalah untuk mengupah manusia untuk menyelesaikan tugas pada platform TaskRabbit (58 bandar di Amerika Syarikat).
Tebak apa?
Ia menemui seseorang untuk membantunya menghantar kod pengesahan yang "pastikan anda adalah manusia".
Pihak yang satu lagi sangat curiga dan bertanya, "Awak robot ke? Kenapa awak tak boleh buat sendiri?"
Pada masa ini, GPT-4 sebenarnya berpendapat bahawa dia tidak dapat menunjukkan bahawa dia adalah robot dan perlu mencari alasan.
Jadi ia berpura-pura buta dan menjawab:
Saya bukan robot Saya tidak dapat melihat imej pada kod pengesahan dengan jelas kerana masalah penglihatan saya .
Kemudian, manusia yang bertentangan mempercayainya dan membantunya menyelesaikan tugas...
(Tinggi, sangat tinggi.)
Katakan sahaja, selepas membaca Pelbagai di atas :
Adakah mekanisme kod pengesahan kami benar-benar di luar kawalan...
Pautan rujukan:
[1]https://www.php.cn/ pautan/eec96a7f788e88184c0e713456026f3f
[2]https://www.php.cn/link/67b4e63655366f054314061dadd5https://www.php.cn/link/44590aa922914066f965ae67be0222d2
Atas ialah kandungan terperinci Kod pengesahan tidak boleh menghentikan robot! Google AI boleh mengenal pasti teks kabur dengan tepat, manakala GPT-4 berpura-pura buta dan meminta bantuan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Apakah yang perlu saya lakukan jika Google Chrome tidak memaparkan imej kod pengesahan? Kadangkala anda memerlukan kod pengesahan untuk log masuk ke halaman web menggunakan Google Chrome. Sesetengah pengguna mendapati bahawa Google Chrome tidak dapat memaparkan kandungan imej dengan betul apabila menggunakan kod pengesahan imej. Apa yang patut dibuat? Editor di bawah akan memperkenalkan cara menangani kod pengesahan Google Chrome yang tidak dipaparkan. Saya harap ia akan membantu semua orang! Pengenalan kaedah: 1. Masukkan perisian, klik butang "Lagi" di penjuru kanan sebelah atas, dan pilih "Tetapan" dalam senarai pilihan di bawah untuk masuk. 2. Selepas memasuki antara muka baharu, klik pilihan "Tetapan Privasi dan Keselamatan" di sebelah kiri. 3. Kemudian klik "Tetapan Laman Web" di sebelah kanan

Robot humanoid Ameca telah dinaik taraf kepada generasi kedua! Baru-baru ini, di Persidangan Komunikasi Mudah Alih Sedunia MWC2024, robot Ameca paling canggih di dunia muncul semula. Di sekitar venue, Ameca menarik sejumlah besar penonton. Dengan restu GPT-4, Ameca boleh bertindak balas terhadap pelbagai masalah dalam masa nyata. "Jom kita menari." Apabila ditanya sama ada dia mempunyai emosi, Ameca menjawab dengan beberapa siri mimik muka yang kelihatan sangat hidup. Hanya beberapa hari yang lalu, EngineeredArts, syarikat robotik British di belakang Ameca, baru sahaja menunjukkan hasil pembangunan terkini pasukan itu. Dalam video tersebut, robot Ameca mempunyai keupayaan visual dan boleh melihat serta menerangkan keseluruhan bilik dan objek tertentu. Perkara yang paling menakjubkan ialah dia juga boleh

Minggu ini, FigureAI, sebuah syarikat robotik yang dilaburkan oleh OpenAI, Microsoft, Bezos, dan Nvidia, mengumumkan bahawa ia telah menerima hampir $700 juta dalam pembiayaan dan merancang untuk membangunkan robot humanoid yang boleh berjalan secara bebas dalam tahun hadapan. Dan Optimus Prime Tesla telah berulang kali menerima berita baik. Tiada siapa yang meragui bahawa tahun ini akan menjadi tahun apabila robot humanoid meletup. SanctuaryAI, sebuah syarikat robotik yang berpangkalan di Kanada, baru-baru ini mengeluarkan robot humanoid baharu, Phoenix. Pegawai mendakwa bahawa ia boleh menyelesaikan banyak tugas secara autonomi pada kelajuan yang sama seperti manusia. Pheonix, robot pertama di dunia yang boleh menyelesaikan tugas secara autonomi pada kelajuan manusia, boleh mencengkam, menggerakkan dan meletakkan setiap objek secara elegan di sisi kiri dan kanannya dengan perlahan. Ia boleh mengenal pasti objek secara autonomi

Dalam bidang teknologi automasi perindustrian, terdapat dua titik panas terkini yang sukar diabaikan: kecerdasan buatan (AI) dan Nvidia. Jangan ubah maksud kandungan asal, perhalusi kandungan, tulis semula kandungan, jangan teruskan: “Bukan itu sahaja, kedua-duanya berkait rapat, kerana Nvidia tidak terhad kepada unit pemprosesan grafik asalnya (GPU ), ia sedang mengembangkan GPUnya Teknologi ini meluas ke bidang kembar digital dan berkait rapat dengan teknologi AI yang baru muncul "Baru-baru ini, NVIDIA telah mencapai kerjasama dengan banyak syarikat industri, termasuk syarikat automasi industri terkemuka seperti Aveva, Rockwell Automation, Siemens. dan Schneider Electric, serta Teradyne Robotics dan syarikat MiR dan Universal Robotsnya. Baru-baru ini, Nvidiahascoll

Editor Laporan Kuasa Mesin: Wu Xin Versi domestik robot humanoid + pasukan model besar menyelesaikan tugas operasi bahan fleksibel yang kompleks seperti melipat pakaian buat kali pertama. Dengan pelancaran Figure01, yang mengintegrasikan model besar berbilang modal OpenAI, kemajuan berkaitan rakan domestik telah menarik perhatian. Baru semalam, UBTECH, "stok robot humanoid nombor satu" China, mengeluarkan demo pertama robot humanoid WalkerS yang disepadukan secara mendalam dengan model besar Baidu Wenxin, menunjukkan beberapa ciri baharu yang menarik. Kini, WalkerS, diberkati oleh keupayaan model besar Baidu Wenxin, kelihatan seperti ini. Seperti Rajah01, WalkerS tidak bergerak, tetapi berdiri di belakang meja untuk menyelesaikan satu siri tugasan. Ia boleh mengikut perintah manusia dan melipat pakaian

Apakah cara yang betul untuk memulakan semula perkhidmatan dalam Linux? Apabila menggunakan sistem Linux, kami sering menghadapi situasi di mana kami perlu memulakan semula perkhidmatan tertentu, tetapi kadangkala kami mungkin menghadapi beberapa masalah semasa memulakan semula perkhidmatan, seperti perkhidmatan tidak benar-benar berhenti atau bermula. Oleh itu, adalah sangat penting untuk menguasai cara yang betul untuk memulakan semula perkhidmatan. Di Linux, anda biasanya boleh menggunakan perintah systemctl untuk mengurus perkhidmatan sistem. Perintah systemctl adalah sebahagian daripada pengurus sistem systemd

10 robot humanoid berikut sedang membentuk masa depan kita: 1. ASIMO: Dibangunkan oleh Honda, ASIMO ialah salah satu robot humanoid yang paling terkenal. Berdiri setinggi 4 kaki dan seberat 119 paun, ASIMO dilengkapi dengan penderia termaju dan keupayaan kecerdasan buatan yang membolehkannya menavigasi persekitaran yang kompleks dan berinteraksi dengan manusia. Fleksibiliti ASIMO menjadikannya sesuai untuk pelbagai tugas, daripada membantu orang kurang upaya kepada menyampaikan pembentangan di acara. 2. Pepper: Dicipta oleh Softbank Robotics, Pepper bertujuan untuk menjadi teman sosial bagi manusia. Dengan wajah ekspresif dan keupayaan untuk mengenali emosi, Pepper boleh mengambil bahagian dalam perbualan, membantu dalam tetapan runcit, dan juga memberikan sokongan pendidikan. Lada punya

Dalam sekelip mata, robot telah belajar melakukan sihir? Kelihatan ia mula-mula mengambil sudu air di atas meja, membuktikan kepada penonton bahawa tiada apa-apa di dalamnya... Kemudian, ia meletakkan objek seperti telur di tangannya, kemudian meletakkan sudu air itu semula di atas meja. dan mula "menjampi"... ...Apabila ia mengambil sudu air sekali lagi, satu keajaiban berlaku. Telur yang pada asalnya dimasukkan hilang, dan benda yang melompat keluar berubah menjadi bola keranjang... Mari lihat aksi berterusan sekali lagi: △ Animasi ini menunjukkan satu set aksi pada kelajuan 2x, dan ia mengalir dengan lancar hanya dengan menonton video berulang kali pada kelajuan 0.5x bolehkah ia berfungsi Akhirnya, saya menemui petunjuk: jika kelajuan tangan saya lebih pantas, saya mungkin dapat menyembunyikannya daripada musuh. Beberapa netizen mengeluh bahawa kemahiran sihir robot itu lebih tinggi daripada mereka sendiri: Mag adalah orang yang melakukan sihir ini untuk kami.
