Artikel ini akan bermula dari perspektif teknikal dan mengambil Apple MR yang dilancarkan baru-baru ini sebagai contoh untuk menganalisis tiga perkara teknikal utama yang dunia AR perlu bergantung pada: penjejakan mata, pengecaman manual dan pengiraan spatial. Mari kita lihat analisis pengarang terhadap tiga perkara teknikal ini~
Dalam dunia fizikal, memerhati dengan mata dan beroperasi dengan tangan adalah cara interaksi yang paling semula jadi. Untuk merealisasikan kesinambungan interaksi semula jadi ini dalam dunia AR, kita perlu bergantung pada tiga perkara teknikal utama.
Kami tidak kecewa, kerana keluaran Apple Vision Pro menunjukkan keupayaan interaksi semula jadi yang didayakan oleh tiga teknologi.
1. Teknologi penjejakan mata
Jika kita perlu berinteraksi lebih jauh dengan objek dalam realiti, kita secara semula jadi akan menumpukan mata kita padanya Apabila kita menghabiskan perhatian kita untuk menumpukan mata kita padanya, ia sudah mewakili pilihan kita.
Proses ini meliputi dua keadaan semasa dalam medan antara muka : keadaan pengaktifan (fokus) dan keadaan klik (pilihan) . Teknologi penjejakan mata merealisasikan proses melihat dan memfokus.
Teknologi ini sememangnya bukan yang pertama seumpamanya. Perintis cermin mata AR, interaksi generasi ke-2 Microsoft Holoens menampilkan Eye-gaze, iaitu fungsi memfokus dengan mata anda.
Sebelum ini, interaksi pandangan kepala generasi pertama Microsoft Holoens sebenarnya mempunyai konsep melihat dan mengaktifkan dengan mata. Walau bagaimanapun, dalam Pandangan Kepala, kepala digerakkan sedikit untuk mengawal titik (Gaze) di tengah skrin untuk mengaktifkan kandungan Sentiasa terdapat jurang antaranya dan interaksi semula jadi kami, kerana sebenarnya, kami menumpukan pada satu objek dan tidak perlu fokus padanya setiap kali hanya bergantung pada kepala anda untuk bergerak dan mata anda untuk bergerak.
Walau bagaimanapun, walaupun teknologi penjejakan mata boleh menyelesaikan standard interaksi semula jadi dengan lebih baik, interaksi pergerakan kepala bukan tanpa kelebihannya. Contohnya, cermin mata yang dibangunkan oleh pasukan saya hanya boleh menyokong interaksi pandangan kepala. Kos dan kesukaran teknikal kaedah interaktif ini lebih rendah Berbanding dengan kaedah pengaktifan fokus dengan tangan/tetikus/kawalan jauh, dsb., ia lebih dekat dengan konsep interaksi semula jadi iaitu melihat dengan mata kita.
Selain itu, teknologi penjejakan mata telah merealisasikan keadaan pengaktifan, tetapi ia masih belum benar-benar merealisasikan pemilihan, iaitu, keadaan klik. Fungsinya adalah untuk memberitahu mesin bahawa saya mengesahkan ia adalah ia.
Dalam istilah yang ketat, adalah sangat perlu untuk meninggalkan langkah pengesahan manual untuk perkara yang tidak memerlukan operasi. Sebagai contoh, apabila saya sedang makan makanan ringan dan menonton rancangan TV, saya sangat berharap bahawa saya tidak perlu mengelap tangan kotor saya sebelum setiap operasi... Dalam bidang pembuatan, keperluan untuk membebaskan tangan seperti ini sering dibangkitkan oleh pelanggan.
Untuk interaksi yang lebih natural, mungkin ini juga boleh menjadi sebahagian daripada imaginasi kita. Saya menulis tentang paten sebelum itu bergantung pada teknologi gelombang otak untuk pengesahan mudah.
2. Teknologi pengecaman isyarat
Penjejakan mata memenuhi bahagian interaksi ini dengan mata Operasi dengan tangan memerlukan teknologi pengecaman gerak isyarat.
Ini bukan teknologi baharu Ia telah dipasang pada banyak peranti ARVR sebelum ini. Sudah tentu, tahap pelaksanaan perlu disahkan oleh pengalaman sebenar.
Dalam video promosi Vision Pro, pengecaman gerak isyarat kelihatan sangat semula jadi, dan tangan tidak perlu diangkat. Ini harus bergantung pada 4 set kamera pandangan ke bawah (ini mungkin salah satu sebabnya memerlukan konfigurasi 12 kamera).
Berbanding dengan video promosi Hololens2, dapat dilihat bahawa gerak isyarat dilindungi oleh kamera atas.
Oleh kerana pengecaman gerak isyarat bergantung pada kamera (komputer memerlukan input untuk mengetahui cara tangan anda bergerak), gerak isyarat yang sama akan menghasilkan hasil yang berbeza dari sudut yang berbeza, dan hasil pengecaman juga akan terjejas.
Selain itu, pengalaman pengecaman gerak isyarat 2D dan teknologi pengecaman gerak isyarat 3D juga berbeza.
3. Pengiraan ruang
Untuk memudahkan mata melihat dan lebih semula jadi beroperasi dengan tangan, peranti perlu mempunyai keupayaan untuk memahami ruang. Pengkomputeran spatial adalah perkara yang ingin dipromosikan oleh Vision Pro. Fokus mereka pada keupayaan ini membuatkan mereka percaya bahawa keupayaan ini boleh membahagikan satu era .
"Era Pengkomputeran Spatial".
Banyak interaksi berlaku secara semula jadi kerana mesin mempunyai keupayaan pengkomputeran ruang Dengan kata lain, jika mesin tidak mempunyai keupayaan untuk memahami ruang, interaksi ini tidak boleh berlaku secara semula jadi. Nerf, SLAM, 3DOF dan 6DOF adalah sebahagian daripada teknologi pengkomputeran spatial dan semua yang anda dengar termasuk dalam kategori ini.
Dari perspektif pengalaman, persepsi jarak antara objek dan antara objek dan pengguna yang dibawa oleh kedalaman ruang yang disebabkan oleh orientasi perspektif pengguna dalam kedudukan dan postur yang berbeza; persekitaran Perubahan dalam persepsi warna yang disebabkan oleh perbezaan cahaya seperti masa dan cuaca; atau bahkan bunyi dari lokasi spatial yang berbeza, dll. Pengkomputeran spatial boleh memberi pereka lebih ruang untuk interaksi semula jadi.
Boleh dikatakan bahawa pengkomputeran spatial ialah teknologi utama yang akan membolehkan AR menjadi berbeza daripada antara muka skrin biasa pada masa hadapan, dan apa yang kami harapkan, "Semua yang anda lihat boleh menjadi antara muka."
Kolumnis
Lin Yingluo, akaun awam WeChat: Terdapat bayang-bayang jatuh di dalam hutan, dan semua orang ialah kolumnis pengurus produk. Pereka pengalaman pengguna yang tahu cara bermain kad, pengarang "Reka Bentuk Antaramuka AR", 10 tahun + pengalaman reka bentuk UIUX, memfokuskan pada reka bentuk pengalaman pengguna dalam bidang AR dan kecerdasan selama 6 tahun latar belakang pendidikan reka bentuk & psikologi, profesional negara pensijilan senior OH Card master/bakat perlombongan jurulatih. Saya harap usaha saya dapat menambah nilai kepada bidang reka bentuk masa depan yang bijak dan menjadikan kerjaya pereka lebih berharga
Gambar tajuk datang daripada Unsplash, berdasarkan lesen CC0
Atas ialah kandungan terperinci Tiga teknologi utama memberikan antara muka AR kuasa. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!