Persaingan hujung ke hujung ialah trend berprofil tinggi dalam bidang teknologi hari ini Adakah Li Auto membuat perubahan dalam hal ini? Editor PHP Youzi akan memberi anda perbincangan mendalam tentang susun atur hujung ke hujung Li Auto, daripada paparan PPT kepada pelaksanaan sebenar, untuk meneroka petunjuknya.
Arah aliran "hujung ke hujung" melanda industri pemanduan pintar China.
Memasuki separuh kedua 2024, jika mana-mana syarikat kereta tidak bercakap tentang "hujung ke hujung" apabila bercakap mengenai pemanduan pintar, kemungkinan besar ia akan dianggap ketinggalan.
Pada 5 Julai, Li Auto mengeluarkan seni bina teknologi pemanduan autonomi baharu berdasarkan model hujung ke hujung, model bahasa visual VLM dan model dunia. Ini pada asasnya ialah keluaran metodologi laluan hujung ke hujung Auto Ideal, yang lebih lengkap membentangkan laluan pembangunan Pemanduan Pintar Ideal seterusnya.
Dari perspektif Huxiu Automobile, terdapat tiga fokus utama yang patut diberi perhatian dalam keluaran ini - Bagaimanakah "hujung-ke-hujung" yang ideal berbeza daripada pemain lain? Sejauh manakah pembangunan pemanduan pintar yang ideal telah dicapai? Dan, kenapa Ideal menekankan keupayaan teknikal pemanduan pintar pada masa ini?
Berbanding dengan Huawei, penyelesaian Ideal adalah lebih radikal
Mari kita lihat seni bina teknologi pemanduan autonomi baharu Ideal. Diilhamkan oleh teori sistem pantas dan perlahan pemenang Hadiah Nobel Daniel Kahneman, ia mensimulasikan pemikiran manusia dan proses membuat keputusan dalam bidang pemanduan autonomi, menggunakan "sistem pantas" dan "sistem perlahan" untuk kerjasama.
Sistem pantas, juga dikenali sebagai Sistem 1, pandai mengendalikan tugas mudah Ia adalah gerak hati manusia yang dibentuk berdasarkan pengalaman dan tabiat, yang cukup untuk mengendalikan 95% daripada senario rutin semasa memandu kenderaan.
Sistem perlahan, juga dikenali sebagai Sistem 2, ialah penaakulan logik, analisis kompleks dan keupayaan pengkomputeran yang dibentuk oleh manusia melalui pemahaman dan pembelajaran yang lebih mendalam Ia digunakan untuk menyelesaikan senario trafik yang rumit atau tidak diketahui semasa memandu kenderaan, perakaunan untuk 50% pemanduan harian Kira-kira 5%.
Di bawah prototaip seni bina ini, Sistem 1 dilaksanakan oleh model hujung-ke-hujung, yang menerima input sensor dan secara langsung mengeluarkan trajektori pemanduan untuk mengawal kenderaan. Sistem 2 dilaksanakan oleh model bahasa visual VLM Selepas menerima input sensor, ia mengeluarkan maklumat membuat keputusan kepada Sistem 1 selepas pemikiran logik. Keupayaan pemanduan autonomi yang terdiri daripada sistem dwi akan dilatih dan disahkan menggunakan model dunia dalam awan.
Mengikut teori ideal, model hujung ke hujung Sistem 1 mengguna pakai penyelesaian Satu Model, yang kebanyakannya terdiri daripada ciri kamera dan lidar diekstrak dan digabungkan oleh rangkaian tulang belakang CNN dan diunjurkan ke dalam ruang BEV.
Selain itu, Ideal juga menambah maklumat status kenderaan dan maklumat navigasi ke hujung input Selepas pengekodan oleh model Transformer, ia dinyahkod dengan ciri BEV untuk menyahkod halangan dinamik, struktur jalan dan halangan umum, dan merancang trajektori pemanduan.
Berbanding dengan penyelesaian hujung ke hujung bersegmen yang diterima pakai oleh pengeluar seperti Huawei dan Xpeng, penyelesaian One Model yang diterima pakai oleh Ideal adalah lebih radikal. Tesla juga merupakan penyelesaian Satu Model, tetapi penyelesaian "imej input, kawalan output"nya lebih jauh daripada "maklumat sensor input, trajektori pemacu output" yang ideal.
Perlu ditegaskan bahawa laluan hujung ke hujung semasa yang digunakan oleh pelbagai pengeluar hanyalah perbezaan dalam pilihan, dan tidak ada perbezaan antara kelebihan dan kekurangan. (Bagi prinsip teknikal hujung-ke-hujung, pasukan Huxiu Automobile telah menyediakan analisis terperinci dalam artikel "Tesla akan berperang dengan Huawei")
Perkara istimewa tentang seni bina ideal ini sebenarnya ialah Sistem 2, iaitu berdasarkan Seni bina algoritma model bahasa visual VLM terdiri daripada model Transformer bersatu, yang mengekod teks Prompt (perkataan gesaan) dengan Tokenizer (pembahagi perkataan), mengekod maklumat visual imej kamera yang berpandangan ke hadapan dan maklumat peta navigasi , dan kemudian menggunakan imej dan teks untuk mengekod maklumat visual Modul penjajaran melaksanakan penjajaran modal, dan akhirnya melaksanakan penaakulan autoregresif bersatu, mengeluarkan pemahaman tentang persekitaran, keputusan memandu dan trajektori pemanduan, dan menyerahkannya kepada Sistem 1 untuk membantu dalam. mengawal kenderaan.
Dalam senario sebenar, jika Sistem 2 mendapati permukaan jalan sangat beralun dan tidak rata semasa pemanduan, ia akan menghantar peringatan pengurangan kelajuan kepada Sistem 1 dan memaklumkan pemandu bahawa kenderaan di jalan berlubang di hadapan akan memandu perlahan, mengurangkan bonggol ; atau ia boleh mengenal pasti lokasi lorong bas dan mengenal pasti lorong pasang surut, dsb.
Dalam istilah yang ideal, Sistem 2 adalah setara dengan mempunyai pengajar sekolah memandu yang duduk di tempat duduk pembantu juruterbang untuk memantau tingkah laku pemanduan pada setiap masa. Perlu dinyatakan bahawa model bahasa besar Xpeng XBrain dan model persepsi semantik pemanduan autonomi besar Haomo juga mempunyai keupayaan yang sama.
Dilaporkan bahawa jumlah parameter model VLM yang ideal mencecah 2.2 bilion, dan masa inferens model VLM pada bahagian kenderaan juga telah dioptimumkan daripada 4.1 saat kepada 0.3 saat.
Selain sistem dwi, Ideal juga memperkenalkan kaedah ujian dan pengesahan penyelesaian hujung ke hujung. Pendekatan arus perdana dalam industri adalah untuk menjalankan ujian simulasi melalui persekitaran maya 3D, simulasi rekonstruktif, simulasi generatif, dsb. Pendekatan yang ideal adalah untuk menggabungkan dua laluan teknikal simulasi yang dibina semula dan simulasi yang dijana, yang setara dengan membina semula soalan sebenar dan menjana soalan simulasi.
Malah, Tesla juga menggunakan model besar untuk menjana video berterusan untuk mencipta Model Dunia syarikat pemanduan autonomi Wayve model pemanduan autonomi besar GAIA-1 (sudah mempunyai 9 bilion parameter) juga boleh menjana video adegan pemanduan , menerangkan senario dan membuat ramalan.
Secara amnya, seni bina teknikal yang ideal ialah menggunakan sistem dwi pada bahagian kereta Model hujung ke hujung ONE Model membolehkan sistem pemanduan autonominya berkelakuan seperti yang boleh didayakan oleh model VLM pemanduan autonomi Sistem ini mempunyai keupayaan pemikiran logik yang sama seperti manusia manakala model dunia menyediakan persekitaran pembelajaran dan peperiksaan serta mempunyai kebolehan untuk berulang dengan cepat.
Menurut Lang Xianpeng, ketua Lili Intelligent Driving, penyelesaian hujung ke hujungnya telah diinkubasi secara dalaman dan memulakan pra-penyelidikan sejak separuh kedua tahun lalu Ia kini telah menyelesaikan pengesahan prototaip model dan penggunaan sebenar kenderaan.
Walau bagaimanapun, penyelesaian ini masih sukar untuk disampaikan kepada pengguna Penyelesaian ideal untuk pengguna AD Max bulan ini adalah untuk menolak penyelesaian NOA tanpa imej.
Pemanduan pintar menyambut saat memotong
"Hujung-ke-hujung" menjadi arah penting dalam mengejar pemanduan pintar oleh pelbagai pengeluar.
Pada bulan Mac tahun ini, Yuanrong Qixing berjaya meletakkan model hujung ke hujung pada bas apabila Huawei mengeluarkan Qiankun 3.0 pada bulan April, ia menyatakan bahawa teknologinya telah beralih kepada seni bina rangkaian GOD/PDP yang baharu untuk dicapai; perancangan pra-keputusan untuk rangkaian Xpeng 5 Pada bulan Mac, ia telah diumumkan pada AI DAY bahawa model besar hujung ke hujung telah dimasukkan ke dalam pengeluaran besar-besaran. Di samping itu, pengeluar termasuk Weilai, Xiaomi, Xpeng dan pengeluar lain telah melaraskan pasukan pemanduan pintar mereka untuk melaksanakan susun atur hujung ke hujung.
Dapat dilihat pelbagai pengeluar, termasuk Tesla, sedang meneroka hala tuju teknologi hujung ke hujung Walaupun pilihan dan laluan berbeza, apa yang pasti teknologi hujung ke hujung. telah menjadi hala tuju pemanduan pintar.
Walau bagaimanapun, hujung ke hujung akan menguatkan had atas dan bawah sistem pemanduan pintar Walaupun ia boleh meningkatkan keupayaan pemanduan pintar, ia juga membawa masalah keselamatan hujung-ke-hujung kotak hitam, yang tidak boleh Ditafsirkan membawa bersamanya beberapa kebimbangan keselamatan.
Sementara pelbagai syarikat bersaing untuk susun atur, Ideal ialah syarikat kereta pertama yang mendedahkan penyelesaian teknologi hujung ke hujungnya sendiri, Li Xiang mendedahkan dua sistem utama di Forum Chongqing bulan lepas, yang membangkitkan perbincangan hangat dalam industri. Kali ini Ia juga mengumumkan set lengkap rancangan seni bina teknikal, yang boleh dikatakan menarik semasa besi panas.
Memandangkan Lideal tidak akan mengeluarkan produk baharu pada separuh kedua tahun ini, keluaran pertamanya dalam keupayaan pemanduan pintar bukan sahaja dapat mengekalkan populariti syarikat, tetapi juga mengekalkan daya saing produk sedia ada. Selain itu, susun atur laluan teknologi hujung ke hujung juga memberi Ideal peluang untuk mengejar keupayaan pemanduan pintar.
Berbanding dengan pendekatan hujung ke hujung bersegmen yang diterima pakai oleh Huawei, Xiaopeng, dsb., model hujung ke hujung yang ideal adalah lebih sukar untuk dilaksanakan Berapa lama masa yang diambil untuk beralih daripada PPT kepada pengeluaran besar-besaran dan bagaimana berkesan ke? Anda masih perlu mengekalkan pemerhatian.
Menurut "Laporan Penyelidikan Industri Pemanduan Autonomi End-to-End" yang dikeluarkan oleh Chentao Capital, penyelesaian hujung-ke-hujung modular syarikat pemanduan autonomi domestik mungkin dimasukkan ke dalam pengeluaran besar-besaran pada 2025. Ia adalah keldai atau kuda, dan tahun depan sudah tiba masanya untuk membawanya keluar untuk berjalan-jalan.
Laporkan kandungan artikel
Artikel ini dicetak semula dari Kuai Technology Pendapat dalam artikel hanya mewakili pandangan peribadi penulis Laman ini hanya menyimpan maklumat
Atas ialah kandungan terperinci Sesuai untuk menyertai pertandingan 'hujung ke hujung': walaupun ia hanya PPT. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!