Sepuluh Ribu Perkataan Tafsiran Aplikasi Algoritma Pembelajaran Mendalam dalam Peraturan dan Kawalan Pemanduan Autonomi-AI-php.cn

Walaupun "didorong data" telah lama menjadi konsensus asas dalam industri pemanduan autonomi, sebenarnya, sehingga kini, algoritma pembelajaran mendalam dipacu data masih digunakan terutamanya dalam modul persepsi, tetapi jarang digunakan dalam peraturan dan kawalan

Sebelum masuk ke topik utama artikel, kita perlu menerangkan secara ringkas apakah "peraturan" yang disebut dalam artikel ini.

Saya percaya bahawa setiap orang dalam industri pemanduan autonomi mesti mengetahui modul utama persepsi, kedudukan, membuat keputusan, perancangan dan kawalan Walaupun semua orang membuat perbezaan sedemikian dalam komunikasi harian, ia akan menjadi agak mengelirukan jika mereka masih diklasifikasikan dengan cara ini dalam masalah tertentu.

Masalahnya di sini terletak pada pembuatan keputusan Secara umum, pembuatan keputusan termasuk ramalan, dan pembahagian ramalan adalah sangat janggal - ramalan itu sendiri sangat berkaitan dengan persepsi, tetapi ramalan adalah peringkat pra keputusan. -membuat. Hanya ramalan dahulu Keputusan boleh dibuat.

Kita boleh memanggil semua fakta yang telah ditetapkan yang telah berlaku T0+, dan persepsi adalah fakta yang telah ditetapkan yang telah berlaku. Sebagai contoh, bagaimana kenderaan itu harus bergerak pada masa hadapan dan perkara yang mungkin dilakukan oleh orang lain adalah semua perkara yang akan berlaku pada masa hadapan. Kita boleh memanggilnya T0-.

Terdapat kelebihan menggunakan T0 sebagai tadahan air: pautan persepsi hanya perlu mengambil berat tentang fakta yang telah ditetapkan yang telah berlaku di jalan raya, dan sebarang kesimpulan berdasarkan fakta yang telah ditetapkan ini boleh dimasukkan terus ke dalam keputusan -membuat bahagian.

Klasifikasi sedemikian boleh menggabungkan lebih rapat hasil ramalan dengan bahagian membuat keputusan, dengan itu secara artifisial "melemahkan" hubungan antara ramalan dan persepsi, dan "menguatkan" hubungan antara ramalan dan membuat keputusan. Dicerminkan dalam kerja sebenar, bahagian ini boleh menentukan dengan lebih baik perkara yang perlu diramalkan dan cara menggunakan keputusan ramalan dengan lebih baik untuk membuat keputusan. (Kandungan di atas diringkaskan oleh penulis selepas berkomunikasi dengan Dr. Yang Wenli, Ketua Pegawai Eksekutif Leadjun Technology)

Berdasarkan logik di atas, biasanya terdapat kumpulan PNC dalam syarikat pemanduan autonomi kumpulan PNC hendaklah bertanggungjawab ke atas peraturan dan kawalan. Selepas semua orang bekerja dalam kumpulan PNC untuk masa yang lama, mereka secara kolektif akan merujuk ramalan, membuat keputusan, perancangan dan kawalan sebagai "peraturan dan kawalan."

Maka "peraturan dan kawalan" ini adalah apa yang dipanggil "peraturan dan kawalan" dalam artikel ini.

Seterusnya, mari gabungkan "didorong data" dan "peraturan".

Walaupun "didorong data" telah lama menjadi konsensus asas industri pemanduan autonomi, sebenarnya, sehingga kini, algoritma pembelajaran mendalam dipacu data masih digunakan terutamanya dalam modul persepsi, tetapi jarang digunakan dalam kawal selia dan kawalan ——Pada masa ini, algoritma berkaitan peraturan dalam industri kebanyakannya didorong oleh peraturan.

Walaupun maklumat yang diterbitkan pada masa ini tentang algoritma kawalan pemanduan autonomi kebanyakannya untuk algoritma berasaskan peraturan, apabila saya membuka perisian pengambilan, saya sering melihat bahawa apabila syarikat pemanduan autonomi merekrut jurutera algoritma kawalan, mereka memerlukan calon memahami Pembelajaran mendalam algoritma, yang sedikit sebanyak juga menunjukkan bahawa banyak syarikat sedang "bergerak" ke arah algoritma membuat keputusan hibrid.

Sepuluh Ribu Perkataan Tafsiran Aplikasi Algoritma Pembelajaran Mendalam dalam Peraturan dan Kawalan Pemanduan Autonomi

Gambar datang daripada keperluan pengambilan syarikat pemanduan autonomi

Pada masa ini terdapat beberapa artikel yang menerangkan sepenuhnya dan teliti penggunaan algoritma pembelajaran mendalam dalam aplikasi kawalan pemanduan autonomi. Oleh itu, artikel ini akan membincangkan had peraturan dan potensi kelebihan algoritma pembelajaran mendalam, sebab algoritma pembelajaran mendalam belum boleh digunakan pada algoritma kawalan berskala besar pada peringkat ini dan sama ada algoritma kawalan masa depan akan berdasarkan peraturan atau pembelajaran mendalam Mari kita huraikan tiga aspek.

01 Had peraturan dan potensi kelebihan algoritma pembelajaran mendalam

1 Algoritma berasaskan peraturan mempunyai had

Pada masa ini, peraturan berkaitan Algoritma. terutamanya berdasarkan peraturan, tetapi dengan peningkatan tahap pemanduan autonomi dan pengembangan berterusan senario aplikasi, had algoritma kawalan berasaskan peraturan akan didedahkan dalam ujian sebenar.

Kekurangan algoritma kawalan berasaskan peraturan terutamanya disebabkan oleh tiga kategori kes sudut: senario bukan penentu, senario interaksi yang kuat dan senario subjektif yang kuat:

(1 ) Senario bukan penentu

Senario bukan penentu adalah relatif kepada senario penentu Senario penentu yang paling mudah ialah berhenti di lampu merah dan pergi apabila lampu hijau menyala, dan anda boleh menukar lorong. garis putus-putus putih Tidak boleh menukar lorong pada garis putih pepejal selain daripada ini boleh dianggap sebagai "senario tidak menentukan".

Sebagai contoh, dalam kebanyakan kes, kereta memandu di jalan raya dengan tanda lorong Namun, dalam satu kes, jalan semasa terdiri daripada tiga jalan utama dan satu jalan perkhidmatan, dan hanya terdapat garisan lorong dan tiada warna hijau. tali pinggang antara jalan perkhidmatan dan jalan utama Ini bermakna kenderaan di jalan tambahan boleh bergabung ke jalan utama dalam apa jua keadaan. Oleh kerana kebanyakan pemandu langsung tidak mengambil berat tentang garisan pepejal dan bertitik, anda tidak tahu bila kereta akan tiba-tiba muncul di sekeliling anda, dan kemungkinan besar ia akan menukar lorong secara langsung.

Oleh kerana trajektori kenderaan lain di jalan raya adalah kebarangkalian, algoritma berasaskan peraturan sukar dikendalikan.

(2) Adegan interaksi yang kuat

Adegan yang paling tipikal ialah persimpangan Laluan berbilang objek dalam adegan akan berinteraksi dan mempengaruhi satu sama lain, jadi interaksi Di sana adalah jumlah permainan tertentu yang terlibat.

Dalam pemandangan jalan yang sangat kompleks, sentiasa meramalkan kereta sekeliling dan kemudian melaraskan pelan berdasarkan hasil interaksi tidak dapat diterangkan dengan jelas oleh peraturan manusia.

(3) Adegan subjektif yang kuat

Ringkasnya, dalam keadaan jalan yang berbeza, orang ramai secara tidak sedar akan melaraskan jarak antara kereta mereka sendiri dan kereta di hadapan mengikut persekitaran . Kerana mungkin terdapat satu set peraturan yang memandu otak manusia, tetapi peraturan ini sangat abstrak dan tidak boleh dinyatakan, ia hanya boleh memahami yang tidak dapat dijelaskan, seperti masa menukar lorong, tindak balas terhadap kenderaan lain di persimpangan, dll.

Dalam sesetengah senario, walaupun algoritma peraturan boleh digunakan untuk meniru beberapa tingkah laku dan gaya pemanduan pemilik kereta, tabiat subjektif manusia sukar untuk diselesaikan menggunakan peraturan, dan walaupun ia boleh diselesaikan, ia memerlukan banyak perkara. tenaga manusia.

Menggunakan algoritma berasaskan peraturan untuk menangani kes sudut, bahagian yang paling sukar ialah proses ramalan. Kerana, selain meramal trajektori kenderaannya sendiri, kenderaan pandu sendiri juga perlu meramal trajektori "pengguna jalan raya lain", dan selalunya terdapat lebih daripada satu "pengguna jalan raya lain" di jalan raya, dan mereka akan berinteraksi. antara satu sama lain, jadi meramal trajektori mereka adalah sukar.

Apabila membuat ramalan, pemandu manusia akan membuat keputusan berdasarkan "pengalaman" dan "intuisi" dengan memerhati trajektori sejarah kereta dan gaya pemanduan pemandu itu, mereka boleh memilih kereta mereka sendiri berdasarkan sama ada kenderaan lain adalah strategi konservatif, bagaimanapun, sukar bagi algoritma berasaskan peraturan untuk mencapai kesan ramalan yang serupa dengan manusia.

Selain itu, apabila kenderaan menghadapi beberapa kes selekoh dan perlu membrek, adalah sukar bagi sistem kawalan berasaskan peraturan untuk memastikan selekoh licin sepanjang masa.

Contohnya, jika ada kereta di hadapan anda memandu pada kelajuan yang sangat rendah, dan sistem pemanduan autonomi mengeluarkan arahan untuk "tukar lorong ke kanan untuk memotong", tetapi hanya separuh jalan melalui lorong berubah, tiba-tiba ada sebuah kereta di sebelahnya Kereta itu memotong dengan laju di lorong kanan, dan sistem membuat keputusan segera membatalkan keputusan menukar lorong dan menghasilkan semula lengkung yang lancar untuk membolehkan kenderaan itu kembali ke lorong asal.

Kesukaran di sini ialah bagaimana untuk mengimbangi elemen seperti keselesaan, keselamatan, kecekapan, dan kebolehcapaian model kuasa, dan memastikan laluan perancangan trajektori yang dihasilkan pada masa ini adalah lancar?

Masih menggunakan contoh di atas, jika laluan yang dijana pada masa ini tidak dapat dijamin lancar, maka kenderaan akan memandu dengan sangat "keras" dan menjadi sangat tidak selesa semasa memandu. Jika pemandu/penumpang dapat melihat kecemasan berlaku di sekelilingnya pada masa ini, dan sistem membantunya mengelakkan kemalangan tepat pada masanya, dia akan berfikir bahawa sistem itu sangat boleh dipercayai Walaupun dia brek secara tiba-tiba, penumpang akan berfikir bahawa automatik sistem pemanduan "membantu saya mengelakkan kemalangan."

Tetapi realitinya ialah dalam kebanyakan kes, sistem telah pun menemui masalah dan membuat keputusan, secara langsung "menggigitnya sejak awal." Tetapi masalahnya ialah kebanyakan pemandu/penumpang tidak akan tahu bahawa pertukaran lorong yang "seolah-olah biasa" baru sahaja "hampir menyebabkan kemalangan", dan mereka mungkin tidak perasan ada kereta datang dari belakang. Oleh itu, jika sistem kawalan tidak dapat menghasilkan lengkung yang lancar pada masa ini, pemandu/penumpang bukan sahaja akan berfikir bahawa sistem itu "membantu saya mengelakkan kemalangan", tetapi akan menyalahkan sistem kerana "terlalu tegar" dan "berpusing-pusing" apabila menukar lorong.

Walaupun jenis masalah ini juga boleh diselesaikan menggunakan algoritma berasaskan peraturan, proses penyelesaiannya sangat menyusahkan.

Selain itu, walaupun secara teori, beberapa senario ekor panjang juga boleh diselesaikan dengan algoritma berasaskan peraturan, dalam kerja sebenar, adalah sukar bagi jurutera untuk memastikan bahawa kod kompleks ini dapat menyelesaikan masalah tersebut masa yang sama, ia tidak mengambil terlalu banyak sumber pengkomputeran. Kod ini boleh dijalankan dengan mudah pada sistem luar talian, tetapi apabila berada di dalam kereta, bolehkah cip on-board menyokong penggunaan kuasa pengkomputeran yang begitu besar? Menyelesaikan masalah ini sangat menguji tahap pengekodan dan keupayaan kejuruteraan jurutera.

Selain itu, sesetengah jurutera mungkin telah menulis beribu-ribu baris kod, dan mereka telah melupakan apa yang telah mereka tulis. Terdapat lebih banyak peraturan dan lebih banyak logik yang mengelirukan Apabila keperluan baru ditambah pada satu ketika dalam "masa hadapan", sistem akan menjadi sukar untuk dikekalkan.

2. Algoritma pembelajaran mendalam boleh menambah baik antropomorfisme sistem dalam senario yang sesuai

Banyak had algoritma peraturan yang disebutkan di atas, tetapi sebenarnya batasan tersebut tidak' t berhenti di situ. Jika kita melihat semua masalah bersama-sama, kita secara kolektif boleh memanggilnya sebagai "antropomorfisme rendah" algoritma peraturan.

Apa yang dipanggil antropomorfisme merujuk kepada sama ada sistem kelihatan seperti "pemandu berpengalaman" semasa memandu. Pakar algoritma kawalan dari Hao Mo Zhixing berkata: "Keupayaan teras pemandu veteran antropomorfik adalah untuk menyesuaikan diri dengan perubahan, dan menggunakan sistem berasaskan peraturan memerlukan menetapkan banyak peraturan untuk membezakan senario, dan menetapkan sejumlah besar parameter persekitaran dan fungsi kos. Sentiasa mencari penyelesaian optimum sukar dicapai dalam masa nyata secara matematik "

Pada masa ini, kenderaan pandu sendiri yang boleh diuji di jalan raya adalah lebih seperti "pemandu baru" daripada "pemandu berpengalaman. " dalam kebanyakan kes. Perbezaan terbesar daripada "pemandu baru" ialah "pemandu berpengalaman" mempunyai keupayaan ramalan yang lebih kuat dan lebih mampu menyesuaikan diri dengan senario ekor panjang.

Berbanding dengan kedua-duanya, walaupun kebanyakan "pemandu baru" juga sangat selamat, "pemandu baru" akan menjadi "bodoh" apabila memandu di jalan raya, manakala "pemandu berpengalaman" boleh mengendalikan pelbagai operasi sambil memastikan keselamatan. Ia akan menjadi lebih lancar dan lebih cekap. Perbezaan ini dipanggil "pengalaman parol."

Pada asasnya, "pemandu baru" lebih bergantung pada "bahan pengajaran berasaskan sekolah memandu" di jalan raya, dan kaedah membuat keputusan dan perancangan mereka lebih seperti if else (algoritma peraturan), manakala "pemandu berpengalaman" bergantung pada pengalaman semasa membuat keputusan Dan pertimbangan subjektif, cara membuat keputusan dan perancangan adalah agak abstrak, lebih seperti "algoritma pembelajaran mendalam".

Ringkasnya, dengan memperkenalkan algoritma pembelajaran mendalam dalam proses pengawalseliaan dan kawalan, belajar sebanyak mungkin daripada pengalaman pemandu manusia, dan memperhalusi ciri secara automatik untuk mencari corak, "antropomorfisme" algoritma peraturan dan kawalan boleh diperbaiki.

Enjin data yang disebut oleh Tesla pada Hari AI ini akan meningkatkan kepastian dengan memasukkan data ke dalam rangkaian saraf untuk menyelesaikan masalah ramalan dunia sebenar dengan lebih baik.

Orang yang bertanggungjawab ke atas algoritma kawalan Qingzhou Zhihang percaya bahawa ramalan (menghakimi trajektori masa depan kenderaan lain) adalah langkah yang paling sesuai dan pertama untuk menggunakan algoritma pembelajaran mendalam pada skala besar. Beliau berkata: "Algoritma ramalan Qingzhou Zhihang menggunakan pembelajaran mendalam

Khususnya dari segi senario, beliau percaya bahawa senario yang sangat bergantung pada pertimbangan subjektif manusia perlu dipandu oleh algoritma pembelajaran mendalam.

“Sebagai contoh, anda boleh menggunakan model AI klasifikasi tradisional (yang boleh menjadi pembelajaran mendalam atau model klasifikasi pembelajaran mesin tradisional) untuk membuat keputusan, menggunakan pembelajaran mendalam untuk penjanaan trajektori untuk membimbing perancangan laluan dan menggunakan hujung ke -pembelajaran Pengukuhan akhir memberikan tindakan semasa yang harus dilakukan untuk membimbing perancangan gerakan (perancangan trajektori akhir) "

Pakar juga percaya bahawa senario berkelajuan tinggi berstruktur mungkin lebih mudah untuk diselesaikan oleh algoritma tradisional daripada. yang tidak berstruktur. Adegan bandar mungkin mempunyai lebih banyak ruang untuk memanfaatkan model AI.

Zhitu menggunakan algoritma pembelajaran tetulang dalam proses membuat keputusan bagi senario persimpangan tanjakan berkelajuan tinggi.

Dr. Yang Wenli, Ketua Pegawai Eksekutif Lingjun Technology, percaya bahawa kepentingan dan kebolehgunaan algoritma pembelajaran mendalam tidak betul-betul sama dalam modul pemanduan autonomi yang berbeza.

“Daripada proses persepsi-penyatuan-ramalan-keputusan-perancangan-kawalan, lebih awal bahagian, lebih baik kesan algoritma pembelajaran mendalam.”

Dr : "Sistem persepsi mempunyai sejumlah besar pemprosesan data, tetapi ia membenarkan ralat dan mempunyai toleransi tertentu untuk ketepatan dan ingatan (kerana gabungan dan pembuatan keputusan seterusnya boleh membetulkan ralat persepsi), jadi kaedah pembelajaran mendalam adalah lebih sesuai.

“Dalam bahagian membuat keputusan, peraturan dan pembelajaran masing-masing mempunyai kekuatan tersendiri, jadi kami menggunakan seni bina hibrid, menggunakan kaedah pembelajaran mendalam untuk meningkatkan prestasi dan menggunakan kaedah peraturan untuk memastikan keselamatan.

“Sistem kawalan mempunyai jumlah data yang kecil, keperluan yang kukuh untuk kebolehpercayaan, dan sama sekali tiada ruang untuk ralat Penggunaan algoritma pembelajaran mendalam bukan sahaja tidak dapat meningkatkan prestasi, tetapi juga mungkin menimbulkan ketidakpastian dan faktor yang tidak boleh dipercayai. jadi ia tidak sesuai untuk digunakan dalam algoritma pembelajaran mendalam. Selain itu, teknologi asas ini mempunyai sejarah 200 tahun, dan bukti matematiknya tidak perlu menggunakan pembelajaran mendalam kes kesilapan dalam algoritma perancangan, algoritma kawalan juga perlu selamat. Dalam PID algoritma kawalan klasik, untuk memastikan keselamatan, lapisan kawalan boleh menolak untuk melaksanakan "arahan yang salah" yang dikeluarkan oleh lapisan perancangan. Sebagai contoh, jika pelan mengeluarkan arahan untuk memandu kenderaan hingga 120 km/j, tetapi perkakasan kenderaan sendiri tidak dapat menyokong kelajuan 120 km/j, pada masa ini, algoritma kawalan boleh melakukan semakan dan terus menolak untuk melaksanakan. arahan untuk memastikan kenderaan boleh beroperasi seperti biasa tanpa terbalik.

Jika algoritma kawalan ingin menutup semua ralat, ia mesti menggunakan algoritma berasaskan peraturan untuk memastikan kebolehpercayaan.

Berdasarkan perkara ini, apabila ia berkaitan dengan "algoritma pembelajaran mendalam digunakan untuk pengawalseliaan dan kawalan", apa yang semua orang panggil "peraturan dan kawalan" sebenarnya merujuk terutamanya kepada ramalan, membuat keputusan dan perancangan, dan tidak termasuk kawalan.

Selain menyelesaikan masalah teknikal praktikal, algoritma pembelajaran mendalam juga mempunyai kelebihan besar yang tidak boleh diabaikan, iaitu menggunakan sepenuhnya pemproses khusus GPU atau rangkaian saraf untuk mengurangkan penggunaan kuasa pengkomputeran CPU.

Untuk melaksanakan fungsi tertentu, kod peraturan kompleks yang digunakan pada peringkat awal pembangunan pemanduan autonomi akan menggunakan banyak kuasa pengkomputeran CPU Walau bagaimanapun, reka bentuk cip on-board secara amnya cenderung untuk meningkatkan pengkomputeran kuasa pembelajaran mendalam, dan kuasa pengkomputeran bahagian CPU adalah terhad. Dengan menggantikan sejumlah besar algoritma berasaskan peraturan yang kompleks dengan algoritma pembelajaran mendalam, banyak kuasa pengkomputeran CPU boleh dijimatkan.

Pakar peraturan dan algoritma kawalan Qingzhou Zhihang percaya bahawa kenderaan pengeluaran besar-besaran NOA bandar biasanya menggunakan cip terbenam, dan CPU adalah berdasarkan seni bina ARM Sumber pengkomputeran CPU tidak boleh dibandingkan dengan kenderaan Demo L4 berdasarkan seni bina X86. Oleh itu, jika anda ingin mencapai pengalaman memandu yang hampir dengan L4, pembekal perlu cuba memperkenalkan algoritma pembelajaran mendalam dalam proses pengawalan dan kawalan dan meletakkan beban pengkomputeran pada pemproses khusus pembelajaran mendalam.

02 Pada peringkat ini, algoritma pembelajaran mendalam tidak boleh digunakan pada algoritma pengawalseliaan dan kawalan berskala besar

Memandangkan algoritma pembelajaran mendalam berbunyi begitu "sejuk", mengapa peraturan dan kawalan algoritma dalam amalan Bagaimana dengan masih memfokuskan pada peraturan dan bukannya algoritma pembelajaran mendalam?

Ini kerana algoritma pembelajaran mendalam juga mempunyai banyak kelemahan. Kelemahan inilah yang menyebabkan algoritma pembelajaran mendalam kurang berkesan daripada peraturan dalam jangka pendek.

1 Sukar untuk menilai sama ada tingkah laku pemanduan manusia "berbaloi untuk dipelajari"

Dalam dunia yang ideal, lebih banyak data digunakan untuk latihan, lebih baik algoritma pembelajaran mendalam Lebih baik kesannya, tetapi dalam beberapa kes, apabila jumlah data meningkat, kesan algoritma mungkin berkurangan. kenapa ni?

Algoritma pembelajaran mendalam mesti terlebih dahulu mempelajari tingkah laku pemanduan sebilangan besar pemandu manusia sebelum ia boleh digunakan untuk mengawal algoritma Walau bagaimanapun, masalahnya ialah pemandu yang berbeza mempunyai gaya pemanduan yang berbeza dan gaya pemanduan yang sama dalam situasi yang berbeza juga tidak konsisten sepenuhnya, jadi bagaimana untuk memastikan bahawa tingkah laku pemanduan manusia adalah data yang baik untuk dipelajari?

Sebagai contoh, apabila menukar lorong di persimpangan, kita tidak boleh menukar lorong di garisan pepejal semasa pemanduan biasa, tetapi ramai pemandu sering suka menukar lorong di garisan pepejal.

Pakar algoritma kawalan Pony.ai berkata: “Pemandu manusia juga mempunyai banyak tabiat buruk semasa memandu jika mereka hanya mengejar antropomorfisme secara membuta tuli dan mengabaikan tiga matlamat pengoptimuman utama sistem pemanduan autonomi: keselamatan, keselesaan dan kecekapan. Itu meletakkan kereta di hadapan kuda Malah, walaupun model AI digunakan untuk mengimbangi kelemahan algoritma tradisional, mereka harus diperbaiki di sekitar tiga dimensi ini.”

Oleh itu, dalam banyak kes, hanya pra-pembetulan diperlukan hanya apabila data "dibersihkan" algoritma pembelajaran mendalam boleh berfungsi dengan lebih baik. Walau bagaimanapun, bagaimana untuk memastikan kecekapan dan kualiti untuk pembersihan data masa nyata berskala besar? Ini adalah masalah.

Sebagai tindak balas kepada masalah ini, sesetengah syarikat telah menetapkan beberapa peraturan secara buatan untuk menilai sama ada pemandu memandu dengan baik atau tidak, dan kemudian menapis yang kelihatan buruk, tetapi Peraturan ini digunakan untuk "mengekang" secara mendalam pembelajaran; lebih-lebih lagi, pendekatan ini terlalu mudah dan kasar, dan mungkin seperti "membuang bayi dengan air mandian" dan secara tidak sengaja memadamkan beberapa data tingkah laku pemanduan yang berguna.

2. Algoritma pembelajaran mendalam lebih sukar untuk menghadapi perubahan permintaan daripada peraturan

Algoritma syarikat pemanduan autonomi tertentu menetapkan bahawa jarak selamat dari kenderaan dalam hadapan hendaklah disimpan semasa memandu di jalan raya Tidak kurang daripada lima meter. Pada suatu hari, pengurus produk mengemukakan keperluan baharu: apabila memandu secara normal di jalan raya, jarak selamat dari kenderaan di hadapan hendaklah ditukar daripada tidak kurang daripada lima meter kepada tidak kurang daripada sepuluh meter.

Keadaan ini akan mendedahkan masalah algoritma pembelajaran mendalam: jika jurutera ingin menukar model mengikut keperluan, mereka perlu melatih semula model, yang sangat mahal. Tetapi jika anda menggunakan algoritma berasaskan peraturan, ia sangat mudah pada masa ini, dan masalah itu boleh diselesaikan dengan beberapa baris kod.

Selain itu, jika kemalangan berlaku, sukar bagi algoritma pembelajaran mendalam untuk mengetahui dengan cepat di mana masalahnya dalam masa yang sesingkat mungkin seperti algoritma peraturan.

3 Kesan algoritma pembelajaran mendalam mungkin tidak sebaik peraturan

Pakar peraturan dan kawalan Qingzhou Zhihang berkata: Jika infrastruktur data tidak sempurna, Apabila. model AI diperkenalkan, prestasi model AI sukar untuk memenuhi jangkaan.

Sebagai contoh, jarak berikut ACC boleh ditentukan melalui penentukuran ujian mudah, tetapi mungkin sukar untuk mencapai kesan yang sama melalui model AI. Sebab utama ialah infrastruktur data banyak syarikat tidak sempurna dan tidak ada cara untuk mencari data yang pelbagai dalam senario mengikut kereta yang berbeza, menjadikannya sukar untuk melatih model yang memenuhi atau melebihi prestasi peraturan.

Pakar algoritma kawalan dari Hao Mo Zhixing juga berkata: "Kesan model AI semasa tidak sepenuhnya mengalahkan peraturan. Ia cuba untuk mempersonifikasikan orang tetapi kesannya tidak cukup baik kerana seni bina model dan input dan definisi keluaran rangkaian kognitif jenis ini Penyediaan data belum lengkap, dan ia belum mencapai tahap model persepsi Semua orang masih meneroka (tetapi saya fikir akan ada satu kejayaan besar dalam masa setahun). >

4. Pembelajaran mendalam masih memerlukan peraturan untuk membimbing mereka

Semasa proses memandu kenderaan di jalan raya, ralat dalam algoritma membuat keputusan tidak dapat dielakkan sepenuhnya. . Kerana walaupun seseorang itu memandu, tidak kira betapa baiknya pemandu berpengalaman itu, adalah mustahil untuk menjamin bahawa pembuatan keputusannya akan sentiasa betul sepenuhnya, dan perkara yang sama berlaku untuk algoritma membuat keputusan berdasarkan model pembelajaran mendalam.

Oleh itu, apabila mereka bentuk sistem, pembangun harus mempertimbangkan kemungkinan bahawa "algoritma membuat keputusan akan membuat kesilapan" dan "bersedia secara psikologi" untuk "menerima" potensi fakta bahawa algoritma membuat keputusan akan membuat kesilapan.

Dalam hal ini, Lingjun Technology menggunakan seni bina membuat keputusan hibrid, Ketua Pegawai Eksekutif syarikat Dr. Yang Wenli berkata bahawa “algoritma pembelajaran mendalam adalah baik untuk belajar daripada pengalaman pemanduan manusia, jadi ia digunakan terutamanya untuk meningkatkan prestasi. dan direka oleh pengaturcara. Peraturan telah diuji dan ditunjukkan sepenuhnya untuk memastikan keselamatan dan mempunyai keutamaan yang lebih tinggi "

Melihat lebih jauh ke bawah, lapisan perancangan juga boleh menolak "arahan yang salah" daripada membuat keputusan. Sebagai contoh, kelajuan input dan saiz halangan hendaklah dalam julat tertentu (contohnya, tidak boleh ada kereta dengan kelajuan 100m/s seperti "berlepas"); arahan "tukar lorong ke kiri", tetapi ini Apabila terdapat kereta di sebelah kiri, kerana tiada penyelesaian lengkap untuk perancangan ruang apabila menukar lorong pada masa ini, perancangan boleh secara langsung "enggan melaksanakan arahan".

Algoritma perancangan yang disebut di sini yang menolak "arahan yang salah" daripada pautan sebelumnya hanya boleh berdasarkan peraturan.

Berdasarkan perkara di atas, kita dapat melihat bahawa dalam senario di mana algoritma pembelajaran mendalam boleh digunakan, peraturan untuk memainkan peranan "cover-up" masih penting.

5 Pengenalan algoritma pembelajaran mendalam bermakna sejumlah besar kod perlu diganti

Terdapat juga isu yang sangat mencabar untuk syarikat pemanduan autonomi: jika peraturan hibrid akan digunakan Algoritma pasti akan menghadapi masalah sejumlah besar kod yang perlu diganti, dan berbuat demikian sudah pasti akan memerlukan "timbunan orang."

Pakar algoritma kawalan Qingzhou berkata bahawa sistem berasaskan peraturan tradisional tidak mempertimbangkan untuk menambah antara muka yang berkaitan dengan pembelajaran mendalam semasa mereka bentuk, dan asas kod telah agak kukuh selepas bertahun-tahun pembangunan Ia sangat mahal untuk membina semula kod untuk diperkenalkan pembelajaran mendalam. Gao,

“Tetapi Qingzhou Zhihang mengambil kira penggunaan AI yang meluas apabila ia mula membina susunan algoritma perancangan keputusan pada 2019, dan mempertimbangkan situasi selepas pengenalan model terlebih dahulu pada setiap antara muka tahap, dan membuat pelarasan struktur yang disasarkan."

Menurut pakar kanan yang pernah berkhidmat sebagai orang yang bertanggungjawab ke atas algoritma peraturan di sebuah syarikat Robotaxi terkemuka, selepas pengenalan pembelajaran mendalam dalam peraturan, beban kerja penulisan semula kod adalah sangat besar, kerana ia melibatkan dalam talian dan luar talian, simulasi dan transformasi sistem lain.

Pengarang telah banyak kali mendengar aduan daripada pengguna dalam industri Internet, mengapa pengaturcara perisian tertentu sentiasa memilih untuk menampal daripada membina semula sistem yang kembung. Contoh ini agak serupa dengan masalah yang dihadapi apabila menggantikan algoritma tadbir urus berasaskan peraturan dengan algoritma tadbir urus hibrid - faedah pemfaktoran semula adalah rendah.

Anda telah menulis semula Peningkatan tahap operasi sistem adalah terhad, tetapi anda perlu membayar kos yang besar untuknya mana-mana perusahaan "berat". Kebimbangan ini juga menjadikan syarikat pemanduan autonomi mempunyai mentaliti "hanya mahu menonton dari jauh, bukan mahu bermain-main dengan" algoritma kawalan hibrid.

Malah, selepas berkomunikasi dengan pengarah/jurutera algoritma kawalan beberapa syarikat pemanduan autonomi, penulis mendapati bahawa tidak seperti "adegan" apabila rangkaian neural pembelajaran mendalam digunakan pada persepsi pada 2014-2015, pada masa ini, semua orang secara amnya "tidak tergesa-gesa" tentang aplikasi algoritma pembelajaran mendalam dalam peraturan dan kawalan.

Boleh dikatakan setiap orang masih menjalankan pra-penyelidikan dan aplikasi praktikal dengan mentaliti "dispensable".

Untuk lebih spesifik, syarikat pemanduan autonomi mengetahui bahawa "algoritma kawalan hibrid" menggunakan peraturan + algoritma pembelajaran mendalam adalah masa hadapan, tetapi pada masa ini tidak banyak senario di mana algoritma kawalan hibrid boleh digunakan Hanya merekrut beberapa orang dan "biarkan mereka melakukan penyelidikan sendiri secara perlahan-lahan."

Oleh itu, pada peringkat ini, sikap kebanyakan syarikat pemacu autonomi terhadap algoritma kawalan hibrid ialah mereka hanya menggunakan algoritma kawalan hibrid apabila berhadapan dengan sedikit senario seperti tanjakan dan persimpangan pada masa lalu, algoritma berasaskan peraturan telah digunakan Sarung sudut yang telah diselesaikan oleh algoritma tidak akan dialihkan selagi tiada masalah "tidak boleh diterima" ditemui.

Seorang pakar dalam algoritma kawal selia juga berkata dengan terus terang bahawa sama ada untuk menggunakan algoritma kawal selia hibrid bergantung pada permintaan Ini adalah isu kejuruteraan.

Berdasarkan logik di atas, sikap semasa syarikat pemacu autonomi terhadap algoritma kawalan hibrid adalah "boleh diketepikan", dan skop penggunaan algoritma kawalan hibrid pada masa hadapan juga perlu "dipersoalkan."

03 Peraturan atau algoritma pembelajaran mendalam?

Mari kita teruskan perbincangan berdasarkan logik bahagian sebelumnya.

Ramai pakar percaya bahawa tidak kira betapa matang algoritma pembelajaran mendalam dan rangka kerja hibrid, kod peraturan akan sentiasa mengambil kira sebahagian besar algoritma kawalan dan algoritma pembelajaran mendalam hanya memainkan peranan sokongan.

Sebab utama yang mereka berikan ialah algoritma pembelajaran mendalam mempunyai ciri-ciri "tidak dapat dijelaskan". " untuk membiarkan ia memikul "tanggungjawab pertama" untuk peraturan.

Dr. Yang Wenli, Ketua Pegawai Eksekutif Rulingjun Technology, berkata: "Pembelajaran mendalam adalah kotak hitam. 'Senario' yang difahami oleh manusia mungkin berbeza daripada 'senario' yang difahami oleh pembelajaran mendalam. Terdapat contoh daripada diss kecerdasan buatan sebelum ini, dalam imej Jika anda menukar beberapa piksel, kecerdasan buatan akan mengecamnya salah; jika anda meletakkan beberapa pita hitam pada tanda lalu lintas, Tesla tidak akan mengenalinya Melainkan ia 'konsisten' pada piksel tahap, apa yang orang fikirkan sebagai 'adegan yang sama' tidak akan dikenali Dari perspektif pembelajaran mendalam, kemungkinan besar 'senario berbeza'

"Algoritma pembelajaran mendalam adalah berdasarkan pada pemasangan input. dan output, dan boleh mencapai antropomorfisme yang lebih baik daripada ciri-ciri input dan output, tetapi ia sebenarnya sangat sukar untuk memahami logik dalaman pemanduan. “Untuk menangani kemungkinan ralat dalam membuat keputusan menggunakan algoritma pembelajaran mendalam, kami menggunakan seni bina membuat keputusan hibrid.”

CTO syarikat tanpa pemandu kenderaan komersial dan pakar algoritma kawalan daripada kereta baharu- membuat kuasa juga mempunyai pandangan yang sama.

Pada acara pertukaran teknologi pada penghujung September, Horizon CTO Dr. Huang Chang turut bercakap tentang isu ini, tetapi Huang Chang percaya bahawa dalam algoritma peraturan hibrid, pembelajaran mendalam akan menjadi arus perdana, dan peraturan hanya akan Sebagai "bantuan yang diperlukan" - untuk mengelakkan ralat yang jelas dan boleh dijelaskan secara semantik. ”

Huang Chang menjelaskan bahawa berdasarkan pengalamannya, untuk sistem berasaskan peraturan yang telah diperhalusi selama bertahun-tahun dan ditala dengan baik, jika pembelajaran mendalam hanya diperkenalkan ke dalam modul tempatan tertentu, penambahbaikan akan menjadi sangat ketara, atau bahkan tiada peningkatan “Oleh kerana modul lain masih direka berdasarkan peraturan Dalam rangka kerja besar ini, jika anda menggantikan satu modul dengan algoritma pembelajaran mendalam, kos untuk menyesuaikan modul lain kepada modul baharu ini. sangat tinggi. Keseluruhan kitaran pengesahan adalah sangat panjang, terlalu lama sehingga anda tidak mempunyai kesabaran untuk menyelesaikannya. ”

Orang yang bertanggungjawab ke atas algoritma kawalan syarikat Robotaxi dan pakar algoritma kawalan Qingzhou juga percaya bahawa algoritma kawalan masa depan akan berdasarkan pembelajaran mendalam dan ditambah dengan peraturan.

Pakar Algoritma Perancangan dan Kawalan Qingzhou berkata di Qingzhou Zhihang, dalam proses ramalan, operasi berkaitan algoritma pembelajaran mendalam (termasuk pra-pemprosesan, penaakulan model dan pasca pemprosesan) menyumbang hampir 95% daripada keseluruhan masa berjalan modul Dalam pautan membuat keputusan dan perancangan, bahagian operasi algoritma pembelajaran mendalam juga telah mencapai kira-kira 30%.

“Bukan mudah untuk mengukurnya, tetapi secara umum, algoritma pembelajaran mendalam harus mencakupi 50%-60% daripada algoritma kawal selia.”

Dia percaya bahawa, pada akhirnya, peraturan akan berlaku 80%-90% daripada masa pengkomputeran algoritma kawalan akan dibelanjakan untuk algoritma pembelajaran mendalam. Selain itu, tidak seperti yang Dr. Yang Wenli sebutkan sebelum ini bahawa "tidak perlu menggunakan AI dalam algoritma kawalan asas," beliau percaya bahawa algoritma kawalan adalah berasaskan peraturan, tetapi model pembelajaran mendalam juga boleh digunakan untuk mengoptimumkan parameter kawalan dan meningkatkan kebolehsuaian algoritma.

Beliau menegaskan: "Adalah boleh difahami jika terdapat pertikaian sebelum ini dalam industri mengenai 'berasaskan AI' atau 'berasaskan peraturan', tetapi maklumat yang dikeluarkan oleh Tesla pada AI DAY terbarunya telah menunjukkan, Tesla's penggunaan meluas algoritma kawalan pembelajaran mendalam menunjukkan prestasi yang sangat baik, yang mencerminkan dari sisi bahawa "prinsip pertama" Musk juga boleh digunakan untuk algoritma kawalan berasaskan pembelajaran mendalam dalam erti kata: Jika manusia Sebagai rangkaian saraf yang kompleks, otak boleh belajar untuk memandu melalui sejumlah besar pengalaman, dan algoritma kawalan juga boleh menggunakan pembelajaran mendalam untuk memperoleh prestasi dan prestasi yang lebih baik "

Terdapat jurang yang besar dalam algoritma pembelajaran mendalam. Kontroversinya ialah "tidak dapat dijelaskan". Jadi. , jika adegan tertentu berubah daripada "tidak diketahui" kepada "diketahui", adakah kita perlu menambah peraturan lain pada algoritma untuk "menentukan"nya?

Mengenai soalan pengarang, pakar algoritma kawalan dari syarikat Robotaxi percaya bahawa adalah "boleh" untuk menentukan ketidakpastian pengecaman pemandangan AI melalui peraturan tetapi pakar Algoritma Kawalan Huang Chang dan Qingzhou percaya ia "tidak boleh dilaksanakan ” dan “tidak perlu.”

Huang Chang berkata: "Kami tidak boleh memaksa sistem ini 'boleh dijelaskan' - kerana apa yang dipanggil 'boleh dijelaskan' bermaksud menggunakan peraturan untuk mengekangnya, atau malah bergantung sepenuhnya pada peraturan, seperti sistem pakar. Hasilnya ialah, sistem yang berjalan lancar di bandar A masih memerlukan sejumlah besar jurutera untuk menyahpepijat apabila berjalan di bandar B lebih-lebih lagi, ia akan menjadikan kes sudut yang rumit dan tidak dapat diterangkan oleh peraturan buatan 'tidak dapat diselesaikan'.

Ia boleh dilihat bahawa memaksa sistem untuk "boleh ditafsir" kembali kepada "had peraturan" yang disebutkan dalam bahagian pertama artikel ini.

Huang Chang percaya bahawa apabila memperkenalkan algoritma pembelajaran mendalam ke dalam peraturan, kami tidak perlu terlalu risau sama ada sistem itu "boleh dijelaskan".

"Saya berkomunikasi dengan anda, saya boleh memahami anda sepenuhnya dan menaakul keseluruhan set logik anda, tetapi saya tidak tahu beberapa intuisi anda dan beberapa sifat tersembunyi ( Walaupun anda mungkin tidak. tahu), tetapi ini tidak menjejaskan keupayaan kami untuk membina kepercayaan dan berkomunikasi dengan lancar. Dengan cara yang sama, kami tidak perlu mengehadkan penerokaan kami terhadap sempadan aplikasi algoritma pembelajaran mendalam >

“Saya membaca beberapa siaran masa lalu, mengatakan bahawa perbezaan antara pembelajaran mendalam dan statistik klasik ialah statistik klasik masih cuba menggunakan model peraturan untuk menjadikan keseluruhan sistem 'boleh ditafsir', tetapi pembelajaran mendalam Menembusi ini, ia malah melampau untuk mengoptimumkan matlamat utama.

“Orang ramai akan membuat kesilapan, sistem peraturan akan melakukan kesilapan, dan sistem data juga akan melakukan kesilapan, tetapi dalam erti kata statistik yang luas, apabila skala data cukup besar, algoritma pembelajaran mendalam akan menjadi susunan magnitud lebih baik daripada sistem peraturan Oleh itu, kita boleh menggunakannya dengan yakin

"Atas dasar ini, kita boleh memvisualisasikan perkara seperti model persekitaran supaya orang ramai dapat memahaminya, dan kemudian memperkenalkan sebilangan kecil peraturan yang diperlukan untuk mengekang kedalaman dalam peringkat terakhir perancangan. Pelajari algoritma dan itu sudah cukup. ”

Huang Chang percaya bahawa dalam era algoritma 2.0, AI mempunyai keupayaan untuk melengkapkan penyesuaian diri Oleh itu, syarikat pemanduan autonomi mungkin perlu mereka bentuk beberapa "algoritma di atas algoritma" supaya ia boleh membantu. algoritma asas menjadi lebih cekap Mengulang dan menyesuaikan diri dengan baik dalam senario aplikasi

Pakar algoritma kawalan Qingzhou percaya bahawa seperti yang disebutkan oleh pengarang, "apabila senario berubah daripada tidak diketahui kepada diketahui, gunakan peraturan untuk menyediakan pelan tindak balas." Idea "mendefinisikannya" sukar untuk dipraktikkan, kerana adegan dalam realiti sering diselaraskan secara dinamik - ia mungkin jelas pada mulanya, tetapi apabila ia berubah, ia menjadi "kabur", jadi sangat sukar untuk Sukar untuk menerangkannya dengan jelas dengan peraturan

Mengenai "ketidakjelasan" algoritma pembelajaran mendalam, jawapan beliau ialah: "Ramai orang akan mengatakan bahawa pembelajaran mendalam adalah 'tidak dapat dijelaskan', tetapi sebenarnya, jika anda melihat dengan teliti . Reka algoritma pembelajaran mendalam anda supaya ia boleh mencapai kesan 'kebolehtafsiran', malah kebolehjelasan ini mungkin lebih kuat daripada peraturan. ”

Dia memberikan contoh ini: kenderaan pandu sendiri membelok ke kanan di persimpangan dan perlu mengelak kereta bergerak lurus Pada masa ini, sukar untuk menggunakan peraturan untuk menentukan secara menyeluruh kelajuan kenderaan yang bergerak lurus jarak antara kedua-dua kenderaan. Apakah langkah-langkah yang perlu diambil oleh sistem pemanduan autonomi pada masa apa Tetapi jika algoritma pembelajaran mendalam digunakan, selagi kedudukan dan status kereta pandu sendiri dan halangan yang berpotensi (melalui kenderaan) adalah. diberikan, serta beberapa maklumat alam sekitar dan sejarah yang berkaitan, rangkaian saraf terlatih Anda boleh mengira kebarangkalian masing-masing "anda benarkan saya" atau "Saya benarkan anda" Ini adalah idea yang sama seperti apabila orang membuat keputusan semasa memandu. "Kebarangkalian lebih mudah untuk dijelaskan daripada peraturan."

Setelah mengatakan ini, penulis memikirkan topik yang mungkin tidak berkaitan langsung dengan topik artikel ini, tetapi sangat berkaitan - apakah "intuisi" manusia ?

Saya sering melihat orang yang melakukan penyelidikan pengurusan perniagaan mengatakan bahawa usahawan sering bergantung bukan pada penyelidikan tetapi pada gerak hati pada saat-saat genting apabila membuat keputusan mengenai perkara utama. Beberapa orang boleh menerangkan dengan jelas apakah gerak hati ini, tetapi penulis merasakan bahawa "intuisi" ini sebenarnya adalah "algoritma pembelajaran mendalam" yang dipacu data.

Apa yang dipanggil "ketepatan intuitif" bukanlah bakat di belakangnya adalah maklumat terkumpul dan kognisi yang terbentuk atas dasar ini. Sama seperti analisis data besar, terdapat korelasi antara kesimpulan dan maklumat, tetapi tidak ada hubungan sebab akibat, atau hubungan sebab akibat tidak langsung atau cukup jelas, dan sukar bagi orang untuk menjelaskannya dengan jelas dengan logik, jadi mereka menyebutnya " gerak hati."

Dalam pengertian ini, kita tidak perlu memaksa algoritma pembelajaran mendalam untuk "boleh ditafsir".

Walau bagaimanapun, pakar algoritma kawalan Hao Mo Zhixing percaya bahawa walaupun sebilangan besar model AI digunakan untuk kognisi, ia mestilah berasaskan senario dan mesti mempunyai "niat dan makna" yang jelas dan boleh ditafsir "Ini prinsip kami."

Pakar itu berkata: “Kekuatan pembelajaran mendalam ialah ia boleh menyesuaikan diri dengan keadaan yang berubah-ubah dan boleh memberikan penyelesaian dengan cepat dalam pelbagai persekitaran yang kompleks Namun, ciri kotak hitamnya kadangkala membawa kepada penyelesaian yang salah, dan peraturan-. berdasarkan Algoritma sebenarnya adalah mengenai 'Saya tahu, saya tahu' dan 'Saya tahu, saya tidak tahu' Kemungkinan ia memberikan penyelesaian yang betul kepada adegan kompleks 'tidak diketahui' adalah lebih rendah daripada kaedah pembelajaran mendalam, tetapi 'Saya tidak dapat melakukannya dengan betul'. Jawapannya tidak menjejaskan pertimbangan saya sama ada ia betul atau salah selepas melihatnya, AI adalah kuasa utama dalam menjawab soalan, dan peraturan bertanggungjawab untuk pengesahan "

Pakar algoritma Pony.ai percaya bahawa pada peringkat ini, sukar bagi algoritma pembelajaran mendalam untuk memastikan keselamatan, jadi untuk masa yang lama pada masa hadapan, algoritma tradisional dan pembelajaran mendalam perlu digabungkan.

Pakar algoritma pengawalseliaan berkata: “Kami percaya bahawa L2 berkemungkinan mencapai keadaan yang didominasi AI, kerana AI tidak perlu menangani semua kes sudut – lagipun, masih ada pemandu yang boleh menyediakan jaminan keselamatan akhir. , perkongsian Tesla pada Hari AI juga menggambarkan perkara ini

"Tetapi algoritma L4 tidak mungkin berasaskan AI untuk masa yang lama. Sebab utamanya adalah kebolehtafsiran dan keupayaan untuk mengendalikan kes sudut dengan risiko keselamatan bagaimanapun, dengan kemajuan teknologi, kami percaya bahawa akan terdapat lebih banyak bahagian AI dalam algoritma.

“Malah, algoritma perancangan dan kawalan tradisional bukanlah satu kumpulan peraturan Perancangan dan algoritma kawalan tradisional yang baik adalah lebih kepada model matematik yang disarikan daripada ringkasan senario - menggunakan alat matematik yang berbeza untuk. membina masalah perancangan. Model ini diselesaikan melalui pengoptimuman, yang mempunyai keupayaan untuk mencirikan intipati masalah dan pada asasnya memastikan keselamatan dalam skop teori

" Oleh itu, pengenalan pembelajaran mendalam tidak melibatkan banyak perkara daripada penulisan semula kod , ia sepatutnya lebih kepada cara menggabungkan algoritma tradisional dan pembelajaran mendalam, dan menggunakan algoritma tradisional untuk memastikan keselamatan pemanduan. Boleh dikatakan bahawa algoritma kawalan tradisional dan model AI bukanlah satu perhubungan penggantian yang mudah juga pembangunan algoritma langkah demi langkah Tidak perlu membelanjakan banyak wang untuk menggantikan kod peraturan dengan model AI sekali, tetapi secara langkah demi langkah. ”

Seorang arkitek daripada OEM membuat cadangan: jalankan algoritma berasaskan peraturan dalam sistem utama dan algoritma pembelajaran mendalam dalam mod bayangan sehingga kesan latihan algoritma pembelajaran mendalam melebihi peraturan algoritma pembelajaran mendalam digunakan ke dalam sistem utama

Lampiran dua kes tentang aplikasi algoritma pembelajaran mendalam dalam kawalan pemanduan autonomi

1 algoritma pembelajaran

Aplikasi pembuatan keputusan dipacu data oleh Zhijia juga telah melalui proses peralihan daripada pembuatan keputusan berasaskan peraturan kepada peraturan + pembuatan keputusan hibrid data Cui Di, ketua saintis Teknologi Zhijia Xiao Zeng berkata bahawa mereka percaya bahawa masa pertukaran lorong sangat sesuai untuk menggunakan algoritma pembelajaran mendalam untuk membantu membuat keputusan

Oleh kerana logistik batang mempunyai keperluan yang sangat tinggi pada ketepatan masa dan penggunaan bahan api. satu tangan, perubahan lorong yang tidak sesuai akan menyebabkan pemandu menggunakannya. Perkadaran fungsi menukar lorong automatik telah dikurangkan Sebaliknya, algoritma penukaran lorong berasaskan peraturan adalah konservatif jika arahan "perubahan lorong" hanya dicetuskan apabila kelajuan kenderaan di hadapan terlalu rendah, ia akan membawa kepada brek yang lebih seterusnya, yang akan membawa keseluruhan Kehilangan ketepatan masa dan penggunaan bahan api Untuk mengurangkan penggunaan bahan api, sistem pemanduan autonomi mengumpul data untuk memerhatikan cara pemandu membuat keputusan , dan kemudian mengkaji lebih banyak keputusan mengubah lorong seperti manusia Penyelesaian ini telah melalui dua peringkat 🎜>

Peringkat pertama ialah apabila perubahan lorong membuat keputusan ditukar daripada borang "cetusan sendiri" pemandu kepada "syor sistem". Pada peringkat ini, jurutera akan terus mengkaji mengapa pemandu membuat keputusan menukar lorong pada titik tertentu, dan kemudian merumuskan peraturan yang disyorkan untuk menukar lorong. Selepas sistem memberikan cadangan pertukaran lorong, jika pemandu membenarkan pertukaran lorong, sistem menganggap keputusan pada masa ini adalah sesuai Jika pemandu berpendapat bahawa pertukaran lorong tidak perlu dibuat pada masa ini, pemandu tidak perlu untuk menerima pakai cadangan pertukaran lorong.

Pada peringkat kedua, jurutera juga akan mengumpul data mengenai penukaran lorong manual dalam senario yang berbeza, dan menggabungkannya dengan data yang dikumpul pada peringkat pertama pada senario di mana keputusan menukar lorong sistem dan keputusan menukar lorong pemandu adalah tidak konsisten (seperti apabila pemandu mencetuskan pertukaran lorong, sistem tidak dicetuskan; atau sistem mencetuskan pertukaran lorong, tetapi pemandu tidak mengguna pakainya) untuk pelabelan dan latihan model, model keputusan pertukaran lorong diperoleh, perancangan asal dan algoritma kawalan sistem dipertingkatkan, dan prestasi penjimatan bahan api dipertingkatkan lagi.

2 Qingzhou Zhihang: Menggunakan algoritma pembelajaran mendalam untuk meningkatkan "antropomorfisme" sistem

Menurut ramalan dan pakar kawalan Qingzhou Zhihang, pada peringkat ini, Qingzhou's algoritma kawalan menyimpan sejumlah besar antara muka untuk pembelajaran mendalam dan secara aktif membangunkan algoritma kawalan pembelajaran mendalam. Matlamat utama seni bina algoritma perancangan dan kawalan keseluruhan Qingzhou Zhihang adalah untuk mencapai AI First (keutamaan algoritma pembelajaran mendalam), biarkan model melakukan kebanyakan output tingkah laku, dan kemudian menggunakan peraturan untuk melengkapkannya (peraturan terutamanya berkaitan dengan keselamatan isu).

Qingzhou Zhihang percaya bahawa keupayaan pengawalseliaan dan kawalan akan menjadi manifestasi penting bagi pembezaan fungsi NOA bandar. Pada masa ini, Qingzhou Zhihang telah mula cuba menggunakan AI sebanyak mungkin dalam aspek pengawalseliaan dan kawalan pelan NOA bandar, supaya sistem membuat keputusan boleh "dekat dengan manusia" dalam kebanyakan kes dan "di luar manusia" dalam kes yang melampau.

Sebagai contoh, Qingzhou sudah mempunyai algoritma pembelajaran mendalam khusus untuk mengendalikan senario perancangan utama tertentu yang akan dihadapi apabila menggunakan NOA bandar, seperti pemasaan pertukaran lorong, pemasaan cantum tanjakan dan permainan persimpangan.

Untuk memastikan kebolehramalan dan kebolehkawalan algoritma pembelajaran mendalam, Qingzhou Zhihang akan menetapkan pengesahan pada input dan output untuk memastikan sama ada data input memenuhi keperluan reka bentuk semasa. Pada peringkat input, peraturan akan digunakan untuk memilih senario yang boleh digunakan untuk algoritma pembelajaran mendalam untuk memastikan rasional input model dan mengehadkan model untuk dijalankan dalam skop masalah yang direka bentuk, peraturan juga akan digunakan sahkan output untuk memastikan Output mencapai kesan pratetap. Pada masa yang sama, jika anda menghadapi adegan yang model tidak dapat mengendalikan dengan baik, anda juga boleh merekod titik masa dan maklumat berkaitan adegan secara automatik, dan kemudian mengemas kini model melalui gelung tertutup data untuk menjadikan model mempunyai keupayaan generalisasi yang lebih kukuh dan menyesuaikan diri dengan lebih banyak adegan.

Pada masa ini, di Qingzhou Zhihang, teknologi menjana "trajektori masa depan yang mungkin" kenderaan melalui pembelajaran mendalam (seperti pembelajaran tiruan atau pembelajaran pengukuhan) ia dilatih dengan mengumpul sejumlah besar daripada trajektori pemanduan pakar, kini trajektori yang dihasilkan oleh model tidak perlu diubah suai dalam 90% kes, tetapi dalam 10% kes, trajektori yang dijana oleh pembelajaran mendalam mungkin tidak berkesan atau menimbulkan risiko keselamatan kes ini, rangka kerja diperlukan untuk Membetulkan/mengubah suainya. Qingzhou menggunakan algoritma gabungan ruang-masa yang dipelopori secara domestik (algoritma berdasarkan pengoptimuman berangka) untuk memperhalusi trajektori yang dijana oleh pembelajaran mendalam.

Pakar algoritma perancangan dan kawalan Qingzhou berkata bahawa algoritma perancangan bersama ruang masa lebih sesuai digunakan bersama dengan algoritma pembelajaran mendalam berbanding pemisahan mendatar dan menegak tradisional. Kerana trajektori itu sendiri yang dihasilkan oleh algoritma pembelajaran mendalam sebenarnya adalah trajektori bersama ruang dan masa ini bukan sahaja mengandungi maklumat kedudukan, kelajuan dan arah, tetapi juga maklumat masa. Oleh itu, algoritma perancangan bersama spatio-temporal boleh disepadukan dengan lebih baik dengan hasil model, dan dengan itu boleh menambah perlindungan keselamatan dengan lancar kepada algoritma pembelajaran mendalam.

Atas ialah kandungan terperinci Sepuluh Ribu Perkataan Tafsiran Aplikasi Algoritma Pembelajaran Mendalam dalam Peraturan dan Kawalan Pemanduan Autonomi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!