Ringkasan pengalaman 15 tahun sebagai arkitek perisian: Dalam bidang ML, lima masalah yang dihadapi oleh pemula-AI-php.cn

Jadual Kandungan

Dalam bidang pembelajaran mesin, adakah anda telah melangkah ke atas 5 perangkap ini?

1. Normalisasi data tidak digunakan jika diperlukan

2 Berfikir bahawa lebih banyak ciri, lebih baik

3. Gunakan model berasaskan pokok apabila ekstrapolasi diperlukan

4. Gunakan penormalan data di mana ia tidak diperlukan

5. Maklumat kebocoran antara latihan dan set pengesahan/ujian

Rumah

Peranti teknologi

Ringkasan pengalaman 15 tahun sebagai arkitek perisian: Dalam bidang ML, lima masalah yang dihadapi oleh pemula

王林

Apr 11, 2023 pm 07:31 PM

pembelajaran mesin data

Sains data dan pembelajaran mesin menjadi semakin popular, dan bilangan orang dalam bidang ini semakin meningkat setiap hari. Ini bermakna terdapat ramai saintis data yang tidak mempunyai banyak pengalaman membina model pembelajaran mesin pertama mereka, dan di sinilah kesilapan boleh berlaku.

Baru-baru ini, arkitek perisian, saintis data dan pakar Kaggle Agnis Liukis menulis artikel yang mana beliau bercakap tentang cara menyelesaikan beberapa kesilapan pemula yang paling biasa dalam skema pembelajaran mesin pemula memahami dan mengelakkannya.

Ringkasan pengalaman 15 tahun sebagai arkitek perisian: Dalam bidang ML, lima masalah yang dihadapi oleh pemula

Dengan lebih 15 tahun pengalaman seni bina dan pembangunan perisian, Agnis Liukis mahir dalam Bahasa seperti Java, JavaScript, Spring Boot, React.JS dan Python. Selain itu, Liukis juga berminat dalam sains data dan pembelajaran mesin Dia telah menyertai pertandingan Kaggle berkali-kali dan mencapai keputusan yang baik, dan telah mencapai tahap induk pertandingan Kaggle.

Berikut ialah kandungan artikel:

Dalam bidang pembelajaran mesin, adakah anda telah melangkah ke atas 5 perangkap ini?

1. Normalisasi data tidak digunakan jika diperlukan

Normalkan data, kemudian dapatkan ciri dan masukkannya ke dalam model , sangat mudah untuk membiarkan model membuat ramalan. Tetapi dalam beberapa kes, hasil pendekatan mudah ini boleh mengecewakan kerana ia kehilangan bahagian yang sangat penting.

Sesetengah jenis model memerlukan penormalan data, seperti regresi linear, rangkaian neural klasik, dsb. Model jenis ini menggunakan nilai ciri untuk mendarabkan berat nilai latihan. Dalam kes ciri yang tidak dinormalkan, julat yang mungkin bagi satu nilai ciri mungkin berbeza daripada julat yang mungkin bagi nilai ciri yang lain.

Andaikan nilai satu ciri berada dalam julat [0, 0.001] dan nilai ciri lain berada dalam julat [100000, 200000]. Untuk model yang menjadikan dua ciri sama penting, berat ciri pertama akan menjadi 100 juta kali lebih besar daripada berat ciri kedua. Berat yang besar boleh menyebabkan masalah serius untuk model, seperti apabila terdapat beberapa kelebihan. Tambahan pula, menganggarkan kepentingan pelbagai ciri menjadi sukar kerana berat yang besar mungkin bermakna ciri itu penting, tetapi ini juga mungkin bermakna nilai cirinya adalah kecil.

Selepas normalisasi, nilai semua ciri berada dalam julat yang sama, biasanya [0, 1] atau [-1, 1]. Dalam kes ini, pemberat akan berada dalam julat yang sama dan hampir sepadan dengan kepentingan sebenar setiap ciri.

Secara keseluruhan, menggunakan penormalan data di mana diperlukan akan menghasilkan ramalan yang lebih baik dan tepat.

2 Berfikir bahawa lebih banyak ciri, lebih baik

Sesetengah orang mungkin berpendapat bahawa menambah semua ciri adalah idea yang baik, memikirkan bahawa model akan memilih dan menggunakan secara automatik. ciri terbaik. Malah, idea ini sukar untuk menjadi kenyataan.

Semakin banyak ciri yang dimiliki oleh model, semakin besar risiko pemasangan berlebihan. Walaupun dalam data rawak sepenuhnya, model ini dapat mencari beberapa ciri (isyarat), walaupun kadangkala ia lebih lemah dan kadangkala ia lebih kuat. Sudah tentu, tiada isyarat sebenar dalam bunyi rawak. Tetapi jika kita mempunyai lajur bising yang mencukupi, model mungkin menggunakan sebahagian daripadanya berdasarkan isyarat kerosakan yang dikesan. Apabila ini berlaku, kualiti ramalan model akan merosot kerana sebahagiannya berdasarkan hingar rawak.

Terdapat banyak teknik untuk membantu kami dengan pemilihan ciri. Tetapi anda perlu ingat bahawa anda perlu menerangkan setiap ciri yang anda miliki dan sebab ciri itu akan membantu model anda.

3. Gunakan model berasaskan pokok apabila ekstrapolasi diperlukan

Model berasaskan pokok mudah digunakan dan berkuasa, itulah sebabnya ia popular . Walau bagaimanapun, dalam beberapa kes mungkin salah untuk menggunakan model berasaskan pokok.

Model berasaskan pokok tidak boleh diekstrapolasi, nilai ramalan model ini tidak akan lebih besar daripada nilai maksimum dalam data latihan dan nilai output dalam latihan tidak akan pernah lebih kecil daripada nilai ramalan nilai minimum.

Dalam sesetengah tugas, kebolehan untuk mengekstrapolasi boleh menjadi sangat penting. Sebagai contoh, jika model meramalkan harga saham, harga saham mungkin lebih tinggi pada masa hadapan berbanding sebelum ini. Dalam kes ini, model berasaskan pokok tidak akan berguna secara langsung kerana ramalannya hampir melebihi harga sejarah tertinggi.

Terdapat pelbagai penyelesaian untuk masalah ini, satu penyelesaian adalah dengan meramalkan perubahan atau perbezaan dan bukannya meramalkan nilai secara langsung. Penyelesaian lain ialah menggunakan pelbagai jenis model untuk tugasan tersebut. Regresi linear atau rangkaian saraf boleh melakukan ekstrapolasi.

4. Gunakan penormalan data di mana ia tidak diperlukan

Artikel sebelumnya bercakap tentang keperluan penormalan data, tetapi ini tidak selalunya model berasaskan pokok tidak memerlukan data . Rangkaian saraf juga mungkin tidak memerlukan normalisasi eksplisit, kerana sesetengah rangkaian sudah menyertakan lapisan normalisasi secara dalaman, seperti operasi BatchNormalization perpustakaan Keras.

Dalam sesetengah kes, regresi linear pun mungkin tidak memerlukan penormalan data, yang bermaksud bahawa semua ciri sudah berada dalam julat nilai yang sama dan mempunyai makna yang sama. Sebagai contoh, jika model digunakan pada data siri masa dan semua ciri adalah nilai sejarah parameter yang sama.

5. Maklumat kebocoran antara latihan dan set pengesahan/ujian

Menyebabkan kebocoran data lebih mudah daripada yang orang fikirkan, pertimbangkan coretan kod berikut:

Ringkasan pengalaman 15 tahun sebagai arkitek perisian: Dalam bidang ML, lima masalah yang dihadapi oleh pemula

Contoh Ciri Kebocoran Data

Sebenar Kedua-dua ciri (sum_feature dan diff_feature) adalah tidak betul. Mereka membocorkan maklumat kerana selepas berpecah kepada set kereta api/ujian, bahagian dengan data latihan akan mengandungi beberapa maklumat daripada ujian. Ini akan menghasilkan skor pengesahan yang lebih tinggi, tetapi prestasi yang lebih buruk apabila digunakan pada model data sebenar.

Pendekatan yang betul adalah dengan mengasingkan set latihan/set ujian dahulu dan kemudian menggunakan fungsi penjanaan ciri. Secara amnya, ia adalah corak kejuruteraan ciri yang baik untuk memproses set latihan dan set ujian secara berasingan.

Dalam sesetengah kes, anda mungkin perlu menghantar beberapa maklumat antara kedua-duanya - contohnya, kami mungkin mahu menggunakan StandardScaler yang sama pada kedua-dua set ujian dan set latihan.

Secara keseluruhan, adalah baik untuk belajar daripada kesilapan anda, dan saya harap contoh kesilapan yang disediakan di atas akan membantu anda.

Atas ialah kandungan terperinci Ringkasan pengalaman 15 tahun sebagai arkitek perisian: Dalam bidang ML, lima masalah yang dihadapi oleh pemula. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Repo: Cara menghidupkan semula rakan sepasukan

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: Cara mendapatkan biji gergasi

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Berapa lama masa yang diperlukan untuk mengalahkan fiksyen berpecah?

3 minggu yang lalu By DDD

R.E.P.O. Simpan Fail Lokasi: Di manakah & bagaimana untuk melindunginya?

3 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7333

Tutorial Java

1627

Tutorial CakePHP

1351

Tutorial Laravel

1262

Tutorial PHP

1209

Tunjukkan Lagi

Related knowledge

Artikel ini akan membawa anda memahami SHAP: penjelasan model untuk pembelajaran mesin Jun 01, 2024 am 10:58 AM

Dalam bidang pembelajaran mesin dan sains data, kebolehtafsiran model sentiasa menjadi tumpuan penyelidik dan pengamal. Dengan aplikasi meluas model yang kompleks seperti kaedah pembelajaran mendalam dan ensemble, memahami proses membuat keputusan model menjadi sangat penting. AI|XAI yang boleh dijelaskan membantu membina kepercayaan dan keyakinan dalam model pembelajaran mesin dengan meningkatkan ketelusan model. Meningkatkan ketelusan model boleh dicapai melalui kaedah seperti penggunaan meluas pelbagai model yang kompleks, serta proses membuat keputusan yang digunakan untuk menerangkan model. Kaedah ini termasuk analisis kepentingan ciri, anggaran selang ramalan model, algoritma kebolehtafsiran tempatan, dsb. Analisis kepentingan ciri boleh menerangkan proses membuat keputusan model dengan menilai tahap pengaruh model ke atas ciri input. Anggaran selang ramalan model

Kenal pasti overfitting dan underfitting melalui lengkung pembelajaran Apr 29, 2024 pm 06:50 PM

Artikel ini akan memperkenalkan cara mengenal pasti pemasangan lampau dan kekurangan dalam model pembelajaran mesin secara berkesan melalui keluk pembelajaran. Underfitting dan overfitting 1. Overfitting Jika model terlampau latihan pada data sehingga ia mempelajari bunyi daripadanya, maka model tersebut dikatakan overfitting. Model yang dipasang terlebih dahulu mempelajari setiap contoh dengan sempurna sehingga ia akan salah mengklasifikasikan contoh yang tidak kelihatan/baharu. Untuk model terlampau, kami akan mendapat skor set latihan yang sempurna/hampir sempurna dan set pengesahan/skor ujian yang teruk. Diubah suai sedikit: "Punca overfitting: Gunakan model yang kompleks untuk menyelesaikan masalah mudah dan mengekstrak bunyi daripada data. Kerana set data kecil sebagai set latihan mungkin tidak mewakili perwakilan yang betul bagi semua data. 2. Underfitting Heru

Daya hidup kecerdasan super membangkitkan! Tetapi dengan kedatangan AI yang mengemas kini sendiri, ibu tidak perlu lagi bimbang tentang kesesakan data Apr 29, 2024 pm 06:55 PM

Saya menangis hingga mati. Dunia sedang membina model besar. Data di Internet tidak mencukupi. Model latihan kelihatan seperti "The Hunger Games", dan penyelidik AI di seluruh dunia bimbang tentang cara memberi makan data ini kepada pemakan yang rakus. Masalah ini amat ketara dalam tugas berbilang modal. Pada masa mereka mengalami kerugian, pasukan pemula dari Jabatan Universiti Renmin China menggunakan model baharu mereka sendiri untuk menjadi yang pertama di China untuk menjadikan "suapan data yang dijana model itu sendiri" menjadi kenyataan. Selain itu, ia merupakan pendekatan serampang dua mata dari segi pemahaman dan sisi penjanaan Kedua-dua pihak boleh menjana data baharu berbilang modal yang berkualiti tinggi dan memberikan maklum balas data kepada model itu sendiri. Apakah model? Awaker 1.0, model berbilang modal besar yang baru sahaja muncul di Forum Zhongguancun. Siapa pasukan itu? Enjin Sophon. Diasaskan oleh Gao Yizhao, pelajar kedoktoran di Sekolah Kecerdasan Buatan Hillhouse Universiti Renmin.

Kelajuan Internet Data Selular Perlahan pada iPhone: Pembetulan May 03, 2024 pm 09:01 PM

Menghadapi ketinggalan, sambungan data mudah alih perlahan pada iPhone? Biasanya, kekuatan internet selular pada telefon anda bergantung pada beberapa faktor seperti rantau, jenis rangkaian selular, jenis perayauan, dsb. Terdapat beberapa perkara yang boleh anda lakukan untuk mendapatkan sambungan Internet selular yang lebih pantas dan boleh dipercayai. Betulkan 1 – Paksa Mulakan Semula iPhone Kadangkala, paksa memulakan semula peranti anda hanya menetapkan semula banyak perkara, termasuk sambungan selular. Langkah 1 – Hanya tekan kekunci naikkan kelantangan sekali dan lepaskan. Seterusnya, tekan kekunci Turun Kelantangan dan lepaskannya semula. Langkah 2 - Bahagian seterusnya proses adalah untuk menahan butang di sebelah kanan. Biarkan iPhone selesai dimulakan semula. Dayakan data selular dan semak kelajuan rangkaian. Semak semula Betulkan 2 – Tukar mod data Walaupun 5G menawarkan kelajuan rangkaian yang lebih baik, ia berfungsi lebih baik apabila isyarat lemah

Tentera Udara A.S. mempamerkan jet pejuang AI pertamanya dengan profil tinggi! Menteri secara peribadi menjalankan pandu uji tanpa campur tangan semasa keseluruhan proses, dan 100,000 baris kod telah diuji selama 21 kali. May 07, 2024 pm 05:00 PM

Baru-baru ini, bulatan tentera telah terharu dengan berita: jet pejuang tentera AS kini boleh melengkapkan pertempuran udara automatik sepenuhnya menggunakan AI. Ya, baru-baru ini, jet pejuang AI tentera AS telah didedahkan buat pertama kali, mendedahkan misterinya. Nama penuh pesawat pejuang ini ialah Variable Stability Simulator Test Aircraft (VISTA). Ia diterbangkan sendiri oleh Setiausaha Tentera Udara AS untuk mensimulasikan pertempuran udara satu lawan satu. Pada 2 Mei, Setiausaha Tentera Udara A.S. Frank Kendall berlepas menggunakan X-62AVISTA di Pangkalan Tentera Udara Edwards Ambil perhatian bahawa semasa penerbangan selama satu jam, semua tindakan penerbangan telah diselesaikan secara autonomi oleh AI! Kendall berkata - "Sejak beberapa dekad yang lalu, kami telah memikirkan tentang potensi tanpa had pertempuran udara-ke-udara autonomi, tetapi ia sentiasa kelihatan di luar jangkauan." Namun kini,

Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Jun 03, 2024 pm 01:25 PM

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

AI yang boleh dijelaskan: Menerangkan model AI/ML yang kompleks Jun 03, 2024 pm 10:08 PM

Penterjemah |. Disemak oleh Li Rui |. Chonglou Model kecerdasan buatan (AI) dan pembelajaran mesin (ML) semakin kompleks hari ini, dan output yang dihasilkan oleh model ini adalah kotak hitam – tidak dapat dijelaskan kepada pihak berkepentingan. AI Boleh Dijelaskan (XAI) bertujuan untuk menyelesaikan masalah ini dengan membolehkan pihak berkepentingan memahami cara model ini berfungsi, memastikan mereka memahami cara model ini sebenarnya membuat keputusan, dan memastikan ketelusan dalam sistem AI, Amanah dan akauntabiliti untuk menyelesaikan masalah ini. Artikel ini meneroka pelbagai teknik kecerdasan buatan (XAI) yang boleh dijelaskan untuk menggambarkan prinsip asasnya. Beberapa sebab mengapa AI boleh dijelaskan adalah penting Kepercayaan dan ketelusan: Untuk sistem AI diterima secara meluas dan dipercayai, pengguna perlu memahami cara keputusan dibuat

See all articles