Panduan Terminologi Pembelajaran Mesin Komprehensif-Tutorial Python-php.cn

Comprehensive Machine Learning Terminology Guide

pengenalan

Selamat datang ke Panduan Terminologi Pembelajaran Mesin Komprehensif! Sama ada anda pendatang baru dalam bidang pembelajaran mesin atau pengamal berpengalaman yang ingin menyempurnakan perbendaharaan kata anda, panduan ini direka bentuk untuk menjadi sumber rujukan anda untuk memahami istilah dan konsep utama yang membentuk asas ML.

Konsep Asas

Pembelajaran Mesin (ML): Subset kecerdasan buatan yang memfokuskan pada membina sistem yang boleh belajar daripada dan membuat keputusan berdasarkan data.

Kecerdasan Buatan (AI): Bidang yang lebih luas untuk mencipta mesin pintar yang boleh mensimulasikan keupayaan pemikiran dan tingkah laku manusia.

Pembelajaran Mendalam: Subset pembelajaran mesin berdasarkan rangkaian saraf tiruan dengan berbilang lapisan.

Set Data: Koleksi data yang digunakan untuk latihan dan menguji model pembelajaran mesin.

Ciri: Sifat boleh diukur individu atau ciri fenomena yang diperhatikan.

Label: Pembolehubah sasaran yang kami cuba ramalkan dalam pembelajaran diselia.

Model: Perwakilan matematik proses dunia sebenar, dipelajari daripada data.

Algoritma: Prosedur atau formula langkah demi langkah untuk menyelesaikan masalah.

Latihan: Proses mengajar model untuk membuat ramalan atau keputusan berdasarkan data.

Inferens: Menggunakan model terlatih untuk membuat ramalan pada data baharu yang tidak kelihatan.

Jenis Pembelajaran Mesin

Pembelajaran Terselia: Belajar daripada data berlabel untuk meramalkan hasil bagi data yang tidak dijangka.

Pembelajaran Tanpa Selia: Mencari corak tersembunyi atau struktur intrinsik dalam data input tanpa respons berlabel.

Pembelajaran Separuh Selia: Belajar daripada gabungan data berlabel dan tidak berlabel.

Pembelajaran Pengukuhan: Belajar membuat keputusan dengan berinteraksi dengan persekitaran.

Pindahkan Pembelajaran: Mengaplikasikan pengetahuan yang diperoleh daripada satu tugasan kepada tugasan yang berkaitan.

Penilaian Model dan Metrik

Ketepatan: Perkadaran ramalan yang betul antara jumlah bilangan kes yang diperiksa.

Ketepatan: Perkadaran ramalan positif sebenar antara semua ramalan positif.

Imbas kembali: Perkadaran ramalan positif sebenar antara semua kes positif sebenar.

Skor F1: Min harmonik ketepatan dan ingatan semula.

Keluk ROC: Plot grafik yang menggambarkan keupayaan diagnostik sistem pengelas binari.

AUC (Kawasan Di Bawah Lengkung): Ukuran keupayaan pengelas untuk membezakan antara kelas.

Matriks Kekeliruan: Jadual yang digunakan untuk menerangkan prestasi model pengelasan.

Pengesahan Silang: Prosedur pensampelan semula yang digunakan untuk menilai model pembelajaran mesin pada sampel data terhad.

Terlebih pemasangan: Apabila model mempelajari data latihan terlalu baik, termasuk hingar dan turun naik.

Underfitting: Apabila model terlalu mudah untuk menangkap struktur asas data.

Rangkaian Neural dan Pembelajaran Mendalam

Neuron: Unit asas rangkaian saraf, dimodelkan secara longgar pada neuron biologi.

Fungsi Pengaktifan: Fungsi yang menentukan output neuron yang diberi input atau set input.

Berat: Parameter dalam rangkaian saraf yang menentukan kekuatan sambungan antara neuron.

Bias: Parameter tambahan dalam rangkaian saraf yang digunakan untuk melaraskan output bersama-sama dengan jumlah wajaran input ke neuron.

Backpropagation: Algoritma untuk melatih rangkaian saraf dengan melaraskan pemberat rangkaian secara berulang berdasarkan ralat dalam ramalannya.

Keturunan Kecerunan: Algoritma pengoptimuman yang digunakan untuk meminimumkan fungsi kehilangan dengan bergerak secara berulang ke arah penurunan paling curam.

Epoch: Satu laluan lengkap melalui keseluruhan set data latihan.

Batch: Subset data latihan yang digunakan dalam satu lelaran latihan model.

Kadar Pembelajaran: Hiperparameter yang mengawal berapa banyak untuk menukar model sebagai tindak balas kepada anggaran ralat setiap kali berat model dikemas kini.

Rangkaian Neural Konvolusi (CNN): Sejenis rangkaian saraf yang biasa digunakan untuk pengecaman dan pemprosesan imej.

Rangkaian Neural Berulang (RNN): Sejenis rangkaian saraf yang direka bentuk untuk mengenali corak dalam jujukan data.

Memori Jangka Pendek Panjang (LSTM): Sejenis RNN yang mampu mempelajari kebergantungan jangka panjang.

Transformer: Seni bina model yang bergantung sepenuhnya pada mekanisme perhatian untuk menarik kebergantungan global antara input dan output.

Kejuruteraan dan Pemilihan Ciri

Kejuruteraan Ciri: Proses menggunakan pengetahuan domain untuk mengekstrak ciri daripada data mentah.

Pemilihan Ciri: Proses memilih subset ciri yang berkaitan untuk digunakan dalam pembinaan model.

Pengurangan Dimensi: Teknik untuk mengurangkan bilangan pembolehubah input dalam set data.

Analisis Komponen Utama (PCA): Prosedur statistik yang menggunakan transformasi ortogon untuk menukar satu set pemerhatian pembolehubah yang mungkin berkorelasi kepada satu set nilai pembolehubah tidak berkorelasi linear.

Kaedah Ensembel

Pembelajaran Ensemble: Proses menggabungkan berbilang model untuk menyelesaikan masalah kecerdasan pengiraan.

Bagging: Kaedah ensemble yang menggunakan berbilang subset data latihan untuk melatih model yang berbeza.

Merangsang: Kaedah ensemble yang menggabungkan pelajar lemah untuk mencipta pelajar yang kuat.

Hutan Rawak: Kaedah pembelajaran ensemble yang membina pelbagai pokok keputusan.

Pemprosesan Bahasa Semulajadi (NLP)

Tokenisasi: Proses memecahkan teks kepada perkataan atau subkata individu.

Stemming: Proses mengurangkan perkataan infleksi kepada bentuk batang perkataan atau akarnya.

Lemmatisasi: Proses menghimpunkan bentuk infleksi yang berbeza bagi sesuatu perkataan.

Pembenaman Perkataan: Perwakilan yang dipelajari untuk teks di mana perkataan dengan makna yang serupa mempunyai perwakilan yang serupa.

Pengiktirafan Entiti Dinamakan (NER): Tugas mengenal pasti dan mengelaskan entiti yang dinamakan dalam teks.

Analisis Sentimen: Penggunaan pemprosesan bahasa semula jadi untuk mengenal pasti dan mengekstrak maklumat subjektif daripada teks.

Pembelajaran Pengukuhan

Agen: Pelajar atau pembuat keputusan dalam senario pembelajaran pengukuhan.

Persekitaran: Dunia tempat ejen beroperasi dan belajar.

Negeri: Keadaan atau keadaan semasa ejen dalam persekitaran.

Tindakan: Tindakan atau keputusan yang dibuat oleh ejen.

Ganjaran: Maklum balas daripada persekitaran untuk menilai tindakan yang diambil oleh ejen.

Dasar: Strategi yang digunakan oleh ejen untuk menentukan tindakan seterusnya berdasarkan keadaan semasa.

Konsep Lanjutan

Rangkaian Adversarial Generatif (GAN): Kelas rangka kerja pembelajaran mesin di mana dua rangkaian saraf bertanding antara satu sama lain.

Mekanisme Perhatian: Teknik yang meniru perhatian kognitif, meningkatkan bahagian penting data input dan mengurangkan bahagian yang tidak berkaitan.

Pembelajaran Pemindahan: Masalah penyelidikan dalam pembelajaran mesin yang menumpukan pada menyimpan pengetahuan yang diperoleh semasa menyelesaikan satu masalah dan menerapkannya pada masalah yang berbeza tetapi berkaitan.

Pembelajaran Sedikit Tangkapan: Sejenis pembelajaran mesin di mana model dilatih untuk mengenali kelas baharu daripada hanya beberapa contoh.

AI Boleh Diterangkan (XAI): Sistem kecerdasan buatan yang hasilnya boleh difahami oleh manusia.

Pembelajaran Bersekutu: Teknik pembelajaran mesin yang melatih algoritma merentas berbilang peranti atau pelayan terpencar yang memegang sampel data setempat.

AutoML: Proses mengautomasikan proses hujung ke hujung menerapkan pembelajaran mesin kepada masalah dunia sebenar.

Kesimpulan

Jika anda membaca ini, terima kasih banyak-banyak! Saya sangat menghargainya ❤️.

Ikuti saya di Twitter appyzdl5 untuk mendapatkan kemas kini biasa, cerapan dan perbualan yang menarik tentang ML.

Github saya dengan projek seperti miniGit dan ML algos dari awal: @appyzdl

Atas ialah kandungan terperinci Panduan Terminologi Pembelajaran Mesin Komprehensif. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!