Pembelajaran mesin ialah kaedah membenarkan komputer belajar daripada data tanpa pengaturcaraan yang jelas. Ia menggunakan algoritma untuk menganalisis dan mentafsir corak dalam data dan kemudian membuat ramalan atau keputusan tanpa campur tangan manusia. Memahami konsep pembelajaran mesin memerlukan penguasaan konsep asas seperti algoritma, latihan, model dan pekali. Melalui pembelajaran mesin, komputer boleh belajar daripada sejumlah besar data untuk meningkatkan prestasi dan ketepatannya. Kaedah ini telah digunakan secara meluas dalam banyak bidang, seperti pemprosesan bahasa semula jadi, pengecaman imej dan analisis data. Menguasai pengetahuan pembelajaran mesin akan memberikan kita lebih banyak peluang dan cabaran.
Algoritma dalam pembelajaran mesin ialah satu set arahan atau prosedur yang digunakan untuk menyelesaikan masalah atau mencapai tugas tertentu. Ia adalah proses langkah demi langkah yang membantu mencapai hasil yang diinginkan.
Latihan dalam pembelajaran mesin ialah proses mengajar algoritma untuk meramal atau membuat keputusan. Dengan diberikan contoh, mengandungi input dan output yang dikehendaki, algoritma mempelajari cara memetakan input kepada output yang dikehendaki.
Beberapa operasi biasa yang mungkin terlibat dalam algoritma pembelajaran mesin:
Prapemprosesan data: melibatkan pembersihan, pemformatan dan penormalan data untuk menjadikannya sesuai digunakan oleh algoritma. Ini mungkin termasuk tugas seperti mengalih keluar data yang hilang atau pendua, mengendalikan outlier dan pengekodan pembolehubah kategori.
Pengekstrakan ciri: melibatkan memilih dan mengubah ciri input atau pembolehubah yang akan digunakan oleh algoritma. Ini mungkin termasuk tugas seperti pengurangan dimensi, penskalaan ciri dan pemilihan ciri.
Pemilihan model: melibatkan pemilihan model atau seni bina yang sesuai yang akan digunakan untuk membuat ramalan atau keputusan. Ini mungkin termasuk tugas seperti memilih model regresi linear, pepohon keputusan atau rangkaian saraf.
Latihan: Melibatkan latihan model yang dipilih menggunakan data pra-diproses. Algoritma akan mempelajari hubungan antara ciri input dan output yang dikehendaki.
Penilaian: melibatkan penggunaan pelbagai teknik untuk menilai prestasi model terlatih.
Penalaan hiperparameter: melibatkan pelarasan tetapan model dan algoritma untuk mengoptimumkan prestasi.
Penerapan: Melibatkan pengambilan model terlatih dan menempatkannya ke pengeluaran supaya ia boleh digunakan untuk membuat ramalan atau keputusan tentang data baharu.
Pemantauan dan Penyelenggaraan: Melibatkan pemantauan prestasi model yang digunakan dan membuat sebarang pelarasan yang diperlukan untuk meningkatkan prestasinya.
Ini adalah beberapa operasi biasa yang mungkin terlibat dalam algoritma pembelajaran mesin, bergantung pada masalah dan data.
Algoritma dan model pembelajaran mesin adalah berkaitan, tetapi bukan perkara yang sama. Model ialah perwakilan matematik hubungan antara ciri input dan ciri output.
Algoritma ialah satu set arahan atau peraturan dan merupakan proses mencari perwakilan data yang terbaik, perwakilan ini dipanggil model. Algoritma mengambil data input dan menggunakan operasi matematik padanya untuk mencari set parameter atau pekali terbaik untuk persamaan atau fungsi yang membentuk model.
Dalam pembelajaran mesin, persamaan atau fungsi matematik yang digunakan oleh algoritma untuk belajar daripada data dan membuat ramalan sering dipanggil model. Proses pembelajaran daripada data sering dipanggil melatih model. Model ini boleh diwakili oleh satu set parameter yang perlu dipelajari daripada data. Matlamat algoritma pembelajaran mesin adalah untuk mencari set parameter terbaik yang sesuai dengan data dan digeneralisasikan dengan baik kepada data baharu.
Matlamat algoritma pembelajaran mesin adalah untuk mempelajari model, diwakili oleh satu set persamaan atau fungsi matematik, yang boleh digunakan untuk membuat ramalan pada data baharu yang tidak kelihatan.
Algoritma bermula dengan set data dan menggunakan operasi matematik padanya untuk mencari set parameter terbaik untuk persamaan yang paling sesuai dengan data. Menggunakan parameter ini, juga dipanggil pekali, ramalan kemudian dibuat pada data baharu.
Jadi matlamat algoritma pembelajaran mesin adalah untuk mencari set pekali terbaik bagi persamaan atau fungsi matematik yang membentuk model supaya ia boleh digunakan untuk membuat ramalan yang tepat pada data baharu.
Dalam terminologi pembelajaran mesin, perkataan yang boleh digunakan untuk merujuk kepada pekali:
Berat: Istilah ini sering digunakan apabila model ialah rangkaian saraf atau model linear. Pemberat ialah nilai yang dipelajari oleh algoritma dan digunakan untuk membuat ramalan.
Parameter: Istilah ini ialah istilah umum yang boleh merujuk kepada sebarang nilai yang dipelajari dan digunakan oleh algoritma untuk membuat ramalan.
Hyperparameters: Istilah ini merujuk kepada parameter yang tidak dipelajari oleh algoritma semasa latihan, tetapi ditetapkan oleh pengguna. Ini sering digunakan untuk mengawal kelakuan algoritma, seperti kadar pembelajaran atau bilangan unit tersembunyi.
Kepentingan Ciri: Ini merujuk kepada kepentingan relatif ciri (pembolehubah) dalam membuat ramalan dalam set data. Ia mengukur sejauh mana setiap ciri menyumbang kepada ramalan model.
Pekali model: Ini adalah istilah yang digunakan untuk merujuk kepada parameter model yang dipelajari oleh algoritma semasa latihan. Ia adalah istilah yang biasa digunakan dalam algoritma regresi linear dan logistik.
Di atas adalah semua tentang konsep algoritma, latihan, model dan pekali dalam pembelajaran mesin.
Secara umumnya, algoritma ialah "otak" sistem pembelajaran mesin. Ia menggunakan fungsi sebagai cara untuk membuat alasan dan memahami data input. Algoritma "berfikir" dengan menggunakan persamaan atau fungsi ini pada data dan melaraskan parameter untuk meminimumkan ralat antara nilai yang diramalkan dan benar. Hasil daripada proses ini ialah satu set pekali yang mewakili corak atau hubungan yang dipelajari dalam data, iaitu "pengetahuan" yang dipelajari daripada set data yang diberikan. Corak ini kemudiannya boleh digunakan untuk membuat ramalan pada data baharu, yang merupakan bahagian "pemikiran" sistem pembelajaran mesin.
Atas ialah kandungan terperinci Konsep dalam pembelajaran mesin: algoritma, latihan, model dan pekali. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!