Hasil daripada semua keputusan manusia ini ialah model yang kompleks akhirnya menjadi "reka bentuk intuitif" dan bukannya direka secara sistematik, kata Frank Hutter, ketua Makmal Pembelajaran Mesin di Universiti Freiburg di Jerman.
Bidang yang semakin berkembang dipanggil pembelajaran mesin automatik (autoML) bertujuan untuk menghapuskan tekaan ini. Ideanya adalah untuk membiarkan algoritma mengambil alih keputusan yang perlu dibuat oleh penyelidik semasa mereka bentuk model. Akhirnya, teknologi ini boleh menjadikan pembelajaran mesin lebih mudah diakses.
Walaupun pembelajaran mesin automatik telah wujud selama hampir sedekad, penyelidik masih berusaha untuk memperbaikinya. Persidangan baharu yang berlangsung di Baltimore hari ini mempamerkan usaha untuk meningkatkan ketepatan dan memperkemas prestasi autoML.
Terdapat minat yang kuat terhadap potensi autoML untuk memudahkan pembelajaran mesin. Syarikat seperti Amazon dan Google sudah menawarkan alat pembelajaran mesin kod rendah yang memanfaatkan teknologi autoML. Jika teknik ini menjadi lebih berkesan, ia boleh mempercepatkan penyelidikan dan menjadikan pembelajaran mesin tersedia kepada lebih ramai orang.
Ideanya adalah untuk membenarkan orang ramai memilih soalan yang mereka ingin tanya, menghalakan alat autoML kepadanya dan mendapatkan hasil yang mereka inginkan.
Visi ini ialah "cawan suci sains komputer," kata Lars Kotthoff, penolong profesor sains komputer di Universiti Wyoming dan penganjur persidangan "Anda menentukan masalah, dan komputer tahu cara menyelesaikannya , dan itulah yang anda lakukan "Tetapi pertama, penyelidik mesti memikirkan cara untuk menjadikan teknik ini lebih cekap masa dan tenaga.
Pada pandangan pertama, konsep autoML mungkin kelihatan berlebihan – lagipun, pembelajaran mesin sudah pun mengenai mengautomasikan proses memperoleh cerapan daripada data. Tetapi kerana algoritma autoML beroperasi pada tahap abstraksi di atas model pembelajaran mesin yang mendasari, bergantung semata-mata pada output model tersebut untuk panduan, ia menjimatkan masa dan usaha pengiraan.
Penyelidik boleh menggunakan teknologi autoML pada model terlatih untuk mendapatkan cerapan baharu tanpa membazirkan kuasa pengkomputeran menduplikasi penyelidikan sedia ada.
Sebagai contoh, Mehdi Bahrami, seorang saintis penyelidikan di Institut Penyelidikan Fujitsu, Amerika Syarikat, dan pengarang bersamanya membentangkan kerja terbaru tentang cara menggunakan algoritma isihan BERT dengan model pra-latihan yang berbeza untuk menyesuaikan diri dengan tujuan baharu .
BERT-sort ialah algoritma yang mencari apa yang dipanggil "tertib semantik" apabila melatih set data. Contohnya, berdasarkan data semakan filem, ia mengetahui bahawa filem "hebat" diberi kedudukan lebih tinggi daripada filem "baik" dan "buruk".
Dengan teknologi autoML, susunan semantik yang dipelajari juga boleh digeneralisasikan untuk mengklasifikasikan diagnosis kanser dan juga teks bahasa asing, sekali gus mengurangkan masa dan pengiraan.
"BERT memerlukan pengiraan berbulan-bulan dan sangat mahal, seperti $1 juta untuk menjana model dan mengulangi proses itu, Bahrami berkata, "Jadi jika semua orang mahu melakukan perkara yang sama, Itu mahal — ia bukan tenaga." cekap, dan ia tidak mampan untuk dunia "
Walaupun janji yang ditunjukkan dalam lapangan, penyelidik masih mencari cara untuk menjadikan teknologi autoML lebih cekap dari segi pengiraan. Contohnya, dengan kaedah seperti Carian Seni Bina Neural (NAS), di mana banyak model berbeza dibina dan diuji untuk mencari kesesuaian terbaik, tenaga yang diperlukan untuk melengkapkan semua lelaran ini boleh menjadi ketara.
Pembelajaran mesin automatik juga boleh digunakan pada algoritma pembelajaran mesin yang tidak melibatkan rangkaian saraf, seperti mencipta hutan keputusan rawak atau mesin vektor sokongan untuk mengklasifikasikan data. Penyelidikan dalam bidang ini sedang berjalan dan sudah terdapat banyak perpustakaan pengekodan yang tersedia untuk orang yang ingin menyepadukan teknologi autoML ke dalam projek mereka.
Hutter berkata langkah seterusnya ialah menggunakan autoML untuk mengukur ketidakpastian dan menangani isu kredibiliti dan keadilan dalam algoritma. Dalam visi ini, kriteria untuk kebolehpercayaan dan keadilan akan serupa dengan sebarang kekangan pembelajaran mesin lain, seperti ketepatan. AutoML boleh menangkap dan membetulkan bias secara automatik yang terdapat dalam algoritma ini sebelum ia dikeluarkan.
Tetapi untuk aplikasi seperti pembelajaran mendalam, autoML masih jauh lagi. Data yang digunakan untuk melatih model pembelajaran mendalam, seperti imej, dokumen dan pertuturan yang dirakam, selalunya padat dan kompleks. Ia memerlukan kuasa pengkomputeran yang besar untuk memproses. Kos dan masa untuk melatih model ini boleh menjadi terlalu mahal bagi sesiapa kecuali penyelidik yang bekerja di syarikat besar dengan poket yang dalam.
Salah satu keperluan pertandingan pada persidangan itu adalah untuk peserta membangunkan algoritma alternatif yang cekap tenaga untuk carian seni bina saraf. Ini agak mencabar kerana teknologi ini terkenal dengan keperluan pengiraannya. Ia secara automatik mengitari model pembelajaran mendalam yang tidak terkira banyaknya untuk membantu penyelidik memilih yang sesuai untuk permohonan mereka, tetapi proses itu boleh mengambil masa berbulan-bulan dan menelan belanja lebih daripada satu juta dolar.
Matlamat algoritma alternatif ini, yang dikenali sebagai ejen carian seni bina saraf kos sifar, adalah untuk menjadikan carian seni bina saraf lebih mudah diakses dan lebih hijau dengan mengurangkan keperluan pengiraannya secara drastik. Keputusan mengambil beberapa saat untuk dijalankan, bukan berbulan-bulan. Pada masa ini, teknik ini masih dalam peringkat awal pembangunan dan selalunya tidak boleh dipercayai, tetapi penyelidik pembelajaran mesin meramalkan mereka mempunyai potensi untuk menjadikan proses pemilihan model lebih cekap.
Atas ialah kandungan terperinci Membangunkan AI dengan lebih mudah dengan teknologi autoML. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!