


Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus
Dalam proses pembangunan pembelajaran mesin, kaedah pembelajaran manusia sering memberi inspirasi kepada reka bentuk pelbagai algoritma. Sebagai paradigma penting pembelajaran manusia, pembelajaran melalui kursus telah dipinjam daripada pembelajaran mesin untuk membentuk hala tuju penyelidikan yang dipanggil Pembelajaran Kurikulum.
Secara umumnya, pendidikan manusia diselesaikan melalui kursus yang sangat teratur. Setiap kursus atau mata pelajaran akan bermula dengan kandungan mudah dan secara beransur-ansur membentangkan pelajar dengan konsep yang lebih kompleks. Sebagai contoh, sebelum menerima konsep kalkulus di kolej, pelajar harus terlebih dahulu mempelajari aritmetik di sekolah rendah, fungsi di sekolah menengah, dan derivatif di sekolah menengah. Walau bagaimanapun, tidak seperti pendidikan manusia, latihan model pembelajaran mesin tradisional melibatkan memasukkan sampel data secara rawak ke dalam model, mengabaikan kerumitan yang berbeza antara sampel data dan status pembelajaran model semasa. Oleh itu, pembelajaran kurikulum dicadangkan dalam bidang pembelajaran mesin dengan tepat untuk meniru pembelajaran manusia daripada mudah kepada sukar, menyediakan strategi latihan yang lebih baik untuk model, dan dengan itu meningkatkan prestasi model.
Peta Konsep Pembelajaran Kursus
Pada masa ini Pembelajaran kurikulum telah digunakan secara meluas dalam pelbagai tugas pembelajaran mesin, termasuk klasifikasi imej, pengesanan sasaran, segmentasi semantik, terjemahan mesin, pengecaman audio, peningkatan audio, soal jawab video, dsb., serta dalam penyeliaan, tanpa pengawasan dan separa. pembelajaran diselia dan Pembelajaran pengukuhan dan senario lain telah mendapat banyak perhatian dan penyelidikan.
Memandangkan aplikasi dan senario pembelajaran kursus menjadi semakin kaya, adalah amat perlu untuk menjalankan pengisihan dan ringkasan terperinci dalam bidang ini, untuk menggalakkan penerokaan mendalam oleh penyelidik dan meningkatkan pengalaman aplikasi pengguna.
Oleh itu, Makmal Data Besar Media dan Rangkaian yang diketuai oleh Profesor Zhu Wenwu dari Universiti Tsinghua telah menerbitkan beberapa kertas akademik mengenai pembelajaran kursus dan berdasarkan pengumpulan dan asas, ahli makmal Wang Xin IEEE TPAMI menerbitkan kertas ulasan tentang pembelajaran kurikulum, dan makmal itu mengeluarkan lagi perpustakaan sumber terbuka pertama di dunia untuk pembelajaran kurikulum, CurML (Curriculum Machine Learning).
Kerja penyelidikan pembelajaran kurikulum Profesor Zhu Wenwu dan Penolong Penyelidik Wang Xin termasuk kaedah meta-pembelajaran kurikulum yang digunakan pada pengesyoran lokasi minat bandar, pengesyoran produk penyahgandingan kurikulum berdasarkan maklumat pelbagai maklum balas yang bising , Dikongsi carian seni bina saraf parameter berdasarkan pembelajaran kursus, dan penyelesaian masalah pengoptimuman gabungan berdasarkan penyesuaian kesukaran kursus, dsb. Hasil penyelidikan telah diterbitkan dalam persidangan pembelajaran mesin antarabangsa peringkat tinggi seperti SIGKDD, NeurIPS dan ACM MM.
Rajah rangka kerja beberapa hasil penyelidikan
Kertas semakan pembelajaran kursus mengkaji secara menyeluruh semua aspek pembelajaran kursus, seperti kemunculan, definisi, teori dan aplikasi, mereka bentuk rangka kerja pembelajaran kursus yang bersatu, dan membahagikan algoritma pembelajaran kursus kepada dua kategori utama dan pelbagai kategori berdasarkan komponen teras dalam rangka kerja. Subkategori ini membezakan perbezaan dan hubungan antara pembelajaran kurikulum dan konsep pembelajaran mesin yang lain, dan menunjukkan cabaran yang dihadapi oleh bidang ini dan kemungkinan arah penyelidikan masa depan.
Klasifikasi Kaedah Pembelajaran Kursus
Kursus Perpustakaan sumber terbuka pembelajaran CurML ialah platform sokongan untuk algoritma pembelajaran kursus Ia telah menyepadukan lebih daripada sepuluh algoritma pembelajaran kursus dan menyokong kedua-dua senario aplikasi yang bising dan tidak bising, menjadikannya lebih mudah bagi penyelidik dan pengguna untuk menghasilkan semula, menilai, membandingkan dan. memilih algoritma pembelajaran.
Modul utama CurML ialah CL Trainer, yang terdiri daripada dua sub-modul Model Trainer dan CL Algorithm Kedua-duanya berinteraksi melalui lima fungsi antara muka untuk merealisasikan mesin untuk bimbingan pembelajaran kursus. proses pembelajaran.
Rajah rangka kerja CurML
Modul utama: CL Trainer
Modul ini adalah bahagian utama keseluruhan perpustakaan sumber terbuka. Dengan memanggil modul ini, pengguna boleh melaksanakan algoritma pembelajaran kursus dengan hanya beberapa baris kod. Selepas diberikan set data, model dan hiperparameter, modul akan melatih untuk tempoh masa tertentu dan mengeluarkan parameter model terlatih dan hasil ujian tugasan. Modul ini direka bentuk terutamanya untuk memenuhi keperluan kemudahan penggunaan, jadi ia sangat terkandung dan disediakan kepada pengguna yang ingin menggunakan algoritma pembelajaran kursus tetapi tidak mengambil berat tentang butiran pelaksanaan khusus.
Sub-modul 1: Jurulatih Model
Modul ini digunakan untuk melengkapkan proses pembelajaran mesin umum, seperti sebagai latihan Pengelas imej atau model bahasa. Pada masa yang sama, ia menyimpan kedudukan untuk lima fungsi antara muka untuk berinteraksi dengan Algoritma CL sub-modul kedua, dan juga menyokong fungsi input tersuai.
Sub-modul 2: Algoritma CL
Modul ini merangkumi semua algoritma pembelajaran kursus yang disokong oleh CurML dalam jadual berikut:
Modul ini dilaksanakan melalui lima fungsi antara muka, yang digunakan untuk mendapatkan data dan maklumat model daripada proses pembelajaran mesin. dan strategi pembelajaran untuk membimbing model, seperti yang ditunjukkan dalam rajah di bawah.
Carta alir CurML
Fungsi antara muka: data_prepare
Fungsi ini digunakan untuk menyediakan maklumat set data daripada modul Model Trainer kepada modul CL Algorithm. Banyak algoritma pembelajaran kursus memerlukan pemahaman keseluruhan tentang set data untuk menilai dengan lebih baik kesukaran sampel data, jadi fungsi antara muka ini diperlukan.
Fungsi antara muka: model_prepare
Fungsi ini hampir sama dengan data_prepare, bezanya ia tidak memindahkan maklumat set data Ia adalah maklumat yang berkaitan dengan latihan model, seperti seni bina model, pengoptimum parameter, pelaras kadar pembelajaran, dll. Banyak algoritma pembelajaran kursus membimbing pembelajaran mesin dengan melaraskan elemen ini.
Fungsi antara muka: data_curriculum
Fungsi ini digunakan untuk mengira kesukaran sampel data, dan berdasarkan kesukaran data dan keadaan Model semasa menyediakan model dengan data yang sesuai, dan kebanyakan kursus mempunyai idea yang serupa.
Fungsi antara muka: model_curriculum
Fungsi ini digunakan untuk mengemas kini model dan melaraskan parameter yang diperolehi oleh model daripada sampel data Jumlah maklumat secara tidak langsung membimbing pembelajaran model Pada masa ini, bilangan algoritma tersebut masih kecil, tetapi CurML juga menyokong pelaksanaan algoritma tersebut.
Fungsi antara muka: loss_curriculum
Fungsi ini digunakan untuk menimbang semula nilai fungsi kehilangan, dan pelarasan tidak langsung ialah berbeza Kesan data ke atas model Algoritma jenis ini lebih biasa dalam pembelajaran kursus, kerana pemberat nilai kehilangan pada asasnya adalah pensampelan lembut data.
Melalui ringkasan lebih daripada sepuluh kaedah pembelajaran kursus dalam beberapa tahun kebelakangan ini, pelbagai jenis algoritma pembelajaran kursus boleh disatukan dan dilaksanakan menggunakan modul dan parameter antara muka di atas, supaya ia boleh digunakan dalam senario yang adil dan Menilai, membandingkan dan memilih algoritma pembelajaran kursus di bawah tugas.
Tinjauan Masa Depan
Pasukan R&D CurML menyatakan bahawa mereka akan terus mengemas kini perpustakaan sumber terbuka ini pada masa hadapan untuk memberikan sokongan lanjut untuk pembangunan dan aplikasi pembelajaran kursus.
Pautan berkaitan:
- Pautan asas kod sumber terbuka CurML: https://github.com/THUMNLab/CurML
- Pautan kertas perisian sumber terbuka CurML: https://dl.acm.org/doi/pdf/10.1145/3503161.3548549
- Kertas ringkasan pembelajaran kursus pautan: https://ieeexplore.ieee.org/abstract/document/9392296/
- Pautan kertas meta-pembelajaran kursus: https://dl.acm.org/doi/abs /10.1145/ 3447548.3467132
- Pautan kertas pembelajaran penyahgandingan kursus: https://proceedings.neurips.cc/paper/2021/file/e242660df1b79fdeff. 🎜> Pautan kertas carian seni bina saraf kursus: https://dl.acm.org/doi/abs/10.1145/3503161.3548271
- Pautan kertas penyesuaian kesukaran kursus: https:/ / ojs.aaai.org/index.php/AAAI/article/download/20899/version/19196/20658
Atas ialah kandungan terperinci Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Dalam bidang pembelajaran mesin dan sains data, kebolehtafsiran model sentiasa menjadi tumpuan penyelidik dan pengamal. Dengan aplikasi meluas model yang kompleks seperti kaedah pembelajaran mendalam dan ensemble, memahami proses membuat keputusan model menjadi sangat penting. AI|XAI yang boleh dijelaskan membantu membina kepercayaan dan keyakinan dalam model pembelajaran mesin dengan meningkatkan ketelusan model. Meningkatkan ketelusan model boleh dicapai melalui kaedah seperti penggunaan meluas pelbagai model yang kompleks, serta proses membuat keputusan yang digunakan untuk menerangkan model. Kaedah ini termasuk analisis kepentingan ciri, anggaran selang ramalan model, algoritma kebolehtafsiran tempatan, dsb. Analisis kepentingan ciri boleh menerangkan proses membuat keputusan model dengan menilai tahap pengaruh model ke atas ciri input. Anggaran selang ramalan model

Artikel ini akan memperkenalkan cara mengenal pasti pemasangan lampau dan kekurangan dalam model pembelajaran mesin secara berkesan melalui keluk pembelajaran. Underfitting dan overfitting 1. Overfitting Jika model terlampau latihan pada data sehingga ia mempelajari bunyi daripadanya, maka model tersebut dikatakan overfitting. Model yang dipasang terlebih dahulu mempelajari setiap contoh dengan sempurna sehingga ia akan salah mengklasifikasikan contoh yang tidak kelihatan/baharu. Untuk model terlampau, kami akan mendapat skor set latihan yang sempurna/hampir sempurna dan set pengesahan/skor ujian yang teruk. Diubah suai sedikit: "Punca overfitting: Gunakan model yang kompleks untuk menyelesaikan masalah mudah dan mengekstrak bunyi daripada data. Kerana set data kecil sebagai set latihan mungkin tidak mewakili perwakilan yang betul bagi semua data. 2. Underfitting Heru

Pada tahun 1950-an, kecerdasan buatan (AI) dilahirkan. Ketika itulah penyelidik mendapati bahawa mesin boleh melakukan tugas seperti manusia, seperti berfikir. Kemudian, pada tahun 1960-an, Jabatan Pertahanan A.S. membiayai kecerdasan buatan dan menubuhkan makmal untuk pembangunan selanjutnya. Penyelidik sedang mencari aplikasi untuk kecerdasan buatan dalam banyak bidang, seperti penerokaan angkasa lepas dan kelangsungan hidup dalam persekitaran yang melampau. Penerokaan angkasa lepas ialah kajian tentang alam semesta, yang meliputi seluruh alam semesta di luar bumi. Angkasa lepas diklasifikasikan sebagai persekitaran yang melampau kerana keadaannya berbeza daripada di Bumi. Untuk terus hidup di angkasa, banyak faktor mesti dipertimbangkan dan langkah berjaga-jaga mesti diambil. Para saintis dan penyelidik percaya bahawa meneroka ruang dan memahami keadaan semasa segala-galanya boleh membantu memahami cara alam semesta berfungsi dan bersedia untuk menghadapi kemungkinan krisis alam sekitar

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

FP8 dan ketepatan pengiraan titik terapung yang lebih rendah bukan lagi "paten" H100! Lao Huang mahu semua orang menggunakan INT8/INT4, dan pasukan Microsoft DeepSpeed memaksa diri mereka menjalankan FP6 pada A100 tanpa sokongan rasmi daripada Nvidia. Keputusan ujian menunjukkan bahawa kaedah baharu TC-FPx FP6 kuantisasi pada A100 adalah hampir atau kadangkala lebih pantas daripada INT4, dan mempunyai ketepatan yang lebih tinggi daripada yang terakhir. Selain itu, terdapat juga sokongan model besar hujung ke hujung, yang telah bersumberkan terbuka dan disepadukan ke dalam rangka kerja inferens pembelajaran mendalam seperti DeepSpeed. Keputusan ini juga mempunyai kesan serta-merta pada mempercepatkan model besar - di bawah rangka kerja ini, menggunakan satu kad untuk menjalankan Llama, daya pemprosesan adalah 2.65 kali lebih tinggi daripada dua kad. satu

Penterjemah |. Disemak oleh Li Rui |. Chonglou Model kecerdasan buatan (AI) dan pembelajaran mesin (ML) semakin kompleks hari ini, dan output yang dihasilkan oleh model ini adalah kotak hitam – tidak dapat dijelaskan kepada pihak berkepentingan. AI Boleh Dijelaskan (XAI) bertujuan untuk menyelesaikan masalah ini dengan membolehkan pihak berkepentingan memahami cara model ini berfungsi, memastikan mereka memahami cara model ini sebenarnya membuat keputusan, dan memastikan ketelusan dalam sistem AI, Amanah dan akauntabiliti untuk menyelesaikan masalah ini. Artikel ini meneroka pelbagai teknik kecerdasan buatan (XAI) yang boleh dijelaskan untuk menggambarkan prinsip asasnya. Beberapa sebab mengapa AI boleh dijelaskan adalah penting Kepercayaan dan ketelusan: Untuk sistem AI diterima secara meluas dan dipercayai, pengguna perlu memahami cara keputusan dibuat

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

MetaFAIR bekerjasama dengan Harvard untuk menyediakan rangka kerja penyelidikan baharu untuk mengoptimumkan bias data yang dijana apabila pembelajaran mesin berskala besar dilakukan. Adalah diketahui bahawa latihan model bahasa besar sering mengambil masa berbulan-bulan dan menggunakan ratusan atau bahkan ribuan GPU. Mengambil model LLaMA270B sebagai contoh, latihannya memerlukan sejumlah 1,720,320 jam GPU. Melatih model besar memberikan cabaran sistemik yang unik disebabkan oleh skala dan kerumitan beban kerja ini. Baru-baru ini, banyak institusi telah melaporkan ketidakstabilan dalam proses latihan apabila melatih model AI generatif SOTA Mereka biasanya muncul dalam bentuk lonjakan kerugian Contohnya, model PaLM Google mengalami sehingga 20 lonjakan kerugian semasa proses latihan. Bias berangka adalah punca ketidaktepatan latihan ini,
