Jadual Kandungan
Modul utama: CL Trainer
Tinjauan Masa Depan
Rumah Peranti teknologi AI Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus

Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus

Apr 09, 2023 am 08:41 AM
pembelajaran mesin Sumber terbuka

Dalam proses pembangunan pembelajaran mesin, kaedah pembelajaran manusia sering memberi inspirasi kepada reka bentuk pelbagai algoritma. Sebagai paradigma penting pembelajaran manusia, pembelajaran melalui kursus telah dipinjam daripada pembelajaran mesin untuk membentuk hala tuju penyelidikan yang dipanggil Pembelajaran Kurikulum.

Secara umumnya, pendidikan manusia diselesaikan melalui kursus yang sangat teratur. Setiap kursus atau mata pelajaran akan bermula dengan kandungan mudah dan secara beransur-ansur membentangkan pelajar dengan konsep yang lebih kompleks. Sebagai contoh, sebelum menerima konsep kalkulus di kolej, pelajar harus terlebih dahulu mempelajari aritmetik di sekolah rendah, fungsi di sekolah menengah, dan derivatif di sekolah menengah. Walau bagaimanapun, tidak seperti pendidikan manusia, latihan model pembelajaran mesin tradisional melibatkan memasukkan sampel data secara rawak ke dalam model, mengabaikan kerumitan yang berbeza antara sampel data dan status pembelajaran model semasa. Oleh itu, pembelajaran kurikulum dicadangkan dalam bidang pembelajaran mesin dengan tepat untuk meniru pembelajaran manusia daripada mudah kepada sukar, menyediakan strategi latihan yang lebih baik untuk model, dan dengan itu meningkatkan prestasi model.

Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus

Peta Konsep Pembelajaran Kursus

Pada masa ini Pembelajaran kurikulum telah digunakan secara meluas dalam pelbagai tugas pembelajaran mesin, termasuk klasifikasi imej, pengesanan sasaran, segmentasi semantik, terjemahan mesin, pengecaman audio, peningkatan audio, soal jawab video, dsb., serta dalam penyeliaan, tanpa pengawasan dan separa. pembelajaran diselia dan Pembelajaran pengukuhan dan senario lain telah mendapat banyak perhatian dan penyelidikan.

Memandangkan aplikasi dan senario pembelajaran kursus menjadi semakin kaya, adalah amat perlu untuk menjalankan pengisihan dan ringkasan terperinci dalam bidang ini, untuk menggalakkan penerokaan mendalam oleh penyelidik dan meningkatkan pengalaman aplikasi pengguna.

Oleh itu, Makmal Data Besar Media dan Rangkaian yang diketuai oleh Profesor Zhu Wenwu dari Universiti Tsinghua telah menerbitkan beberapa kertas akademik mengenai pembelajaran kursus dan berdasarkan pengumpulan dan asas, ahli makmal Wang Xin IEEE TPAMI menerbitkan kertas ulasan tentang pembelajaran kurikulum, dan makmal itu mengeluarkan lagi perpustakaan sumber terbuka pertama di dunia untuk pembelajaran kurikulum, CurML (Curriculum Machine Learning).

Kerja penyelidikan pembelajaran kurikulum Profesor Zhu Wenwu dan Penolong Penyelidik Wang Xin termasuk kaedah meta-pembelajaran kurikulum yang digunakan pada pengesyoran lokasi minat bandar, pengesyoran produk penyahgandingan kurikulum berdasarkan maklumat pelbagai maklum balas yang bising , Dikongsi carian seni bina saraf parameter berdasarkan pembelajaran kursus, dan penyelesaian masalah pengoptimuman gabungan berdasarkan penyesuaian kesukaran kursus, dsb. Hasil penyelidikan telah diterbitkan dalam persidangan pembelajaran mesin antarabangsa peringkat tinggi seperti SIGKDD, NeurIPS dan ACM MM.

Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus

Rajah rangka kerja beberapa hasil penyelidikan

Kertas semakan pembelajaran kursus mengkaji secara menyeluruh semua aspek pembelajaran kursus, seperti kemunculan, definisi, teori dan aplikasi, mereka bentuk rangka kerja pembelajaran kursus yang bersatu, dan membahagikan algoritma pembelajaran kursus kepada dua kategori utama dan pelbagai kategori berdasarkan komponen teras dalam rangka kerja. Subkategori ini membezakan perbezaan dan hubungan antara pembelajaran kurikulum dan konsep pembelajaran mesin yang lain, dan menunjukkan cabaran yang dihadapi oleh bidang ini dan kemungkinan arah penyelidikan masa depan.

Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus

Klasifikasi Kaedah Pembelajaran Kursus

Kursus Perpustakaan sumber terbuka pembelajaran CurML ialah platform sokongan untuk algoritma pembelajaran kursus Ia telah menyepadukan lebih daripada sepuluh algoritma pembelajaran kursus dan menyokong kedua-dua senario aplikasi yang bising dan tidak bising, menjadikannya lebih mudah bagi penyelidik dan pengguna untuk menghasilkan semula, menilai, membandingkan dan. memilih algoritma pembelajaran.

Modul utama CurML ialah CL Trainer, yang terdiri daripada dua sub-modul Model Trainer dan CL Algorithm Kedua-duanya berinteraksi melalui lima fungsi antara muka untuk merealisasikan mesin untuk bimbingan pembelajaran kursus. proses pembelajaran.

Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus

Rajah rangka kerja CurML

Modul utama: CL Trainer

Modul ini adalah bahagian utama keseluruhan perpustakaan sumber terbuka. Dengan memanggil modul ini, pengguna boleh melaksanakan algoritma pembelajaran kursus dengan hanya beberapa baris kod. Selepas diberikan set data, model dan hiperparameter, modul akan melatih untuk tempoh masa tertentu dan mengeluarkan parameter model terlatih dan hasil ujian tugasan. Modul ini direka bentuk terutamanya untuk memenuhi keperluan kemudahan penggunaan, jadi ia sangat terkandung dan disediakan kepada pengguna yang ingin menggunakan algoritma pembelajaran kursus tetapi tidak mengambil berat tentang butiran pelaksanaan khusus.

Sub-modul 1: Jurulatih Model

Modul ini digunakan untuk melengkapkan proses pembelajaran mesin umum, seperti sebagai latihan Pengelas imej atau model bahasa. Pada masa yang sama, ia menyimpan kedudukan untuk lima fungsi antara muka untuk berinteraksi dengan Algoritma CL sub-modul kedua, dan juga menyokong fungsi input tersuai.

Sub-modul 2: Algoritma CL

Modul ini merangkumi semua algoritma pembelajaran kursus yang disokong oleh CurML dalam jadual berikut:

Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus

Modul ini dilaksanakan melalui lima fungsi antara muka, yang digunakan untuk mendapatkan data dan maklumat model daripada proses pembelajaran mesin. dan strategi pembelajaran untuk membimbing model, seperti yang ditunjukkan dalam rajah di bawah.

Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus

Carta alir CurML

Fungsi antara muka: data_prepare

Fungsi ini digunakan untuk menyediakan maklumat set data daripada modul Model Trainer kepada modul CL Algorithm. Banyak algoritma pembelajaran kursus memerlukan pemahaman keseluruhan tentang set data untuk menilai dengan lebih baik kesukaran sampel data, jadi fungsi antara muka ini diperlukan.

Fungsi antara muka: model_prepare

Fungsi ini hampir sama dengan data_prepare, bezanya ia tidak memindahkan maklumat set data Ia adalah maklumat yang berkaitan dengan latihan model, seperti seni bina model, pengoptimum parameter, pelaras kadar pembelajaran, dll. Banyak algoritma pembelajaran kursus membimbing pembelajaran mesin dengan melaraskan elemen ini.

Fungsi antara muka: data_curriculum

Fungsi ini digunakan untuk mengira kesukaran sampel data, dan berdasarkan kesukaran data dan keadaan Model semasa menyediakan model dengan data yang sesuai, dan kebanyakan kursus mempunyai idea yang serupa.

Fungsi antara muka: model_curriculum

Fungsi ini digunakan untuk mengemas kini model dan melaraskan parameter yang diperolehi oleh model daripada sampel data Jumlah maklumat secara tidak langsung membimbing pembelajaran model Pada masa ini, bilangan algoritma tersebut masih kecil, tetapi CurML juga menyokong pelaksanaan algoritma tersebut.

Fungsi antara muka: loss_curriculum

Fungsi ini digunakan untuk menimbang semula nilai fungsi kehilangan, dan pelarasan tidak langsung ialah berbeza Kesan data ke atas model Algoritma jenis ini lebih biasa dalam pembelajaran kursus, kerana pemberat nilai kehilangan pada asasnya adalah pensampelan lembut data.

Melalui ringkasan lebih daripada sepuluh kaedah pembelajaran kursus dalam beberapa tahun kebelakangan ini, pelbagai jenis algoritma pembelajaran kursus boleh disatukan dan dilaksanakan menggunakan modul dan parameter antara muka di atas, supaya ia boleh digunakan dalam senario yang adil dan Menilai, membandingkan dan memilih algoritma pembelajaran kursus di bawah tugas.

Tinjauan Masa Depan

Pasukan R&D CurML menyatakan bahawa mereka akan terus mengemas kini perpustakaan sumber terbuka ini pada masa hadapan untuk memberikan sokongan lanjut untuk pembangunan dan aplikasi pembelajaran kursus.

Pautan berkaitan:

  • Pautan asas kod sumber terbuka CurML: https://github.com/THUMNLab/CurML
  • Pautan kertas perisian sumber terbuka CurML: https://dl.acm.org/doi/pdf/10.1145/3503161.3548549
  • Kertas ringkasan pembelajaran kursus pautan: https://ieeexplore.ieee.org/abstract/document/9392296/
  • Pautan kertas meta-pembelajaran kursus: https://dl.acm.org/doi/abs /10.1145/ 3447548.3467132
  • Pautan kertas pembelajaran penyahgandingan kursus: https://proceedings.neurips.cc/paper/2021/file/e242660df1b79fdeff. 🎜>
  • Pautan kertas carian seni bina saraf kursus: https://dl.acm.org/doi/abs/10.1145/3503161.3548271
  • Pautan kertas penyesuaian kesukaran kursus: https:/ / ojs.aaai.org/index.php/AAAI/article/download/20899/version/19196/20658

Atas ialah kandungan terperinci Universiti Tsinghua mengeluarkan CurML, perpustakaan sumber terbuka pertama untuk pembelajaran kursus. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Artikel ini akan membawa anda memahami SHAP: penjelasan model untuk pembelajaran mesin Artikel ini akan membawa anda memahami SHAP: penjelasan model untuk pembelajaran mesin Jun 01, 2024 am 10:58 AM

Dalam bidang pembelajaran mesin dan sains data, kebolehtafsiran model sentiasa menjadi tumpuan penyelidik dan pengamal. Dengan aplikasi meluas model yang kompleks seperti kaedah pembelajaran mendalam dan ensemble, memahami proses membuat keputusan model menjadi sangat penting. AI|XAI yang boleh dijelaskan membantu membina kepercayaan dan keyakinan dalam model pembelajaran mesin dengan meningkatkan ketelusan model. Meningkatkan ketelusan model boleh dicapai melalui kaedah seperti penggunaan meluas pelbagai model yang kompleks, serta proses membuat keputusan yang digunakan untuk menerangkan model. Kaedah ini termasuk analisis kepentingan ciri, anggaran selang ramalan model, algoritma kebolehtafsiran tempatan, dsb. Analisis kepentingan ciri boleh menerangkan proses membuat keputusan model dengan menilai tahap pengaruh model ke atas ciri input. Anggaran selang ramalan model

Kenal pasti overfitting dan underfitting melalui lengkung pembelajaran Kenal pasti overfitting dan underfitting melalui lengkung pembelajaran Apr 29, 2024 pm 06:50 PM

Artikel ini akan memperkenalkan cara mengenal pasti pemasangan lampau dan kekurangan dalam model pembelajaran mesin secara berkesan melalui keluk pembelajaran. Underfitting dan overfitting 1. Overfitting Jika model terlampau latihan pada data sehingga ia mempelajari bunyi daripadanya, maka model tersebut dikatakan overfitting. Model yang dipasang terlebih dahulu mempelajari setiap contoh dengan sempurna sehingga ia akan salah mengklasifikasikan contoh yang tidak kelihatan/baharu. Untuk model terlampau, kami akan mendapat skor set latihan yang sempurna/hampir sempurna dan set pengesahan/skor ujian yang teruk. Diubah suai sedikit: "Punca overfitting: Gunakan model yang kompleks untuk menyelesaikan masalah mudah dan mengekstrak bunyi daripada data. Kerana set data kecil sebagai set latihan mungkin tidak mewakili perwakilan yang betul bagi semua data. 2. Underfitting Heru

Evolusi kecerdasan buatan dalam penerokaan angkasa lepas dan kejuruteraan penempatan manusia Evolusi kecerdasan buatan dalam penerokaan angkasa lepas dan kejuruteraan penempatan manusia Apr 29, 2024 pm 03:25 PM

Pada tahun 1950-an, kecerdasan buatan (AI) dilahirkan. Ketika itulah penyelidik mendapati bahawa mesin boleh melakukan tugas seperti manusia, seperti berfikir. Kemudian, pada tahun 1960-an, Jabatan Pertahanan A.S. membiayai kecerdasan buatan dan menubuhkan makmal untuk pembangunan selanjutnya. Penyelidik sedang mencari aplikasi untuk kecerdasan buatan dalam banyak bidang, seperti penerokaan angkasa lepas dan kelangsungan hidup dalam persekitaran yang melampau. Penerokaan angkasa lepas ialah kajian tentang alam semesta, yang meliputi seluruh alam semesta di luar bumi. Angkasa lepas diklasifikasikan sebagai persekitaran yang melampau kerana keadaannya berbeza daripada di Bumi. Untuk terus hidup di angkasa, banyak faktor mesti dipertimbangkan dan langkah berjaga-jaga mesti diambil. Para saintis dan penyelidik percaya bahawa meneroka ruang dan memahami keadaan semasa segala-galanya boleh membantu memahami cara alam semesta berfungsi dan bersedia untuk menghadapi kemungkinan krisis alam sekitar

Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Jun 03, 2024 pm 01:25 PM

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

Satu kad menjalankan Llama 70B lebih pantas daripada dua kad, Microsoft hanya meletakkan FP6 ke dalam A100 | Satu kad menjalankan Llama 70B lebih pantas daripada dua kad, Microsoft hanya meletakkan FP6 ke dalam A100 | Apr 29, 2024 pm 04:55 PM

FP8 dan ketepatan pengiraan titik terapung yang lebih rendah bukan lagi "paten" H100! Lao Huang mahu semua orang menggunakan INT8/INT4, dan pasukan Microsoft DeepSpeed ​​​​memaksa diri mereka menjalankan FP6 pada A100 tanpa sokongan rasmi daripada Nvidia. Keputusan ujian menunjukkan bahawa kaedah baharu TC-FPx FP6 kuantisasi pada A100 adalah hampir atau kadangkala lebih pantas daripada INT4, dan mempunyai ketepatan yang lebih tinggi daripada yang terakhir. Selain itu, terdapat juga sokongan model besar hujung ke hujung, yang telah bersumberkan terbuka dan disepadukan ke dalam rangka kerja inferens pembelajaran mendalam seperti DeepSpeed. Keputusan ini juga mempunyai kesan serta-merta pada mempercepatkan model besar - di bawah rangka kerja ini, menggunakan satu kad untuk menjalankan Llama, daya pemprosesan adalah 2.65 kali lebih tinggi daripada dua kad. satu

AI yang boleh dijelaskan: Menerangkan model AI/ML yang kompleks AI yang boleh dijelaskan: Menerangkan model AI/ML yang kompleks Jun 03, 2024 pm 10:08 PM

Penterjemah |. Disemak oleh Li Rui |. Chonglou Model kecerdasan buatan (AI) dan pembelajaran mesin (ML) semakin kompleks hari ini, dan output yang dihasilkan oleh model ini adalah kotak hitam – tidak dapat dijelaskan kepada pihak berkepentingan. AI Boleh Dijelaskan (XAI) bertujuan untuk menyelesaikan masalah ini dengan membolehkan pihak berkepentingan memahami cara model ini berfungsi, memastikan mereka memahami cara model ini sebenarnya membuat keputusan, dan memastikan ketelusan dalam sistem AI, Amanah dan akauntabiliti untuk menyelesaikan masalah ini. Artikel ini meneroka pelbagai teknik kecerdasan buatan (XAI) yang boleh dijelaskan untuk menggambarkan prinsip asasnya. Beberapa sebab mengapa AI boleh dijelaskan adalah penting Kepercayaan dan ketelusan: Untuk sistem AI diterima secara meluas dan dipercayai, pengguna perlu memahami cara keputusan dibuat

Lima sekolah pembelajaran mesin yang anda tidak tahu Lima sekolah pembelajaran mesin yang anda tidak tahu Jun 05, 2024 pm 08:51 PM

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

Adakah Flash Attention stabil? Meta dan Harvard mendapati bahawa sisihan berat model mereka berubah-ubah mengikut urutan magnitud Adakah Flash Attention stabil? Meta dan Harvard mendapati bahawa sisihan berat model mereka berubah-ubah mengikut urutan magnitud May 30, 2024 pm 01:24 PM

MetaFAIR bekerjasama dengan Harvard untuk menyediakan rangka kerja penyelidikan baharu untuk mengoptimumkan bias data yang dijana apabila pembelajaran mesin berskala besar dilakukan. Adalah diketahui bahawa latihan model bahasa besar sering mengambil masa berbulan-bulan dan menggunakan ratusan atau bahkan ribuan GPU. Mengambil model LLaMA270B sebagai contoh, latihannya memerlukan sejumlah 1,720,320 jam GPU. Melatih model besar memberikan cabaran sistemik yang unik disebabkan oleh skala dan kerumitan beban kerja ini. Baru-baru ini, banyak institusi telah melaporkan ketidakstabilan dalam proses latihan apabila melatih model AI generatif SOTA Mereka biasanya muncul dalam bentuk lonjakan kerugian Contohnya, model PaLM Google mengalami sehingga 20 lonjakan kerugian semasa proses latihan. Bias berangka adalah punca ketidaktepatan latihan ini,

See all articles