


Membantu kecerdasan buatan bergerak ke peringkat baharu, projek sumber terbuka pembelajaran sebab akibat YLearn dikeluarkan
Pada 12 Julai 2022, Syarikat Jiuzhang Yunji DataCanvas mengeluarkan satu lagi pencapaian teknologi sumber terbuka terobosan - projek sumber terbuka pembelajaran kausal YLearn dan berjaya mengadakan sidang akhbar dalam talian.
Tema sidang akhbar ialah "Dari ramalan kepada membuat keputusan, AI yang boleh difahami". Shang Mingdong, Pengasas & Pengerusi CSDN, Rakan Kongsi Pengasas Geek Bang Venture Capital Jiang Tao, Profesor Madya Tetap dan Penyelia Kedoktoran Jabatan Sains Komputer, Universiti Tsinghua Cui Peng dan YLearn R&D Pasukan akan bersama-sama membincangkan hasil penyelidikan terkini pembelajaran kausal dalam akademik dan industri, dan bersama-sama mempromosikan perkembangan pesat sains kausal.
YLearn projek sumber terbuka pembelajaran kausal , ialah global Kit alatan algoritma sumber terbuka sehenti pertama yang mengendalikan proses lengkap pembelajaran sebab-akibat, ia adalah yang pertama untuk menyelesaikan masalah "penemuan sebab, pengenalan kuantiti sebab, sebab anggaran kesan, inferens kontrafaktual dan pembelajaran strategi" dalam pembelajaran sebab-akibat. Lima isu utama mempunyai ciri-ciri sehenti, baharu dan komprehensif serta meluas . Ia mengurangkan ambang untuk digunakan oleh "pembuat keputusan" pada tahap minimum dan membantu kerajaan dan perusahaan meningkatkan keupayaan "membuat keputusan" automatik mereka dengan berkesan.
YLearn projek sumber terbuka pembelajaran kausal ialah pengganti kit alatan pembelajaran mesin automatik DAT dan DingoDB pangkalan data analisis interaktif masa nyata Syarikat Jiuzhang Yunji Selepas itu, alat berat sumber terbuka ketiga dikeluarkan. Sejak itu, perisian asas sumber terbuka Jiuzhang Yunji DataCanvas telah meluaskan lagi wilayahnya Siri alat asas sumber terbuka yang menyepadukan teknologi AI termaju seperti AutoML dan pembelajaran sebab akan mempercepatkan pengeluaran nilai risikan data dalam kerajaan dan. seluruh industri.
Dengan menggabungkan cerapan inovatif daripada bidang akademik yang canggih dan bidang aplikasi pasaran, pasukan R&D projek sumber terbuka DataCanvas Jiuzhang Yunji mendapati bahawa walaupun hasil "ramalan" perniagaan yang digunakan secara meluas pada masa ini berdasarkan pembelajaran mesin meningkatkan pendapatan perniagaan Kesan dalam aspek ini sangat ketara, tetapi memandangkan kerajaan dan perusahaan mempunyai permintaan yang semakin kuat untuk "AI autonomi" dan "pembuat keputusan pintar", pembuat keputusan memerlukan "sebab" yang boleh difahami yang boleh menjelaskan mengapa keputusan dibuat. Oleh itu, pembentangan "hubungan sebab musabab" telah menjadi fungsi yang sangat diperlukan untuk analisis data dan membuat keputusan yang bijak, tetapi pembelajaran mesin yang hanya menyediakan "korelasi" data tidak boleh melakukan ini. Penyepaduan dengan teknologi "Pembelajaran Bersebab" akan menjadi penyelesaian terbaik untuk masalah ini, dan projek sumber terbuka pembelajaran sebab akibat YLearn telah dilahirkan.akhir ke -tamat, paling lengkap dan paling sistematik Kit alatan algoritma pembelajaran kausal secara langsung mengurangkan kos penggunaan "pembuat keputusan" dari sisi alat.
Pada masa ini, YLearn terdiri daripada CausalDiscovery, CausalModel, EstimatorModel, Policy, Interpreter dan komponen lain menyokong penggunaan bebas dan pembungkusan bersatu. Melalui komponen fleksibel ini, YLearn melaksanakan fungsi seperti menggunakan rajah sebab untuk mewakili hubungan sebab akibat dalam set data, mengenal pasti kesan sebab akibat, ungkapan kebarangkalian dan pelbagai model anggaran, dan akan terus menambah dan meningkatkan prestasi berikutan penyelidikan canggih. Untuk menurunkan lagi ambang penggunaan, selain menjadikan proses penggunaan jelas dan ringkas serta mudah digunakan, YLearn juga akan menyepadukan teknologi teras Syarikat Jiuzhang Yunji DataCanvas - pembelajaran mesin automatik AutoML. Dengan sokongan teknologi AutoML, YLearn akan merealisasikan fungsi "automatik" lanjutan seperti pelarasan parameter automatik, pengoptimuman automatik dan penjanaan automatik berbilang penyelesaian membuat keputusan yang sepadan dengan hasil "Y" sebagai tambahan, YLearn juga akan; merealisasikan peta pembuatan keputusan visual berdasarkan hubungan sebab akibat, seperti menetapkan penunjuk operasi untuk operasi perusahaan, dan menyimpulkan kesan dan faedah keputusan yang berbeza secara interaktif. Projek sumber terbuka pembelajaran kausal YLearn, yang menyediakan analisis kausaliti automatik, akan memberikan sokongan penting untuk pembuat keputusan untuk memahami logik pembuatan keputusan AI dan meningkatkan kredibiliti pembuatan keputusan AI membuka pintu kepada "membuat keputusan automatik" untuk kerajaan dan perusahaan kunci AI. Pembelajaran kausal - membawa kecerdasan buatan ke peringkat baharu Potensi pembelajaran sebab dan pengaruhnya terhadap hala tuju masa depan teknologi kecerdasan buatan telah diiktiraf oleh ahli akademik dan industri. Judea Pearl, pemenang Anugerah Turing pada tahun 2011 dan bapa kepada rangkaian Bayesian, pernah menyebut bahawa "tanpa keupayaan untuk membuat alasan tentang hubungan kausal, pembangunan AI akan terhad secara asasnya."Profesor madya tetap dan penyelia kedoktoran Jabatan Sains Komputer di Universiti TsinghuaCui Peng menegaskan pada sidang akhbar ini bahawa "statistik sebab akan memainkan peranan penting dalam asas teori generasi baharu kecerdasan buatan." Punca keterbatasan semasa kecerdasan buatan ialah "mengetahuinya, tetapi tidak mengetahui sebabnya." Antaranya, "ran" dalam "mengetahuinya" merujuk kepada hubungan "korelasi" antara data, dan "ran" merujuk kepada hubungan "sebab" antara data. Melalui penyelidikan selama bertahun-tahun tentang memperkenalkan statistik kausa ke dalam pembelajaran mesin, pasukan Profesor Cui mendapati bahawa statistik kausa mempunyai prestasi cemerlang dalam menyelesaikan masalah kestabilan, masalah kebolehtafsiran dan masalah keadilan algoritma pembelajaran mesin.
Pasaran komersil juga menyeru untuk mempercepatkan aplikasi industri teknologi pembelajaran kausal. Laporan cerapan inovasi pembelajaran kausal terbaru Gartner "Innovation Insight: Causal
AI" menyatakan bahawa "kecerdasan buatan mesti bergerak melangkaui ramalan berasaskan korelasi ke arah penyelesaian berasaskan sebab untuk mencapai keputusan yang lebih baik dan automasi besar yang lebih cekap. …Kecerdasan buatan kausal adalah penting ke masa hadapan. Ciri-ciri ini akan mengurangkan lagi kos dan meningkatkan kecekapan untuk kerajaan dan perusahaan yang melaksanakan peningkatan kecerdasan digital berdasarkan teknologi AI, dan meraih nilai data yang tidak dijangka.
Alat sumber terbuka - enjin aplikasi inovatif teknologi AI
Teknologi termaju boleh mencapai aplikasi berskala besar yang berjaya dalam pasaran komersial, yang tidak dapat dipisahkan daripada rangsangan yang berkuasa alat sumber terbuka dan pemangkin.
Sama seperti Sklearn (salah satu modul pengaturcaraan yang paling terkenal dalam bidang pembelajaran mesin) adalah untuk aplikasi teknologi pembelajaran mesin, dan TensorFlow dan PyTorch (dua rangka kerja berciri penuh untuk membina model pembelajaran mendalam ) adalah untuk Kepentingan dan nilai besar penerapan teknologi pembelajaran mendalam juga memerlukan segera "alat sumber terbuka" untuk menerobos kesesakan aplikasi dalam bidang pembelajaran sebab.
Kemunculan kit sumber terbuka pembelajaran sebab musabab YLearn menyelesaikan masalah "tersekat" kekurangan kit alat pembelajaran sebab akibat yang berkuasa dan lengkap di pasaran, mempercepatkan pengenalan teknologi pembelajaran sebab akibat daripada "makmal" kepada aplikasi "industri". Jiang Tao
, pengasas dan pengerusi CSDN dan rakan pengasas Geek Bang Venture Capital, berkata, “Sudah tiba masanya untuk sumber terbuka di China, dan akan ada pasaran yang lebih besar apabila teknologi dipopularkan YLearn lebih canggih tentang aplikasi teknologi AI dalam pelbagai industri akan menjadi pendorong yang hebatPembangunan industri perisian negara saya adalah asas untuk pertumbuhan industri sumber terbuka, menyediakannya dengan tanah pertumbuhan yang hebat kepentingan pembangunan industri sumber terbuka dan telah melaksanakannya dalam "Rancangan Lima Tahun Ke-14". dan CTO Shang Mingdong
berkata dalam ucapannya pada sidang akhbar itu, "2022 telah memasuki tahun berlepas untuk sumber terbuka. Kami percaya bahawa dalam bidang AI, perisian adalah infrastruktur Berbanding dengan perisian aplikasi, sumber terbuka adalah 'medan pertempuran utama' untuk perisian asas. ”Mematuhi budaya produk Syarikat Jiuzhang Yunji DataCanvas yang menumpukan rapat pada konsep inovasi teknologi "kecerdasan data" dan "menyepadukan dan menggunakan teknologi AI kepada senario perniagaan sebenar", pasukan R&D Jiuzhang Yunji DataCanvas projek sumber terbuka berinovasi dan berulang Walaupun alat sumber terbuka, kami terus menyerap keperluan dan maklum balas daripada aplikasi praktikal dalam pelbagai senario daripada kerajaan dan industri Pada masa yang sama, siri produk perisian asas AI Jiuzhang Yunji DataCanvas sedang disepadukan secara berterusan dengan alatan sumber terbuka yang dibangunkan secara bebas, dan juga akan dipercepatkan pelanggan Kerajaan dan perusahaan menikmati nilai perniagaan yang dibawa oleh aplikasi teknologi gabungan AI .
Atas ialah kandungan terperinci Membantu kecerdasan buatan bergerak ke peringkat baharu, projek sumber terbuka pembelajaran sebab akibat YLearn dikeluarkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Dalam bidang pembelajaran mesin dan sains data, kebolehtafsiran model sentiasa menjadi tumpuan penyelidik dan pengamal. Dengan aplikasi meluas model yang kompleks seperti kaedah pembelajaran mendalam dan ensemble, memahami proses membuat keputusan model menjadi sangat penting. AI|XAI yang boleh dijelaskan membantu membina kepercayaan dan keyakinan dalam model pembelajaran mesin dengan meningkatkan ketelusan model. Meningkatkan ketelusan model boleh dicapai melalui kaedah seperti penggunaan meluas pelbagai model yang kompleks, serta proses membuat keputusan yang digunakan untuk menerangkan model. Kaedah ini termasuk analisis kepentingan ciri, anggaran selang ramalan model, algoritma kebolehtafsiran tempatan, dsb. Analisis kepentingan ciri boleh menerangkan proses membuat keputusan model dengan menilai tahap pengaruh model ke atas ciri input. Anggaran selang ramalan model

Artikel ini akan memperkenalkan cara mengenal pasti pemasangan lampau dan kekurangan dalam model pembelajaran mesin secara berkesan melalui keluk pembelajaran. Underfitting dan overfitting 1. Overfitting Jika model terlampau latihan pada data sehingga ia mempelajari bunyi daripadanya, maka model tersebut dikatakan overfitting. Model yang dipasang terlebih dahulu mempelajari setiap contoh dengan sempurna sehingga ia akan salah mengklasifikasikan contoh yang tidak kelihatan/baharu. Untuk model terlampau, kami akan mendapat skor set latihan yang sempurna/hampir sempurna dan set pengesahan/skor ujian yang teruk. Diubah suai sedikit: "Punca overfitting: Gunakan model yang kompleks untuk menyelesaikan masalah mudah dan mengekstrak bunyi daripada data. Kerana set data kecil sebagai set latihan mungkin tidak mewakili perwakilan yang betul bagi semua data. 2. Underfitting Heru

Pada tahun 1950-an, kecerdasan buatan (AI) dilahirkan. Ketika itulah penyelidik mendapati bahawa mesin boleh melakukan tugas seperti manusia, seperti berfikir. Kemudian, pada tahun 1960-an, Jabatan Pertahanan A.S. membiayai kecerdasan buatan dan menubuhkan makmal untuk pembangunan selanjutnya. Penyelidik sedang mencari aplikasi untuk kecerdasan buatan dalam banyak bidang, seperti penerokaan angkasa lepas dan kelangsungan hidup dalam persekitaran yang melampau. Penerokaan angkasa lepas ialah kajian tentang alam semesta, yang meliputi seluruh alam semesta di luar bumi. Angkasa lepas diklasifikasikan sebagai persekitaran yang melampau kerana keadaannya berbeza daripada di Bumi. Untuk terus hidup di angkasa, banyak faktor mesti dipertimbangkan dan langkah berjaga-jaga mesti diambil. Para saintis dan penyelidik percaya bahawa meneroka ruang dan memahami keadaan semasa segala-galanya boleh membantu memahami cara alam semesta berfungsi dan bersedia untuk menghadapi kemungkinan krisis alam sekitar

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

FP8 dan ketepatan pengiraan titik terapung yang lebih rendah bukan lagi "paten" H100! Lao Huang mahu semua orang menggunakan INT8/INT4, dan pasukan Microsoft DeepSpeed memaksa diri mereka menjalankan FP6 pada A100 tanpa sokongan rasmi daripada Nvidia. Keputusan ujian menunjukkan bahawa kaedah baharu TC-FPx FP6 kuantisasi pada A100 adalah hampir atau kadangkala lebih pantas daripada INT4, dan mempunyai ketepatan yang lebih tinggi daripada yang terakhir. Selain itu, terdapat juga sokongan model besar hujung ke hujung, yang telah bersumberkan terbuka dan disepadukan ke dalam rangka kerja inferens pembelajaran mendalam seperti DeepSpeed. Keputusan ini juga mempunyai kesan serta-merta pada mempercepatkan model besar - di bawah rangka kerja ini, menggunakan satu kad untuk menjalankan Llama, daya pemprosesan adalah 2.65 kali lebih tinggi daripada dua kad. satu

Penterjemah |. Disemak oleh Li Rui |. Chonglou Model kecerdasan buatan (AI) dan pembelajaran mesin (ML) semakin kompleks hari ini, dan output yang dihasilkan oleh model ini adalah kotak hitam – tidak dapat dijelaskan kepada pihak berkepentingan. AI Boleh Dijelaskan (XAI) bertujuan untuk menyelesaikan masalah ini dengan membolehkan pihak berkepentingan memahami cara model ini berfungsi, memastikan mereka memahami cara model ini sebenarnya membuat keputusan, dan memastikan ketelusan dalam sistem AI, Amanah dan akauntabiliti untuk menyelesaikan masalah ini. Artikel ini meneroka pelbagai teknik kecerdasan buatan (XAI) yang boleh dijelaskan untuk menggambarkan prinsip asasnya. Beberapa sebab mengapa AI boleh dijelaskan adalah penting Kepercayaan dan ketelusan: Untuk sistem AI diterima secara meluas dan dipercayai, pengguna perlu memahami cara keputusan dibuat

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

MetaFAIR bekerjasama dengan Harvard untuk menyediakan rangka kerja penyelidikan baharu untuk mengoptimumkan bias data yang dijana apabila pembelajaran mesin berskala besar dilakukan. Adalah diketahui bahawa latihan model bahasa besar sering mengambil masa berbulan-bulan dan menggunakan ratusan atau bahkan ribuan GPU. Mengambil model LLaMA270B sebagai contoh, latihannya memerlukan sejumlah 1,720,320 jam GPU. Melatih model besar memberikan cabaran sistemik yang unik disebabkan oleh skala dan kerumitan beban kerja ini. Baru-baru ini, banyak institusi telah melaporkan ketidakstabilan dalam proses latihan apabila melatih model AI generatif SOTA Mereka biasanya muncul dalam bentuk lonjakan kerugian Contohnya, model PaLM Google mengalami sehingga 20 lonjakan kerugian semasa proses latihan. Bias berangka adalah punca ketidaktepatan latihan ini,
