AI berorientasikan data boleh membantu mengurangkan ilusi dan berat sebelah dalam sistem AI generatif, dengan itu meningkatkan kualiti outputnya.
Diterjemah daripada The Paradigm Shift daripada Model-Centric kepada Data-Centric AI, pengarang Rahul Pradhan mempunyai pengalaman lebih daripada 16 tahun dan kini berkhidmat sebagai Naib Presiden Produk dan Strategi di Couchbase.
Dengan kemajuan kecerdasan buatan (AI) seperti Transformer Neural Networks dan Generative Adversarial Networks (GAN), bidang teknologi sedang mengalami transformasi besar. Bukan sahaja teknologi ini mempunyai potensi yang sangat besar, mereka juga boleh membuka kunci inovasi dan kreativiti pada skala. Mereka boleh menyediakan penyelesaian yang lebih tepat dan cekap serta membawa peluang perniagaan dan pembangunan baharu kepada pelbagai industri. Gabungan rangkaian saraf pengubah dan GAN membolehkan sistem AI memahami dan menjana bahasa, imej dan bunyi manusia dengan lebih baik, sekali gus menggalakkan pembangunan pemprosesan bahasa semula jadi, penglihatan komputer dan pengecaman pertuturan serta bidang lain. Apabila teknologi ini menjadi semakin matang, kita boleh menjangkakan lebih banyak aplikasi dan penemuan inovatif akan muncul, membawa lebih banyak kepada masyarakat manusia
Apabila AI berkembang, data menjadi penting. Data ialah nadi yang mendorong projek pembelajaran mesin, mengubah konsep menjadi cerapan praktikal. Walau bagaimanapun, memanfaatkan data secara berkesan dalam projek AI penuh dengan cabaran, yang menghalang penerimaan dan realisasi nilai transformasinya.
Untuk mempertingkatkan pembangunan AI, kami sedang mengalami anjakan paradigma daripada transformasi AI tertumpu model kepada tertumpu data. Tujuan anjakan ini adalah untuk mengurangkan halusinasi dan berat sebelah yang timbul dalam sistem rangkaian permusuhan generatif. Dengan memfokuskan pada AI tertumpu data dan mendekatkan model kepada data, kami boleh meningkatkan output model AI dan membantu perusahaan merealisasikan potensi penuh mereka. Peralihan ini akan membawa dorongan penting kepada pembangunan AI.
Kaedah AI tertumpu model tradisional ialah cara utama pembangunan pembelajaran mesin. Idea terasnya adalah untuk meningkatkan prestasi model melalui lelaran berterusan untuk menjana model terbaik untuk mengendalikan set data yang diberikan. Penyelidik dan jurutera menghabiskan banyak masa untuk memperhalusi parameter, bilangan lapisan dan elemen seni bina model yang lain. Walau bagaimanapun, kerana pembinaan dan model penalaan halus merupakan proses yang kompleks dan intensif sumber pada masa lalu, memerlukan kepakaran mendalam untuk menghasilkan hasil yang bermakna, data sering dianggap sebagai faktor kedua. Walau bagaimanapun, dalam beberapa tahun kebelakangan ini, dengan kemajuan teknologi pembelajaran mesin dan peningkatan kuasa pengkomputeran, kepentingan data telah ditekankan secara beransur-ansur. Kaedah AI moden memberi lebih perhatian kepada kualiti dan kepelbagaian data, model latihan melalui set data yang lebih besar dan kuasa pengkomputeran yang lebih berkuasa, dengan itu meningkatkan prestasi dan keupayaan generalisasi model. Pendekatan berpusatkan data ini telah menjadi aliran arus perdana semasa dalam bidang pembelajaran mesin.
Pendekatan mengutamakan data meningkatkan kualiti data untuk latihan model, termasuk pembersihan, peningkatan dan memastikan data tersebut mewakili senario dunia sebenar.
Apabila model kecerdasan buatan (AI) matang dan berkembang dalam kerumitan, organisasi perlu menumpukan pada meningkatkan kualiti data dan membina pakatan yang lebih erat antara model dan data. Dalam bidang yang berkembang ini, adalah penting untuk membuat anjakan yang perlu dan jelas: mengalihkan model lebih dekat kepada data, dan bukannya memindahkan data kepada model. Ini meningkatkan kualiti keluaran model dan mengurangkan ilusi yang sering melanda sistem AI. Pendekatan berpusatkan data kepada AI ialah asas untuk organisasi yang ingin menyampaikan pengalaman generatif dan ramalan berdasarkan data terkini.
Walaupun AI berpusatkan data ialah hala tuju pembangunan masa hadapan, AI berpusatkan model masih memainkan peranan penting dalam beberapa senario. AI berpusatkan model amat penting apabila data terhad atau matlamatnya adalah untuk meneroka kerumitan model dan had prestasi. Ia memacu sempadan penyelidikan AI dan menyediakan kemungkinan untuk menyelesaikan masalah di mana data berkualiti tinggi sukar diperoleh. Oleh itu, AI berpusatkan model bukan sekadar tambahan kepada AI dipacu data, tetapi pendekatan yang sangat diperlukan dalam bidang AI.
Dengan beralih kepada pendekatan AI tertumpu data yang memastikan kualiti dan perkaitan data, organisasi boleh memperoleh faedah berikut:
Berpusatkan data Salah satu daripada kelebihan tipikal pendekatan pusat ialah keupayaan untuk memberikan pengalaman yang disepadukan rapat dengan senario dunia sebenar. Tidak seperti pendekatan tertumpu model di mana model sering bergelut dengan kesilapan data berkualiti rendah, kecerdasan buatan (AI) tertumpu data berusaha untuk merapatkan jurang antara model AI dan realiti dinamik yang mereka cuba tavigasi.
Halusinasi AI disebabkan terutamanya oleh data yang rosak, dicirikan oleh penjanaan maklumat yang tidak betul atau rekaan. Beralih kepada pendekatan berpusatkan data boleh meningkatkan kemungkinan mengurangkan ralat ini. Melatih model pada set data yang lebih bersih dan lebih representatif menghasilkan output yang lebih tepat dan boleh dipercayai.
Dengan asas data berkualiti tinggi yang kukuh, organisasi boleh mengeluarkan spektrum penuh keupayaan ramalan dan generatif AI. Anjakan ini menjadikan AI lebih berkeupayaan untuk mentafsir corak data sedia ada sambil turut menjana cerapan dan pengalaman baharu, memupuk budaya inovasi dan membuat keputusan termaklum.
Transformasi daripada kaedah kepintaran buatan (AI) berpusat model kepada berpusatkan data mewakili perubahan asas dalam cara berfikir. Ini meletakkan data di tengah-tengah perjalanan transformasi AI. Peralihan ini bukan sekadar tweak teknikal, tetapi penentukuran semula konsep yang meletakkan data di tengah-tengah AI. Apabila organisasi memulakan laluan ini, mereka mesti memupuk infrastruktur data yang mantap, membangunkan literasi data dan mencipta budaya yang menghargai data sebagai asas janji AI.
Membina penyelesaian AI yang berkuasa memerlukan pemahaman bernuansa tentang masa untuk menekankan data dan menumpukan pada inovasi model. Mengimbangi faedah AI tertumpu model dan tertumpu data adalah penting untuk menyelesaikan cabaran AI hari ini supaya organisasi boleh mendapatkan nilai terbaik daripada projek AI mereka. Untuk membantu memastikan model AI dibangunkan berdasarkan data terkini dan tepat serta boleh dipercayai, organisasi mesti menerima transformasi kepada AI berpusatkan data.
Atas ialah kandungan terperinci Paradigma kecerdasan buatan beralih daripada berpusatkan model kepada berpusatkan data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!