Ia telah lama menjadi tumpuan utama industri data.
Tadbir urus data ialah semua langkah untuk memastikan data adalah selamat, peribadi, tepat, tersedia dan boleh dipercayai, termasuk pembangunan standard dalaman dan dasar data untuk mengawal selia pengumpulan, penyimpanan, pemprosesan dan pelupusan data. Proses ini penting untuk melindungi privasi pengguna dan mengekalkan integriti data.
Seperti yang diketengahkan oleh definisi ini, tadbir urus data adalah tentang mengurus data—tepatnya, enjin yang memacu model AI.
Walaupun hubungan antara tadbir urus data dan AI pada mulanya jelas, mengaitkannya dengan kelesuan AI dengan menekankan punca keletihan memastikan penggunaan istilah yang konsisten sepanjang artikel.
AI keletihan boleh berlaku disebabkan oleh halangan dan cabaran yang dihadapi oleh syarikat, pembangun atau pasukan, mengakibatkan pelaksanaan terhalang atau realisasi nilai sistem AI.
Sebab utama AI yang terlalu hyping adalah jangkaan yang tidak realistik terhadap keupayaannya. Pihak berkepentingan perlu diselaraskan dengan keupayaan, kemungkinan, had dan risiko AI untuk menilai nilai dan aplikasinya dengan betul.
Mengenai risiko, etika sering dianggap sebagai perkara yang difikirkan selepas itu, yang membawa kepada pengabaian inisiatif AI yang tidak patuh.
Anda pasti tertanya-tanya tentang peranan tadbir urus data dalam menyebabkan kelesuan AI – ini adalah premis artikel ini.
Di sinilah kita akan pergi seterusnya.
AI keletihan boleh dibahagikan secara kasar kepada pra-penyerahan dan pasca-pengerahan. Mari kita fokus pada kerja pra-penyerahan dahulu.
Terdapat banyak faktor yang digunakan untuk menaik taraf Bukti Konsep (PoC) kepada penggunaan, seperti:
Sebaik sahaja kami menilai Untuk menentukan masalah yang terbaik boleh diselesaikan menggunakan algoritma ML, pasukan sains data menjalankan analisis data penerokaan. Banyak corak data asas didedahkan pada peringkat ini, menyerlahkan sama ada data yang diberikan mengandungi isyarat kaya Ia juga membantu dalam mencipta ciri kejuruteraan untuk mempercepatkan proses pembelajaran algoritma.
Seterusnya, pasukan membina model garis dasar pertama dan sering mendapati prestasinya tidak pada tahap yang boleh diterima. Model yang outputnya sebaik menterbalikkan syiling tidak menambah apa-apa nilai, yang merupakan salah satu kemunduran pertama dan pengajaran yang dipelajari semasa membina model ML.
Syarikat mungkin berpindah dari satu masalah perniagaan ke masalah perniagaan yang lain, membawa kepada keletihan. Namun, jika data asas tidak membawa isyarat yang kaya, tiada algoritma AI boleh dibina di atasnya. Model mesti mempelajari perkaitan statistik daripada data latihan untuk digeneralisasikan kepada data yang tidak kelihatan. .
Sebab yang tidak terkira banyaknya boleh menyebabkan kemerosotan prestasi, dan kualiti data yang lemah ialah masalah paling biasa yang melanda model, yang mengehadkan keupayaan model untuk meramalkan respons sasaran dengan tepat tanpa ketiadaan atribut utama.
Pertimbangkan bahawa salah satu ciri penting yang tiada dalam hanya 10% daripada data latihan kini menjadi batal 50% daripada masa dalam data pengeluaran, yang membawa kepada ramalan yang salah dan usaha untuk memastikan model berprestasi secara konsisten membuat saintis data dan Pasukan perniagaan menjadi letih, menghakis keyakinan dalam saluran paip data dan meletakkan pelaburan projek pada risiko.
Tadbir Urus Data Adalah Kunci
Langkah tadbir urus data yang teguh adalah penting untuk menangani kedua-dua jenis kelesuan AI. Memandangkan data adalah teras kepada model ML, data yang kaya dengan isyarat, bebas ralat dan berkualiti tinggi diperlukan untuk kejayaan projek ML. Menangani kelesuan AI memerlukan tumpuan yang kuat pada tadbir urus data. Oleh itu, kita mesti bekerja keras untuk memastikan kualiti data yang betul, meletakkan asas untuk membina model terkini dan menyampaikan cerapan perniagaan yang boleh dipercayai.
Kualiti data ialah kunci kepada tadbir urus data yang berkembang maju dan faktor kritikal dalam kejayaan algoritma pembelajaran mesin. Syarikat mesti melabur dalam kualiti data, seperti menerbitkan laporan kepada pengguna data. Dalam projek sains data, fikirkan tentang perkara yang berlaku apabila data berkualiti rendah memasuki model, yang boleh membawa kepada prestasi yang lemah.
Jelas sekali, bukan hanya usaha yang dilakukan, tetapi banyak masa yang hilang sebelum data yang betul mula dimasukkan.
Oleh itu, adalah sentiasa disyorkan untuk membetulkan isu data di sumber untuk mengelakkan lelaran yang memakan masa sedemikian. Akhirnya, laporan kualiti data yang diterbitkan membayangkan bahawa pasukan sains data (atau mana-mana pengguna hiliran lain dan pengguna data) memahami kualiti data masuk yang boleh diterima.
Tanpa kualiti data dan langkah tadbir urus, saintis data akan dirundung masalah data, mengakibatkan model tidak berjaya yang membawa kepada kelesuan AI.
Artikel ini menyerlahkan dua peringkat permulaan kelesuan AI dan menerangkan cara langkah tadbir urus data seperti pelaporan kualiti data boleh memacu pembinaan model yang boleh dipercayai dan teguh.
Dengan mewujudkan asas yang kukuh melalui tadbir urus data, syarikat boleh membina pelan hala tuju untuk pembangunan dan penerimaan AI yang berjaya dan lancar, menyemai semangat.
Untuk memastikan artikel ini memberikan gambaran menyeluruh tentang pelbagai cara untuk menangani kelesuan AI, saya juga menyerlahkan peranan budaya organisasi, yang digabungkan dengan amalan terbaik lain seperti tadbir urus data akan membolehkan pasukan sains data bekerja dengan lebih pantas dan lebih banyak lagi. secara berkesan Bina sumbangan AI yang bermakna dengan cepat.
Atas ialah kandungan terperinci Bolehkah kelesuan AI diselesaikan melalui tadbir urus data?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!