Apabila syarikat menggunakan kecerdasan buatan dan membina projek pembelajaran mesin buat kali pertama, mereka sering menumpukan pada teori. Jadi adakah model yang boleh memberikan hasil yang diperlukan? Jika ya, bagaimanakah kita membina dan melatih model sedemikian?
Menurut data IDC, ia mengambil masa lebih daripada 9 bulan secara purata untuk menggunakan penyelesaian kecerdasan buatan atau pembelajaran mesin. Terutamanya kerana alat yang digunakan saintis data untuk membina bukti konsep ini selalunya tidak diterjemahkan dengan baik kepada sistem pengeluaran. Penganalisis IDC Sriram Subramanian berkata: "Kami memanggil masa yang diperlukan untuk proses R&D sebagai 'kelajuan model', iaitu berapa lama masa yang diambil dari mula hingga selesai." MLOps (Operasi Pembelajaran Mesin) ialah satu set amalan terbaik, rangka kerja dan alatan yang boleh membantu perusahaan mengurus data, model, penggunaan, pemantauan dan aspek lain yang menggunakan konsep teori untuk mengesahkan sistem AI dan menjadikannya berkesan.
Subramanian selanjutnya menjelaskan, "MLOps mengurangkan kelajuan model kepada beberapa minggu—kadangkala berhari-hari, sama seperti menggunakan DevOps untuk mempercepatkan purata masa untuk membina aplikasi, itulah sebabnya anda memerlukan MLOps boleh membina." lebih banyak model, berinovasi dengan lebih pantas dan menghadapi lebih banyak senario penggunaan. "Proposisi nilai MLOps adalah jelas." Menurut IDC, 60% daripada perusahaan akan menggunakan MLOps untuk melaksanakan aliran kerja pembelajaran mesin mereka menjelang 2024. Subramanian berkata apabila mereka meninjau responden tentang cabaran penggunaan AI dan pembelajaran mesin, salah satu halangan utama ialah kekurangan MLOp, kedua selepas kos.
Dalam artikel ini, kami meneliti apa itu MLOps, cara ia berkembang dan perkara yang perlu dicapai oleh organisasi dan perlu diingati untuk memanfaatkan sepenuhnya pendekatan yang muncul untuk operasi AI ini.
Evolusi MLOps
Beberapa tahun lalu, apabila Eugenio Zuccarelli mula membina projek pembelajaran mesin, MLOps hanyalah satu set amalan terbaik. Sejak itu, Zuccarelli telah mengusahakan projek AI di beberapa syarikat, termasuk dalam perkhidmatan penjagaan kesihatan dan kewangan, dan dia telah melihat MLOps mula berkembang dari semasa ke semasa untuk memasukkan pelbagai alat dan platform.
“Kami sedang meneroka set data dan model serta berkomunikasi dengan doktor untuk mengetahui ciri-ciri model terbaik Tetapi untuk model ini benar-benar berguna, pengguna perlu benar-benar menggunakannya >Ini bermakna membina apl mudah alih yang boleh dipercayai, pantas dan stabil, dengan sistem pembelajaran mesin di bahagian belakang yang disambungkan melalui API. "Tanpa MLOps, kami tidak akan dapat memastikan ini," katanya
Pasukannya menggunakan platform H2O MLOps dan alatan lain untuk mencipta papan pemuka kesihatan untuk model itu. “Anda pasti tidak mahu perubahan besar pada model dan anda tidak mahu memperkenalkan papan pemuka Kesihatan membolehkan kami memahami jika sistem telah berubah dengan menggunakan platform MLOps. Beliau berkata: "Sangat sukar untuk menukar fail tanpa menghentikan kerja aplikasi. MLOps boleh menukar sistem semasa pengeluaran sedang berjalan dengan impak sistem yang minimum."
Beliau berkata, MLOps Apabila platform semakin matang, ia akan mempercepatkan keseluruhan proses pembangunan model, kerana syarikat tidak perlu mencipta semula rangka kerja untuk setiap projek. Keupayaan pengurusan saluran paip data juga penting untuk pelaksanaan AI.
“Jika kami mempunyai berbilang sumber data yang perlu berkomunikasi antara satu sama lain, di sinilah MLOp berperanan Anda mahu semua data yang mengalir ke dalam model pembelajaran mesin menjadi konsisten dan berkualiti tinggi ayat Seperti kata pepatah, sampah masuk, sampah keluar Jika maklumat model buruk, ramalan itu sendiri akan menjadi buruk ”
Asas MLOps: sasaran yang sentiasa berubah
Tetapi. jangan fikir begitu, hanya kerana terdapat begitu banyak platform dan alatan yang tersedia, prinsip teras MLOps diabaikan. Perusahaan yang baru mengenali MLOps harus ingat bahawa pada terasnya, MLOps adalah mengenai mewujudkan hubungan yang kukuh antara sains data dan kejuruteraan data.
Zuccarelli berkata: "Untuk memastikan kejayaan projek MLOps, anda memerlukan jurutera data dan saintis data untuk bekerja dalam pasukan yang sama
Selain itu, cegah berat sebelah, pastikan ketelusan dan menyediakan kebolehtafsiran akauntabiliti, serta alat yang diperlukan untuk menyokong platform etika, masih dalam pembangunan, "dan pastinya terdapat banyak kerja yang perlu dilakukan untuk perkara ini kerana ia adalah bidang yang sangat baharu." Jadi tanpa penyelesaian yang lengkap Dengan penyelesaian turnkey yang tersedia, syarikat mesti mempunyai pemahaman yang baik tentang cara menjadikan MLOps berkesan dalam melaksanakan semua aspek AI. Ini bermakna membina kepakaran secara meluas, kata Meagan Gentry, pengurus amalan kebangsaan untuk pasukan AI di Insight perundingan teknologi.
MLOps merangkumi keseluruhan skop daripada pengumpulan data, pengesahan dan analisis, kepada mengurus sumber mesin dan prestasi model penjejakan Terdapat banyak alat bantu yang boleh digunakan secara tempatan, dalam awan atau di bahagian tepi sumber dan sebahagiannya adalah milik.
Tetapi menguasai teknologi hanyalah satu aspek, MLOps juga menggunakan kaedah tangkas DevOps dan prinsip pembangunan berulang, kata Gentry. Selain itu, seperti mana-mana bidang berkaitan tangkas, komunikasi adalah penting.
“Komunikasi dalam setiap peranan adalah sangat penting, komunikasi antara saintis data dan jurutera data, komunikasi dengan DevOps dan komunikasi dengan seluruh pasukan IT
Hanya Untuk syarikat baru, MLOps boleh mengelirukan. Terdapat banyak prinsip umum, berpuluh-puluh vendor yang berkaitan, dan juga banyak set alat sumber terbuka.
"Terdapat pelbagai jenis perangkap di sana sini," kata Helen Ristov, pengurus kanan seni bina perusahaan di Capgemini Americas. "Kebanyakan daripada mereka masih dalam pembangunan, dan belum ada set garis panduan rasmi lagi. Seperti DevOps, ini masih merupakan teknologi baru muncul, dan garis panduan serta dasar berkaitan akan mengambil sedikit masa untuk dilancarkan."
Ristov Adalah disyorkan bahawa perusahaan harus memulakan perjalanan MLOps mereka dengan platform data. "Mungkin mereka mempunyai set data, tetapi mereka berada di tempat yang berbeza dan tidak ada persekitaran yang bersatu padu," katanya. . Kaedah memperkenalkan data daripada sumber data yang berbeza, dan aplikasi yang berbeza mempunyai situasi yang berbeza. Contohnya, tasik data sesuai untuk perniagaan yang melakukan analisis dalam jumlah besar pada storan frekuensi tinggi dan kos rendah. Platform MLOps selalunya mempunyai alat untuk membina dan mengurus saluran paip data dan menjejak versi data latihan yang berbeza, tetapi ini bukan pendekatan yang sesuai untuk semua. Kemudian terdapat aspek lain seperti penciptaan model, kawalan versi, pengelogan, set ciri mengukur, mengurus model itu sendiri dan banyak lagi.
"Terdapat banyak pengekodan yang terlibat," kata Ristov Membina platform MLOps boleh mengambil masa berbulan-bulan dan vendor platform mempunyai banyak kerja yang perlu dilakukan apabila ia melibatkan penyepaduan.
“Terdapat banyak ruang untuk pembangunan dalam arah yang berbeza ini, banyak alatan masih dalam pembangunan, ekosistemnya sangat besar, dan orang ramai hanya memilih dan memilih apa yang mereka perlukan masih dalam tahap '. remaja' dan kebanyakan perusahaan Organisasi masih mencari konfigurasi yang paling ideal ”
Lanskap pasaran untuk MLOps
Subramanian berkata bahawa vendor MLOps cenderung dibahagikan kepada tiga kategori utama yang pertama ialah penyedia awan yang besar, seperti AWS, Azure dan Google Cloud menyediakan fungsi MLOps sebagai perkhidmatan kepada pelanggan.
Kategori kedua ialah pengeluar platform pembelajaran mesin, seperti DataRobot, Dataiku, Iguazio, dsb.
“Kategori ketiga ialah apa yang kami gunakan untuk memanggil vendor pengurusan data, seperti Cloudera, SAS, DataBricks, dsb. Kelebihan mereka terletak pada keupayaan pengurusan data dan operasi data, dan kemudian dilanjutkan kepada keupayaan pembelajaran mesin, dan akhirnya kepada Keupayaan MLOps "
Subramanian berkata bahawa ketiga-tiga kawasan ini menunjukkan pertumbuhan yang pesat, dan perkara yang akan menonjolkan vendor MLOps ialah sama ada mereka boleh menyokong kedua-dua persekitaran tempatan dan model penggunaan awan, dan sama ada mereka boleh melaksanakan yang dipercayai. , Kecerdasan buatan yang bertanggungjawab, sama ada ia plug-and-play dan sama ada ia mudah dikembangkan, ini adalah aspek yang mencerminkan perbezaannya. ”
Menurut tinjauan IDC baru-baru ini, kekurangan pelbagai kaedah untuk melaksanakan AI yang bertanggungjawab adalah salah satu daripada tiga halangan utama kepada penyebaran kecerdasan buatan dan pembelajaran mesin, terikat di tempat kedua dengan kekurangan MLOp. Disebabkan oleh Keadaan ini sebahagian besarnya disebabkan oleh fakta bahawa tiada alternatif untuk menggunakan MLOps, kata Sumit Agarwal, penganalisis penyelidikan untuk kecerdasan buatan dan pembelajaran mesin di Gartner
"Kaedah lain adalah manual, jadi ada benar-benar tiada pilihan lain telah tersedia. Jika anda ingin membuat skala, anda memerlukan automasi. Anda memerlukan kod, data dan kebolehkesanan model. "
Menurut tinjauan baru-baru ini oleh Gartner, purata masa yang diperlukan untuk model untuk beralih daripada bukti konsep kepada pengeluaran telah dipendekkan daripada 9 bulan kepada 7.3 bulan. "Tetapi 7.3 bulan masih lama, dan perusahaan Terdapat banyak peluang untuk organisasi memanfaatkan MLOps. ”
Perubahan budaya korporat yang dibawa oleh MLOps
"Seorang saintis data sering kelihatan sebagai saintis gila yang cuba mencari jarum dalam timbunan jerami. Tetapi pada hakikatnya saintis data adalah penemu dan peneroka, bukan kilang yang menghasilkan widget. "Perusahaan sering memandang rendah usaha yang perlu mereka lakukan.
"Orang ramai boleh lebih memahami kejuruteraan dan mempunyai keperluan sedemikian dan sedemikian untuk pengalaman pengguna, tetapi atas sebab tertentu, orang ramai mempunyai keperluan yang sama sekali berbeza untuk model penggunaan. Seseorang akan menganggap bahawa semua saintis data yang mahir dalam menguji persekitaran secara semula jadi akan menggunakan model ini, atau boleh menghantar beberapa kakitangan IT untuk menggunakan mereka, yang salah. Orang ramai tidak faham apa yang mereka perlukan. ”
Banyak syarikat tidak mengetahui tentang kesan ke atas yang mungkin ada pada MLOps pada aspek lain syarikat, yang sering membawa kepada perubahan besar dalam syarikat.
“Anda boleh meletakkan MLOp di pusat panggilan dan purata masa tindak balas sebenarnya akan meningkat kerana perkara mudah diserahkan kepada mesin dan AI untuk mengendalikan, manakala perkara yang diserahkan kepada manusia sebenarnya mengambil masa yang lebih lama, kerana perkara ini cenderung lebih kompleks. Jadi anda perlu memikirkan semula apakah pekerjaan ini, jenis orang yang anda perlukan, dan jenis kemahiran yang perlu dimiliki oleh orang ini "
Tripathy berkata hari ini, sebuah syarikat. Kurang daripada 5% daripadanya. keputusan dalam organisasi didorong oleh algoritma, tetapi ini berubah dengan cepat. "Kami meramalkan bahawa dalam tempoh lima tahun akan datang, 20% hingga 25% daripada keputusan akan didorong oleh algoritma, dan setiap statistik yang kami lihat menunjukkan bahawa kami berada pada titik perubahan dalam pengembangan pesat kecerdasan buatan." > Beliau percaya bahawa MLOps adalah bahagian yang kritikal. Tanpa MLOps, anda tidak boleh menggunakan AI secara konsisten. MLOps ialah pemangkin untuk skala perusahaan AI.
Atas ialah kandungan terperinci Untuk mempercepatkan pembangunan AI, bagaimanakah syarikat boleh menggunakan MLOps untuk meningkatkan kecekapan pengeluaran?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!