Penterjemah |. Zhang Yi
Penilai |. organisasi yang dipacu wawasan) merujuk kepada organisasi yang dipacu wawasan (berorientasikan maklumat). Untuk menjadi IDO, anda terlebih dahulu memerlukan data dan alat untuk mengendalikan dan menganalisis data kedua, penganalisis data atau saintis data dengan pengalaman yang sesuai dan akhirnya, anda perlu mencari teknologi atau kaedah untuk melaksanakan pembuatan keputusan berasaskan wawasan proses di seluruh syarikat.
Perniagaan boleh menggunakan pelbagai perisian dan skrip layan diri untuk menyelesaikan tugasan yang berbeza untuk mengelakkan kesilapan manusia. Begitu juga, anda boleh membuat keputusan berdasarkan data untuk mengelakkan kesilapan manusia.
2. Mengapakah syarikat lambat menggunakan kecerdasan buatan
Hanya minoriti syarikat menggunakan kecerdasan buatan atau pembelajaran mesin untuk memproses data. Biro Banci AS berkata sehingga 2020, kurang daripada 10% perniagaan AS telah menggunakan pembelajaran mesin (kebanyakannya syarikat besar).
4. Pecahkan proses pembelajaran mesin
Sebarang proses ML bermula dengan data. Adalah diterima umum bahawa penyediaan data ialah bahagian terpenting dalam proses ML, dan bahagian pemodelan hanyalah satu bahagian daripada saluran paip data keseluruhan, sambil dipermudahkan melalui alatan AutoML. Aliran kerja yang lengkap masih memerlukan banyak kerja untuk mengubah data dan menyuapkannya kepada model. Penyediaan data dan transformasi data boleh menjadi sebahagian daripada bahagian kerja yang paling memakan masa dan tidak menyenangkan.Selain itu, data perniagaan yang digunakan untuk melatih model ML akan dikemas kini dengan kerap. Oleh itu, ia memerlukan perusahaan membina saluran paip ETL yang kompleks yang boleh menguasai alatan dan proses yang kompleks, jadi memastikan kesinambungan dan sifat masa nyata proses ML juga merupakan tugas yang mencabar.
5. Sepadukan ML dengan Aplikasi
Andaikan sekarang kita telah membina model ML dan kemudiannya perlu menggunakannya. Pendekatan penggunaan klasik menganggapnya sebagai komponen lapisan aplikasi, seperti yang ditunjukkan di bawah:
Inputnya ialah data dan output ialah ramalan yang kami dapat. Gunakan output model ML dengan menyepadukan API aplikasi ini. Ini semua kelihatan mudah hanya dari perspektif pembangun, tetapi tidak apabila anda memikirkan prosesnya. Dalam organisasi yang besar, sebarang penyepaduan dan penyelenggaraan dengan aplikasi perniagaan boleh menjadi agak rumit. Walaupun syarikat itu celik teknologi, sebarang permintaan untuk perubahan kod mesti melalui proses semakan dan ujian khusus merentas pelbagai peringkat jabatan. Ini menjejaskan fleksibiliti secara negatif dan meningkatkan kerumitan aliran kerja keseluruhan.Jika terdapat fleksibiliti yang mencukupi dalam menguji pelbagai konsep dan idea, pembuatan keputusan berasaskan ML akan menjadi lebih mudah, jadi orang ramai akan lebih suka produk dengan keupayaan layan diri.
6. Pembelajaran mesin layan diri/pangkalan data pintar?
Seperti yang kita lihat di atas, data ialah teras proses ML, alatan ML sedia ada mengambil data dan ramalan pengembalian, dan ramalan ini Ia juga merupakan bentuk data.
Mengekalkan penyepaduan data yang kompleks dan saluran paip ETL antara model dan pangkalan data ML merupakan salah satu cabaran terbesar yang dihadapi oleh proses ML.
SQL ialah alat manipulasi data yang sangat baik, jadi kami boleh menyelesaikan masalah ini dengan memperkenalkan model ML ke dalam lapisan data. Dalam erti kata lain, model ML akan belajar dalam pangkalan data dan ramalan pulangan.
Menyepadukan model ML dengan aplikasi perniagaan melalui API merupakan satu lagi cabaran yang dihadapi.
Aplikasi perniagaan dan alatan BI digandingkan rapat dengan pangkalan data. Oleh itu, jika alat AutoML menjadi sebahagian daripada pangkalan data, kita boleh menggunakan sintaks SQL standard untuk membuat ramalan. Seterusnya, penyepaduan API antara model ML dan aplikasi perniagaan tidak lagi diperlukan kerana model tersebut berada dalam pangkalan data.
Benamkan alatan AutoML dalam pangkalan data akan membawa banyak faedah, seperti:
Dengan cara ini, gambar rajah penyepaduan yang agak kompleks di atas berubah seperti berikut:
Ia kelihatan lebih mudah dan menjadikan proses ML lebih lancar dan cekap .
Langkah seterusnya dalam mencari penyelesaian ialah melaksanakannya.
Untuk ini, kami menggunakan struktur yang dipanggil AI Tables. Ia membawa pembelajaran mesin ke platform data dalam bentuk jadual maya. Ia boleh dibuat seperti jadual pangkalan data lain dan kemudian didedahkan kepada aplikasi, alat BI dan pelanggan DB. Kami membuat ramalan dengan hanya menanyakan data.
Jadual AI pada asalnya dibangunkan oleh MindsDB dan tersedia sebagai sumber terbuka atau perkhidmatan awan terurus. Mereka menyepadukan pangkalan data SQL dan NoSQL tradisional seperti Kafka dan Redis.
Konsep Jadual AI membolehkan kami melaksanakan proses ML dalam pangkalan data supaya semua langkah proses ML (iaitu penyediaan data, latihan model dan ramalan) boleh jadi pangkalan data.
Pertama, pengguna perlu mencipta Jadual AI mengikut keperluan mereka sendiri, yang serupa dengan model pembelajaran mesin, termasuk lajur daripada sumber jadual, dsb. ciri valens; dan kemudian selesaikan tugas pemodelan yang tinggal dengan sendirinya melalui enjin AutoML. Contoh akan diberikan kemudian.
Setelah Jadual AI dibuat, ia sedia untuk digunakan tanpa sebarang penggunaan selanjutnya. Untuk membuat ramalan, hanya jalankan pertanyaan SQL standard pada Jadual AI.
Anda boleh membuat ramalan satu demi satu atau secara berkelompok. Jadual AI boleh mengendalikan banyak tugas pembelajaran mesin yang kompleks, seperti siri masa berbilang variasi, pengesanan anomali, dsb.
Bagi peruncit, memastikan produk berada dalam stok pada masa yang tepat adalah tugas yang rumit. Apabila permintaan meningkat, penawaran meningkat. Berdasarkan data dan pembelajaran mesin ini, kami boleh meramalkan jumlah stok produk tertentu pada hari tertentu, menghasilkan lebih banyak hasil untuk peruncit.
Mula-mula anda perlu menjejaki maklumat berikut dan membina Jadual AI:
Seperti yang ditunjukkan di bawah:
Untuk mencipta dan melatih Jadual AI, anda mesti membenarkan MindsDB mengakses data terlebih dahulu. Untuk arahan terperinci, sila rujuk dokumentasi MindsDB.
Jadual AI adalah seperti model ML dan memerlukan data sejarah untuk melatihnya.
Yang berikut menggunakan perintah SQL mudah untuk melatih AITable:
Mari kita menganalisis pertanyaan ini:
Pada masa yang sama, anda boleh melihat ketepatan dan keyakinan keseluruhan setiap ramalan dan menganggarkan lajur (ciri) yang lebih penting untuk keputusan.
Dalam pangkalan data, kami selalunya perlu mengendalikan tugas yang melibatkan data siri masa berbilang variasi dengan kardinaliti tinggi. Menggunakan kaedah tradisional, usaha yang besar diperlukan untuk mencipta model ML tersebut. Kita perlu mengumpulkan data dan mengisihnya berdasarkan masa, tarikh atau medan data cap masa tertentu.
Sebagai contoh, kami meramalkan bilangan tukul yang dijual di kedai perkakasan. Nah, data dikumpulkan mengikut kedai dan produk, dan ramalan dibuat untuk setiap gabungan kedai dan produk yang berbeza. Ini membawa kita kepada masalah mencipta model siri masa untuk setiap kumpulan.
Ini kelihatan seperti projek yang besar, tetapi MindsDB menyediakan kaedah untuk mencipta model ML tunggal menggunakan pernyataan GROUP BY untuk melatih data siri masa berbilang variasi sekaligus. Mari lihat cara ia dilakukan menggunakan hanya satu arahan SQL:
Peramal stock_forecaster dicipta untuk meramalkan jumlah item yang akan dijual oleh kedai tertentu pada masa hadapan. Data diisih mengikut tarikh jualan dan dikumpulkan mengikut kedai. Jadi kita boleh meramalkan jumlah jualan untuk setiap kedai.
Dengan menggunakan pertanyaan di bawah untuk menyambungkan jadual data jualan dengan peramal, operasi JOIN menambah kuantiti yang diramalkan pada rekod, supaya kita boleh mendapatkan banyak sekali gus Ramalan kelompok yang direkodkan.
Untuk mengetahui lebih lanjut tentang menganalisis dan menggambarkan ramalan dalam alatan BI, lihat artikel ini.
Pendekatan tradisional menganggap model ML sebagai aplikasi bebas, memerlukan penyelenggaraan saluran paip ETL ke pangkalan data dan penyepaduan API kepada aplikasi perniagaan. Walaupun alatan AutoML menjadikan bahagian pemodelan mudah dan mudah, aliran kerja ML yang lengkap masih memerlukan pakar yang berpengalaman untuk mengurusnya. Malah, pangkalan data sudah pun menjadi alat pilihan untuk penyediaan data, jadi lebih masuk akal untuk memperkenalkan ML ke dalam pangkalan data daripada memperkenalkan data ke dalam ML. Oleh kerana alatan AutoML berada dalam pangkalan data, binaan AI Tables daripada MindsDB menyediakan pengamal data AutoML layan diri dan memperkemas aliran kerja pembelajaran mesin.
Pautan asal: https://dzone.com/articles/self-service-machine-learning-with-intelligent-dat
Zhang Yi, editor komuniti 51CTO, jurutera peringkat pertengahan. Terutamanya menyelidik pelaksanaan algoritma kecerdasan buatan dan aplikasi senario, mempunyai pemahaman dan penguasaan algoritma pembelajaran mesin dan algoritma kawalan automatik, dan akan terus memberi perhatian kepada trend pembangunan teknologi kecerdasan buatan di dalam dan luar negara, terutamanya aplikasi buatan. teknologi perisikan dalam kereta bersambung pintar dan rumah pintar Pelaksanaan dan aplikasi khusus dalam bidang lain.
Atas ialah kandungan terperinci Pembelajaran mesin layan diri berdasarkan pangkalan data pintar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!