#Artikel ini dihasilkan oleh "Pelan Insentif Asal" Pengurus Produk.
Walaupun model AI berskala besar kini sangat popular dan setiap perusahaan mahukan sebahagian daripadanya, algoritma dan data yang terlibat dalam merealisasikan proses ini tidak mudah untuk difahami. Antaranya, penghantaran dan pengurusan data adalah masalah besar. Artikel ini memfokuskan pada kesesakan latihan aplikasi AI, meringkaskan kesukaran latihan AI dan menggabungkannya dengan laporan analisis IDC untuk menyimpulkan bahawa "data" adalah kesesakan terbesar, dan mempertimbangkan penyelesaian kepada masalah ini.
1. Latar belakang produk
“Baru-baru ini, terdapat suara-suara yang membincangkan AI sekali lagi Berbeza dengan sikap tunggu dan lihat terhadap AI dalam dua tahun yang lalu, ramai orang mengatakan bahawa dengan aplikasi ChatGPT, era AI benar-benar tiba. dan pelajar produk dan operasi semuanya sibuk Kami faham apa itu ChatGPT, apa itu Stable Diffusion, dsb., tetapi jurutera algoritma mengalami sakit kepala gila dan mengadu gila Pemimpin meminta mereka membina model besar secepat mungkin, memperbaikinya penunjuk model algoritma secepat mungkin, dan berkhidmat kepada perniagaan Setelah melalui pasukan algoritma, saya mendengar Zhang Gong dan Hu Perbualan berikut antara pekerja:
Gong Zhang: Abang Hu, bagaimanakah latihan model anda?
Gong Hu: Malangnya, sukar untuk dijelaskan dalam satu ayat Tiada data akhirnya saya menyerahkan data itu kepada jabatan perniagaan, tetapi sama ada mereka tidak dapat mengumpulnya, atau data yang mereka kumpulkan semuanya berbeza dan boleh. tidak digunakan?
Gong Zhang: Siapa yang tidak? Begitu juga dengan saya Baru-baru ini, gambar dan video pelanggan menambah sehingga lebih daripada 10 T. Kami telah diminta untuk menghantarnya sendiri data.
Gong Hu berkata bahawa jika syarikat itu boleh membina platform data yang membolehkan kami mendapatkan data dengan cepat dan mengurus data, ia akan menjadi lebih mudah untuk kami menggunakan data dalam kerja harian kami. ”
Selepas mendengar perbualan di atas, saya mendapat idea Platform pengurusan data yang saya bina baru-baru ini untuk pelanggan berdasarkan idea menganyam data hanya dapat menyelesaikan masalah mereka, jadi saya dengan cepat memberi mereka pengenalan produk terperinci dan memberitahu mereka. cara menggunakannya. Konsep reka bentuk "tenunan data" membina platform pengurusan data untuk membantu pengguna mengatasi kesesakan data dalam latihan aplikasi AI.
2. Kesukaran dalam aplikasi latihan AI
Tidak termasuk isu subjektif kakitangan, kami meringkaskan kesukaran objektif latihan aplikasi AI, yang boleh diringkaskan kepada tiga perkara berikut:
Data berkualiti tinggi: Untuk mencapai hasil yang baik dalam latihan algoritma, syarat pertama ialah data berkualiti tinggi Walau bagaimanapun, cara mendapatkan data berkualiti tinggi mempunyai kesukaran berikut:
Kuasa pengkomputeran yang cekap: merujuk kepada fakta bahawa apabila melatih model, jumlah kuasa pengkomputeran yang besar biasanya diperlukan Pada masa yang sama, sukar untuk menggunakan kuasa pengkomputeran dengan cekap
Rangka kerja matang: merujuk kepada aplikasi algoritma yang memerlukan rangka kerja algoritma matang, stabil dan sangat berskala
Ringkasan: Daripada analisis tiga kesukaran dalam latihan aplikasi AI, semuanya berkaitan dengan data Oleh itu, jika masalah data dapat diselesaikan, ia dapat membantu latihan aplikasi AI dengan berkesan melaluinya kesesakan.
3. Adakah data merupakan hambatan bagi aplikasi AI?
Walaupun meringkaskan data dari sisi aplikasi adalah hambatan latihan aplikasi AI, berapa ramai pengguna yang berpendapat demikian? Sekeping data diperlukan untuk menggambarkan.
Kedudukan cabaran utama dalam aplikasi kecerdasan buatan
Berapa banyak kerja yang dilaburkan dalam penyediaan data semasa pembangunan model kecerdasan buatan
Nota: Data datang daripada laporan statistik IDC
Ia boleh dilihat daripada statistik bahawa 29% pengguna percaya bahawa aplikasi kecerdasan buatan kekurangan data latihan dan ujian, dan 85% pengguna percaya bahawa sekurang-kurangnya separuh daripada beban kerja dibelanjakan untuk menyediakan data.
Ringkasan: Memandangkan data telah terbukti sebagai hambatan bagi aplikasi AI, anda boleh mempertimbangkan untuk mencari titik masuk daripada data untuk menyediakan piawaian bersatu dan akses pantas kepada kumpulan besar sumber data yang tersedia Lakukan perancangan produk untuk kedudukan.
4. Reka Bentuk Produk
Selepas mencari data sebagai titik masuk, kami memikirkan cara membina produk berasaskan data Berdasarkan analisis di atas, kami dapati bahawa kami perlu menyelesaikan tiga masalah berasaskan data dalam produk kami:
Berdasarkan platform pengurusan data tradisional, kami mengguna pakai konsep "tenunan data + graf pengetahuan" untuk menjalankan reka bentuk inovatif untuk menangani masalah di atas. Titik terobosan bagi setiap isu adalah seperti berikut:
Langkah seterusnya ialah reka bentuk terperinci produk, yang akan diperkenalkan daripada kedudukan produk, seni bina aplikasi, daya saing yang berbeza dan laluan pembinaan.
1. Seni Bina Produk
1) Kedudukan produk
Menggunakan idea menganyam data untuk menyediakan platform pengurusan data gaya graf pengetahuan untuk memberi perkhidmatan kepada pelanggan yang memerlukan data berkualiti tinggi.
Nota: Walaupun matlamat utama adalah untuk menyelesaikan kesesakan data latihan aplikasi AI, dari perspektif perancangan produk, kami telah mengembangkan senario pengguna, dan sesiapa yang memerlukan perkhidmatan data ialah pengguna sasaran produk ini.
2) Seni bina aplikasi produk
Daripada lapisan data ke lapisan aplikasi produk, kami mereka bentuk seni bina produk berikut:
Lapisan data: menyokong akses kepada jenis data yang berbeza, serta data berstruktur dan data tidak berstruktur Terdapat banyak jenis data untuk latihan AI, terutamanya aplikasi berbilang modal yang memerlukan berbilang jenis data.
Lapisan storan: Memandangkan sifat diskret data, adalah perlu untuk menyokong penyimpanan data di lokasi yang berbeza dan menyokong akses daripada data awan kepada data tempatan.
Platform pengurusan data: Produk teras yang akan direka bentuk kali ini terutamanya merangkumi empat bahagian:
Perkhidmatan data: Selepas mereka bentuk platform, adalah perlu untuk menempah saluran keluar untuk perkhidmatan luaran Bermula dari kedudukan produk, ia tertumpu terutamanya kepada pelanggan toB, jadi perlu mempertimbangkan kedua-dua perkhidmatan visual dan perkhidmatan API. .
Ilustrasi: Tangkapan skrin Tianyancha hanya untuk rujukan pembelajaran
2. Pengkomersilan
Setelah produk dilancarkan, pengkomersilan tidak tersedia, jadi hala tuju pengkomersilan perlu dipertimbangkan dengan jelas semasa peringkat perancangan produk, dan tiga aspek utama berikut harus dipertimbangkan:
1) Kandungan jualan
Untuk pelanggan B-end, kami menyediakan dua jenis kandungan jualan, termasuk produk standard "platform pengurusan data" dan "penyelesaian teknikal".
2) Kaedah jualan
Dua model jualan biasa untuk produk B-end ialah "kerjasama saluran" dan "jualan langsung", dan kaedah ini juga digunakan dalam produk ini.
3) Kelebihan pembezaan
Memandangkan ia adalah platform pengurusan data berdasarkan idea reka bentuk baharu, semasa proses penjualan produk, ia perlu mencerminkan kelebihannya yang berbeza daripada platform pengurusan data tradisional untuk mengejar dan menarik pengguna, Kami boleh merumuskannya sebagai berikut 3 Kelebihan:
Kematangan produk juga memerlukan laluan pembinaan yang berterusan Semasa proses pembinaan produk ini, ia berdasarkan "produk penggilap projek" dan dibina dalam dua peringkat utama.
Artikel ini memfokuskan pada kesesakan latihan aplikasi AI, meringkaskan kesukaran latihan AI dan menggabungkannya dengan laporan analisis IDC untuk menyimpulkan bahawa "data" adalah kesesakan terbesar dan mempertimbangkan penyelesaian kepada masalah ini.
Lakukan reka bentuk transformasi produk berdasarkan konsep tenunan data dan graf pengetahuan, dan perkenalkan secara terperinci platform pengurusan data pintar "orang yang mencari data" daripada perspektif kedudukan produk, seni bina produk, senario aplikasi, dsb. , dan juga memperkenalkan susulan produk Dengan idea promosi perniagaan dan laluan pembinaan, kami boleh membantu pelanggan dengan senario aplikasi data, seperti platform latihan AI, platform anotasi data, dan juga pelanggan yang perlu mengubah dan meningkatkan pengurusan data tradisional produk.
Pada masa hadapan, kami akan meneroka idea mengembangkan jalinan data ke dalam proses sebenar latihan selari model untuk mendapatkan lebih banyak kemungkinan kecekapan data.
Kolumnis
Eric_d, Kolumnis Pengurus Produk untuk Semua Orang. Saya berminat dengan AI, data besar dan bidang lain. Saya mempunyai analisis keperluan yang sangat baik, proses produk dan kemahiran reka bentuk seni bina. Saya juga suka mendaki.
Artikel ini dihasilkan oleh "Pelan Insentif Asal" Pengurus Produk.
Gambar tajuk datang daripada Unsplash, berdasarkan lesen CC0.
Atas ialah kandungan terperinci Aplikasi industri AI: Tenunan data membantu penemuan latihan aplikasi AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!