Pada 5 Julai, di forum "Model Besar yang Dipercayai Membantu Inovasi dan Pembangunan Industri" di Persidangan Kepintaran Buatan Dunia 2024, Ant Group mengumumkan kemajuan pembangunan terkini model Bailing yang dibangunkan sendiri: model Bailing mempunyai keupayaan untuk "melihat " Keupayaan berbilang modal asli bagi "mendengar", "bertutur" dan "melukis" boleh secara langsung memahami dan melatih data berbilang modal seperti audio, video, gambar, teks dan sebagainya. Multimodaliti asli dianggap satu-satunya cara untuk AGI Di China, hanya beberapa pengeluar model besar telah mencapai keupayaan ini. Wartawan itu melihat daripada demonstrasi di persidangan itu bahawa teknologi berbilang modal boleh menjadikan model besar melihat dan berinteraksi lebih seperti manusia, menyokong peningkatan pengalaman badan pintar Bailing telah digunakan pada "Pembantu Pintar Alipay" dan kehendak digunakan pada masa hadapan. Menyokong peningkatan ejen yang lebih pintar pada Alipay.
1. (Xu Peng, Naib Presiden Kumpulan Ant, memperkenalkan keupayaan multi-modal asli Model Bailing Large)Di tapak pelancaran, Xu Peng, Naib Presiden Kumpulan Ant, menunjukkan lebih banyak senario aplikasi yang boleh dicapai oleh teknologi multi-modal yang baru dinaik taraf :
"Model Perubatan Pelbagai Modal Alipay" yang dikeluarkan serentak di forum adalah amalan penerokaan ini. Difahamkan bahawa model perubatan pelbagai modal Alipay telah menambah berpuluh-puluh bilion grafik dan teks bahasa Cina dan Inggeris termasuk laporan, imej, ubat-ubatan dan maklumat pelbagai modal lain, ratusan bilion korpus teks perubatan, dan berpuluh-puluh juta tinggi- peta pengetahuan perubatan yang berkualiti , mempunyai pengetahuan perubatan profesional, dan menduduki tempat pertama dalam senarai A dan kedua dalam senarai B pada promptCBLUE, senarai penilaian LLM perubatan Cina.
Berdasarkan keupayaan pelbagai mod model besar Bailing, SkySense, model penderiaan jauh yang dibangunkan bersama oleh Ant Group dan Universiti Wuhan, turut mengumumkan pelan sumber terbuka di forum tersebut. SkySense kini merupakan model asas penderiaan jauh berbilang mod dengan skala parameter terbesar, liputan tugas paling komprehensif dan ketepatan pengecaman tertinggi.
"Daripada pemahaman semantik teks tunggal kepada keupayaan berbilang modal, ia merupakan lelaran utama teknologi kecerdasan buatan, dan senario aplikasi 'menonton, mendengar, menulis dan melukis' yang dihasilkan oleh teknologi berbilang modal akan menjadikan prestasi AI lebih realistik, Untuk menjadi lebih dekat dengan manusia, Ant akan terus melabur dalam penyelidikan dan pembangunan teknologi multi-modaliti asli,” kata Xu Peng.
Atas ialah kandungan terperinci Kemajuan terkini model besar Ant Bailing: ia sudah mempunyai keupayaan berbilang modal asli. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!