Baru-baru ini, model besar Yuncong Technology telah mencapai kemajuan yang ketara dalam bidang penilaian pelbagai modal OpenCompass, platform penilaian komprehensif yang berwibawa. Keputusan penilaian terkini menunjukkan bahawa skor purata model besar Yuncong Technology dalam sistem ini ialah 65.5 Keputusan ini menjadikan model besar Congrong antara tiga teratas di dunia, mengatasi Google Gemini-1.5-Pro dan GPT-4v, kedua. hanya kepada On GPT-4o (69.9) dan Claude3.5-Sonnet (67.9). Di pasaran domestik, prestasi model besar juga melebihi InternVL-Chat (61.7) dan GLM-4V (60.8), menduduki tempat pertama.
Opencompass Penilaian multi-modal menggunakan 8 set data perwakilan untuk mengukur secara objektif keupayaan model besar multi-modal dari pelbagai perspektif, dan menilai liputan dimensi:
Dalam penilaian ini, model besar Congrong menunjukkan prestasi yang baik dalam 6 set data, menduduki tempat pertama di negara ini (MMbench, MMStar, MathVista, HallusionBench, AI2D, OCRBench), terutamanya dalam set ujian OCRBench, ia mencapai skor tertinggi di dunia dengan 827 mata (daripada 1000 mata), dan 13 mata lebih tinggi daripada GLM-4v tempat kedua, meningkatkan lagi keupayaan model besar yang tenang dalam pengecaman teks, soalan visual berpusatkan teks menjawab, dan berorientasikan dokumen Kesesuaian dalam senario perniagaan seperti menjawab soalan visual dan pengekstrakan maklumat utama.
Pada masa yang sama, ia juga mendapat manfaat daripada pengumpulan mendalam jangka panjang Yuncong Technology dan inovasi berterusan dalam bidang penglihatan dan bahasa.
Teknologi Yuncong telah giat mempromosikan pembangunan dan aplikasi
Sistem penilaian terbuka model besar OpenCompass bukan sahaja pengiktirafan terhadap kekuatan inovasi teknologi Teknologi Yuncong, tetapi juga menjadi contoh dalam industri dan memberi inspirasi kepada syarikat teknologi global dalam pusingan baharu kecerdasan buatan Mencapai ketinggian persaingan.
Atas ialah kandungan terperinci Mengalahkan Gemini-1.5-Pro dan GPT-4V, kedudukan antara tiga teratas di dunia dalam keupayaan pelbagai mod model besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!