


Model berskala besar Yuncong Technology memecahkan rekod dunia pada penanda aras COCO, dengan ketara mengurangkan kos aplikasi AI
Baru-baru ini, model berskala besar Yuncong Technology telah mencapai kemajuan penting sekali lagi dalam bidang penglihatan Pengesan sasaran berdasarkan model penglihatan berskala besar asas telah mencapai kejayaan besar pada set data COCO penanda aras yang terkenal dalam bidang pengesanan daripada Microsoft. Penyelidikan (MSR), Makmal Kepintaran Buatan Shanghai, dan Kepintaran Pintar Banyak syarikat dan institusi penyelidikan terkenal seperti Institut Penyelidikan Kepintaran Buatan Yuan menyerlah dan mencipta rekod dunia baharu.
Purata ketepatan (selepas ini dirujuk sebagai mAP, min Average Precision) model besar Yuncong Technology pada set ujian COCO mencapai 0.662, menduduki tempat pertama dalam senarai (lihat rajah di bawah). Pada set pengesahan, skala tunggal mencapai mAP 0.656, dan mAP selepas TTA berbilang skala mencapai 0.662, kedua-duanya mencapai tahap terkemuka dunia.
Data besar digabungkan dengan pembelajaran diselia sendiri untuk mencipta teknologi visual teras
Latihan pra-latihan kendiri data besar yang diwakili oleh GPT telah membuat kejayaan yang luar biasa dalam bidang pemahaman bahasa semula jadi (NLP) Dalam bidang visual, data besar digabungkan dengan pembelajaran penyeliaan kendiri juga telah mencapai kemajuan penting dalam latihan model asas.
Dalam satu pihak, data visual yang luas membantu model mempelajari ciri asas biasa. Model asas berskala besar YunCong Vision menggunakan lebih daripada 2 bilion data, termasuk sebilangan besar set data tidak berlabel dan set data imej dan teks berbilang mod Set data yang kaya dan pelbagai membolehkan model mengekstrak ciri yang mantap, mengurangkan kerumitan kos pembangunan hiliran.
Sebaliknya, pembelajaran penyeliaan sendiri tidak memerlukan anotasi manual, menjadikannya mungkin untuk melatih model visual dengan data besar tanpa label. Yuncong telah membuat banyak penambahbaikan pada algoritma pembelajaran yang diselia sendiri, menjadikannya lebih sesuai untuk tugasan yang terperinci seperti pengesanan dan pembahagian, seperti yang dibuktikan oleh keputusan yang baik pada tugas pengesanan COCO.
Pengesanan sasaran terbuka + keupayaan pengesanan pembelajaran sifar masa dengan ketara mengurangkan kos R&D
Berkat prestasi cemerlang model asas visual, model besar Yuncong Rongrong boleh dilatih berdasarkan data berbilang mod imej dan teks berskala besar untuk menyokong pembelajaran tangkapan sifar (selepas ini dirujuk sebagai tangkapan sifar) pengesanan beribu-ribu kategori sasaran, meliputi tenaga, pengangkutan, dan pelbagai matlamat dalam industri lain.
Prestasi keupayaan sifar tangkapan model besar pada set data yang berbeza
zero-shot boleh meniru proses penaakulan manusia dan menggunakan pengetahuan lepas untuk menaakul tentang bentuk khusus objek baharu dalam komputer, sekali gus memberi komputer keupayaan untuk mengenali perkara baharu.
Bagaimana untuk memahami pukulan sifar? Katakan kita tahu ciri-ciri morfologi keldai dan kuda, dan juga tahu bahawa harimau dan dubuk adalah haiwan berbelang, dan panda dan penguin adalah haiwan hitam dan putih. Tanpa melihat mana-mana gambar zebra, hanya bergantung pada inferens, kita boleh menemui zebra di antara semua haiwan di zoo.
Model asas berskala besar Yuncong Vision menunjukkan prestasi generalisasi yang kukuh, mengurangkan pergantungan data dan kos pembangunan yang diperlukan untuk tugasan hiliran Pada masa yang sama, zero-shot sangat meningkatkan kecekapan latihan dan pembangunan, menjadikan aplikasi luas dan penggunaan pantas mungkin.
Atas ialah kandungan terperinci Model berskala besar Yuncong Technology memecahkan rekod dunia pada penanda aras COCO, dengan ketara mengurangkan kos aplikasi AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Pengekodan Vibe membentuk semula dunia pembangunan perisian dengan membiarkan kami membuat aplikasi menggunakan bahasa semulajadi dan bukannya kod yang tidak berkesudahan. Diilhamkan oleh penglihatan seperti Andrej Karpathy, pendekatan inovatif ini membolehkan Dev

Februari 2025 telah menjadi satu lagi bulan yang berubah-ubah untuk AI generatif, membawa kita beberapa peningkatan model yang paling dinanti-nantikan dan ciri-ciri baru yang hebat. Dari Xai's Grok 3 dan Anthropic's Claude 3.7 Sonnet, ke Openai's G

Yolo (anda hanya melihat sekali) telah menjadi kerangka pengesanan objek masa nyata yang terkemuka, dengan setiap lelaran bertambah baik pada versi sebelumnya. Versi terbaru Yolo V12 memperkenalkan kemajuan yang meningkatkan ketepatan

Artikel ini mengkaji semula penjana seni AI atas, membincangkan ciri -ciri mereka, kesesuaian untuk projek kreatif, dan nilai. Ia menyerlahkan Midjourney sebagai nilai terbaik untuk profesional dan mengesyorkan Dall-E 2 untuk seni berkualiti tinggi dan disesuaikan.

CHATGPT 4 kini tersedia dan digunakan secara meluas, menunjukkan penambahbaikan yang ketara dalam memahami konteks dan menjana tindak balas yang koheren berbanding dengan pendahulunya seperti ChATGPT 3.5. Perkembangan masa depan mungkin merangkumi lebih banyak Inter yang diperibadikan

Artikel ini membincangkan model AI yang melampaui chatgpt, seperti Lamda, Llama, dan Grok, menonjolkan kelebihan mereka dalam ketepatan, pemahaman, dan kesan industri. (159 aksara)

Mistral OCR: Merevolusi Generasi Pengambilan Pengambilan semula dengan Pemahaman Dokumen Multimodal Sistem Generasi Pengambilan Retrieval (RAG) mempunyai keupayaan AI yang ketara, membolehkan akses ke kedai data yang luas untuk mendapatkan respons yang lebih tepat

Artikel ini membincangkan pembantu penulisan AI terkemuka seperti Grammarly, Jasper, Copy.ai, WriteSonic, dan Rytr, yang memberi tumpuan kepada ciri -ciri unik mereka untuk penciptaan kandungan. Ia berpendapat bahawa Jasper cemerlang dalam pengoptimuman SEO, sementara alat AI membantu mengekalkan nada terdiri
