Le 30 mai, la 3e Compréhension vidéo au niveau pixel dans la nature, PVUW (ci-après dénommé PVUW) organisée par CVPR2024, la plus grande conférence internationale sur l'intelligence artificielle, a annoncé les résultats du concours Meitu Image Research Institute (MTLab). a remporté un autre prix, remportant la finaliste dans les deux pistes de segmentation sémantique vidéo (VSS) et de segmentation d'objets vidéo de scène complexe (MOSE), et la troisième place dans la piste Défi de segmentation panoramique vidéo (VPS). Meitu Image L'institut de recherche (MTLab) a remporté des prix lors de la conférence CVPR pour la troisième fois, remportant un total de 1 or, 3 argent et 3 bronze résultats exceptionnels.
En tant qu'événement majeur dans le domaine de la vision par ordinateur au monde, le CVPR a attiré la participation active de nombreuses universités et instituts de recherche scientifique de premier plan grâce à son influence considérable. Il est devenu une scène de présentation des résultats de la recherche scientifique de pointe. le domaine mondial de l’IA et est très apprécié par le monde universitaire et l’industrie. Dans le même temps, le concours top PVUW se concentre sur le domaine de la compréhension vidéo et est étudié par des experts faisant autorité du secteur tels que l'Université d'Oxford, l'Université de Fudan, l'Université du Zhejiang, l'Université d'aéronautique et d'astronautique de Pékin, Université Jiaotong de Pékin, Amazon, Meta, etc. Co-parrainé par des chercheurs, avec sa nature avant-gardiste et stimulante, ce concours a attiré des universités et des instituts de recherche de renom au pays et à l'étranger, notamment l'Université de l'Académie chinoise des sciences, l'Institut de l'automatisation de l'Académie chinoise des sciences, de l'Institut de technologie de Harbin, de Meitu, de Samsung, de ZTE, etc. Toutes les principales entreprises ont participé. Le concours PVUW de cette année comprend un total de 4 pistes En plus du défi de segmentation sémantique vidéo (VSSChallenge) et du défi de segmentation panoramique vidéo (VPSChallenge), il existe un nouveau défi de segmentation d'objets vidéo de scène complexe (MOSEChallenge) et une action. Défi de segmentation vidéo directionnelle basé sur la description (MeViSChallenge) 2 pistes d'ultra-difficulté, parmi lesquelles le Défi de segmentation d'objets vidéo de scène complexe (MOSEChallenge) a collecté le plus grand ensemble de données de segmentation d'objets vidéo de scène complexe ComplexVideoObjectSegmentation (MOSE), y compris la disparition et réapparition de cibles, de petits objets discrets, d'occlusions graves et d'environnements surpeuplés. Il est conçu pour aider à relever les défis actuels dans le domaine de la compréhension vidéo, tels que la complexité de l'arrière-plan, l'occlusion de la cible, la disparition et la réapparition, la compréhension du texte décrivant les actions, etc., et pour améliorer la capacité à comprendre des scènes complexes et des scènes réelles. scènes de vie. Les résultats impressionnants obtenus par Meitu Imaging Lab (MTLab) dans ce concours témoignent de son implantation à long terme et de son exploration continue dans le domaine de la vidéo. En même temps, il a également appliqué cette technologie de pointe à Meitu, une filiale de Meitu Company. Des produits tels que Xiuxiu, Beauty Camera, Wink et Meitu Design Studio offrent aux utilisateurs des fonctions pratiques et un gameplay créatif tels que « Video Portrait Refinement », « AI Product Video » et « Smart Cutout », et via résultats de recherche et développement innovants Fournir des services d'imagerie et de conception de haute qualité à nos utilisateurs. Avec le développement vigoureux des formes vidéo émergentes, l'industrie vidéo s'est davantage développée vers la diversification. Le Meitu Imaging Research Institute (MTLab) a également continué à augmenter ses investissements dans la recherche et le développement dans le domaine vidéo. Actuellement, Wink, un raffinement professionnel du portrait vidéo. outil, a remporté le titre de piste d'outils de montage vidéo, Kickstart est devenu le leader de la piste d'outils de création de diffusion orale. En tant que centre principal de R&D de Meitu, le Meitu Imaging Research Institute (MTLab) continuera à l'avenir à se concentrer sur la recherche et le développement de technologies de pointe dans le domaine de l'IA, à promouvoir la mise en œuvre de la technologie de l'IA et à créer une meilleure IA. travailler pour les utilisateurs et les clients grâce à l’innovation technologique et au flux de mises à niveau.Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!