


Finale de la segmentation vidéo ! L'Université du Zhejiang a récemment publié SAM-Track : une segmentation vidéo intelligente universelle en un seul clic
Récemment, le laboratoire ReLER de l'université du Zhejiang a profondément combiné SAM avec la segmentation vidéo et a publié Segment-and-Track Anything (SAM-Track).
SAM-Track donne à SAM la possibilité de suivre des cibles vidéo et prend en charge plusieurs modes d'interaction (points, pinceaux, texte).
Sur cette base, SAM-Track unifie plusieurs tâches de segmentation vidéo traditionnelles, réalisant le suivi de segmentation en un clic de n'importe quelle cible dans n'importe quelle vidéo et segmentant les vidéos traditionnelles Extrapolation au général segmentation vidéo.
SAM-Track a d'excellentes performances et peut suivre de manière stable des centaines de cibles de haute qualité dans des scénarios complexes avec une seule carte.
Adresse du projet : https://github.com /z-x-yang/Segment-and-Track-Anything
Adresse papier : https://arxiv.org/abs/2305.06558
Affichage des effets
SAM-Track prend en charge la saisie de la langue en tant qu'invite. Par exemple, étant donné le texte de la catégorie « Panda », une segmentation en un clic au niveau de l'instance peut être utilisée pour suivre toutes les cibles appartenant à la catégorie « Panda ».
Vous pouvez également donner une description plus détaillée, par exemple en saisissant du texte " "Panda à l'extrême gauche", SAM-Track peut localiser des cibles spécifiques pour le suivi de segmentation.
Par rapport aux algorithmes de suivi vidéo traditionnels, SAM-Track est un autre La puissance est qu'il peut suivre et segmenter un grand nombre de cibles simultanément et détecter automatiquement les objets émergents. SAM-Track prend également en charge la combinaison de plusieurs méthodes interactives, les utilisateurs peuvent Correspondance selon les besoins réels. Par exemple, utilisez un pinceau pour encadrer une planche à roulettes étroitement liée au corps humain afin d'éviter la segmentation d'objets redondants, puis utilisez des clics pour sélectionner le corps humain.
La segmentation et le suivi entièrement automatiques des cibles vidéo sont naturellement un jeu d'enfant. Divers scénarios d'application incluent des vues de rue, des photographies aériennes, de la RA, des animations, des images médicales, etc., le tout avec. un clic. Suivi des segments et détection automatique des objets émergents.
Si vous n'êtes pas satisfait des résultats de la segmentation automatique, l'utilisateur peut Apportez des corrections d'édition, par exemple en utilisant des clics pour corriger un tramway trop segmenté.
En même temps, la dernière version de SAM-Track prend en charge en ligne En parcourant les résultats de suivi, vous pouvez sélectionner le résultat de segmentation de n'importe quelle image au milieu pour modifier et ajouter une cible, puis le suivre à nouveau.
Composition du modèle
Le modèle SAM-Track est basé sur le schéma de championnat à quatre pistes DeAOT de l'atelier ECCV'22 VOT.
DeAOT est un modèle VOS multi-objectif efficace étant donné l'annotation d'objet de la première image, il peut suivre et segmenter les objets dans les images restantes de la vidéo.
DeAOT utilise un mécanisme de reconnaissance pour intégrer plusieurs cibles dans une vidéo dans le même espace de grande dimension, réalisant ainsi le suivi simultané de plusieurs objets.
Les performances de vitesse de DeAOT dans le suivi multi-objets sont comparables à celles des autres méthodes VOS pour le suivi d'un seul objet.
De plus, grâce au mécanisme de propagation en couches basé sur Transformer, DeAOT agrège mieux les informations à long terme et à court terme, affichant d'excellentes performances de suivi.
Étant donné que DeAOT nécessite une annotation de cadre de référence pour l'initialisation, afin d'améliorer la commodité, SAM-Track utilise le Segment Anything Model (SAM), qui a récemment fait sensation dans le domaine de la segmentation d'images. ) modèle pour obtenir des informations d'annotation.
Grâce aux excellentes capacités de migration sans échantillon de SAM et à ses multiples méthodes d'interaction, SAM-Track peut obtenir efficacement des informations d'annotation de cadre de référence de haute qualité pour DeAOT.
Bien que le modèle SAM fonctionne bien dans le domaine de la segmentation d'images, il ne peut pas générer d'étiquettes sémantiques et les invites de texte ne peuvent pas bien prendre en charge la segmentation d'objets référents et d'autres méthodes qui s'appuient sur sémantique profonde. La tâche de compréhension.
Par conséquent, le modèle SAM-Track intègre davantage Grounding-DINO pour obtenir une segmentation vidéo guidée par le langage de haute précision. Grounding DINO est un modèle de détection d'objets ouvert avec de bonnes capacités de compréhension du langage.
En fonction de la catégorie d'entrée ou de la description détaillée de l'objet cible, Grounding-DINO peut détecter la cible et renvoyer la zone de localisation.
Architecture du modèle SAM-Track
Comme le montre la figure ci-dessous, le modèle SAM-Track prend en charge trois modes de suivi d'objets, à savoir le suivi interactif mode, mode de suivi automatique et mode de fusion.
Pour le mode de suivi interactif, le modèle SAM-Track applique d'abord SAM, Sélectionnez la cible dans le cadre de référence en cliquant ou en dessinant un cadre jusqu'à ce qu'un résultat de segmentation interactive satisfaisant l'utilisateur soit obtenu.
Si vous souhaitez implémenter une segmentation d'objet vidéo guidée par le langage, SAM-Track appellera Grounding-DINO pour obtenir d'abord le cadre de position de l'objet cible en fonction de l'entrée texte, et sur cette base, le résultat de la segmentation de l'objet d'intérêt est obtenu via SAM.
Enfin, DeAOT utilise les résultats de la segmentation interactive comme cadre de référence pour suivre la cible sélectionnée. Au cours du processus de suivi, DeAOT propagera par couche l'intégration visuelle et l'intégration d'ID haute dimension dans les images passées vers l'image actuelle pour réaliser un suivi image par image et une segmentation de plusieurs objets cibles. Par conséquent, SAM-Track peut suivre les objets d'intérêt dans des vidéos segmentées en prenant en charge les interactions multimodales.
Cependant, le mode de suivi interactif ne peut pas gérer les objets nouvellement apparus apparaissant dans la vidéo. Limite l'application de SAM-Track dans des domaines spécifiques, tels que la conduite autonome, les villes intelligentes, etc.
Afin d'élargir davantage la portée de l'application et les performances de SAM-Track, SAM-Track implémente un mode de suivi automatique pour suivre les nouveaux objets apparaissant dans la vidéo.
Le mode de suivi automatique utilise Segment Everything et Object of Interest Segmentation pour obtenir des annotations de nouveaux objets apparaissant dans toutes les n images. Pour le problème d'attribution d'ID d'objets nouvellement émergents, SAM-Track utilise le module de masque de comparaison (CMR) pour déterminer l'ID du nouvel objet.
Le mode fusion combine le mode de suivi interactif et le mode de suivi automatique. Le mode de suivi interactif permet aux utilisateurs d'obtenir facilement des annotations pour la première image d'une vidéo, tandis que le mode de suivi automatique gère les nouveaux objets non sélectionnés qui apparaissent dans les images suivantes de la vidéo. La combinaison des méthodes de suivi élargit le champ d'application de SAM-Track et augmente la praticité de SAM-Track.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Dans quel dossier le navigateur met-il la vidéo en cache ? Lorsque nous utilisons le navigateur Internet quotidiennement, nous regardons souvent diverses vidéos en ligne, comme regarder des clips vidéo sur YouTube ou regarder des films sur Netflix. Ces vidéos seront mises en cache par le navigateur pendant le processus de chargement afin qu'elles puissent être chargées rapidement lors d'une nouvelle lecture ultérieure. La question est donc de savoir dans quel dossier ces vidéos mises en cache sont réellement stockées ? Différents navigateurs stockent les dossiers vidéo mis en cache à différents emplacements. Ci-dessous, nous présenterons plusieurs navigateurs courants et leurs

Avec l'essor des plateformes de vidéos courtes, Douyin est devenu un élément indispensable de la vie quotidienne de chacun. Sur TikTok, nous pouvons voir des vidéos intéressantes du monde entier. Certaines personnes aiment publier les vidéos d’autres personnes, ce qui soulève une question : Douyin enfreint-il la publication de vidéos d’autres personnes ? Cet article abordera ce problème et vous expliquera comment éditer des vidéos sans infraction et comment éviter les problèmes d'infraction. 1. Cela porte-t-il atteinte à la publication par Douyin de vidéos d'autres personnes ? Selon les dispositions de la loi sur le droit d'auteur de mon pays, l'utilisation non autorisée des œuvres du titulaire du droit d'auteur sans l'autorisation du titulaire du droit d'auteur constitue une infraction. Par conséquent, publier des vidéos d’autres personnes sur Douyin sans l’autorisation de l’auteur original ou du titulaire des droits d’auteur constitue une infraction. 2. Comment monter une vidéo sans contrefaçon ? 1. Utilisation de contenu du domaine public ou sous licence : Public

Comment supprimer les filigranes des vidéos dans Wink ? Il existe un outil pour supprimer les filigranes des vidéos dans winkAPP, mais la plupart des amis ne savent pas comment supprimer les filigranes des vidéos dans Wink. Voici ensuite l'image de la façon de supprimer les filigranes des vidéos dans Wink. apporté par l'éditeur Tutoriel texte, les utilisateurs intéressés viennent y jeter un oeil ! Comment supprimer le filigrane vidéo dans Wink 1. Ouvrez d'abord l'application Wink et sélectionnez la fonction [Supprimer le filigrane] dans la zone de la page d'accueil ; 2. Sélectionnez ensuite la vidéo dont vous souhaitez supprimer le filigrane dans l'album ; dans le coin supérieur droit après avoir édité la vidéo [√] ; 4. Enfin, cliquez sur [Imprimer en un clic] comme indiqué dans la figure ci-dessous, puis cliquez sur [Traiter].

Douyin, la plateforme nationale de courtes vidéos, nous permet non seulement de profiter d'une variété de courtes vidéos intéressantes et originales pendant notre temps libre, mais nous donne également une scène pour nous montrer et réaliser nos valeurs. Alors, comment gagner de l’argent en postant des vidéos sur Douyin ? Cet article répondra à cette question en détail et vous aidera à gagner plus d’argent sur TikTok. 1. Comment gagner de l’argent en publiant des vidéos sur Douyin ? Après avoir posté une vidéo et obtenu un certain nombre de vues sur Douyin, vous aurez la possibilité de participer au plan de partage publicitaire. Cette méthode de revenus est l’une des plus connues des utilisateurs de Douyin et constitue également la principale source de revenus pour de nombreux créateurs. Douyin décide d'offrir ou non des opportunités de partage de publicités en fonction de divers facteurs tels que le poids du compte, le contenu vidéo et les commentaires du public. La plateforme TikTok permet aux téléspectateurs de soutenir leurs créateurs préférés en envoyant des cadeaux,

1. Introduction Avec la popularisation des appareils mobiles et l'amélioration de la puissance de calcul, la technologie de segmentation d'images est devenue un point chaud de la recherche. MobileSAM (MobileSegmentAnythingModel) est un modèle de segmentation d'images optimisé pour les appareils mobiles. Il vise à réduire la complexité de calcul et l'utilisation de la mémoire tout en conservant des résultats de segmentation de haute qualité, afin de fonctionner efficacement sur des appareils mobiles dotés de ressources limitées. Cet article présentera en détail les principes, les avantages et les scénarios d'application de MobileSAM. 2. Idées de conception du modèle MobileSAM. Les idées de conception du modèle MobileSAM incluent principalement les aspects suivants : Modèle léger : Afin de s'adapter aux limitations de ressources des appareils mobiles, le modèle MobileSAM adopte un modèle léger.

Sur les appareils iOS, l'application Appareil photo vous permet de filmer des vidéos au ralenti, voire à 240 images par seconde si vous possédez le dernier iPhone. Cette capacité vous permet de capturer une action à grande vitesse avec des détails riches. Mais parfois, vous souhaiterez peut-être lire des vidéos au ralenti à vitesse normale afin de mieux apprécier les détails et l'action de la vidéo. Dans cet article, nous expliquerons toutes les méthodes pour supprimer le ralenti des vidéos existantes sur iPhone. Comment supprimer le ralenti des vidéos sur iPhone [2 méthodes] Vous pouvez utiliser l'application Photos ou l'application iMovie pour supprimer le ralenti des vidéos sur votre appareil. Méthode 1 : ouvrir sur iPhone à l’aide de l’application Photos

Avec l'essor des plateformes de vidéos courtes, Xiaohongshu est devenue une plateforme permettant à de nombreuses personnes de partager leur vie, de s'exprimer et de gagner du trafic. Sur cette plateforme, la publication d’œuvres vidéo est un moyen d’interaction très prisé. Alors, comment publier les œuvres vidéo de Xiaohongshu ? 1. Comment publier les œuvres vidéo de Xiaohongshu ? Tout d’abord, assurez-vous d’avoir un contenu vidéo prêt à partager. Vous pouvez utiliser votre téléphone portable ou un autre équipement photo pour prendre des photos, mais vous devez faire attention à la qualité de l'image et à la clarté du son. 2. Editer la vidéo : Afin de rendre le travail plus attrayant, vous pouvez éditer la vidéo. Vous pouvez utiliser un logiciel de montage vidéo professionnel, tel que Douyin, Kuaishou, etc., pour ajouter des filtres, de la musique, des sous-titres et d'autres éléments. 3. Choisissez une couverture : La couverture est la clé pour inciter les utilisateurs à cliquer. Choisissez une image claire et intéressante comme couverture pour inciter les utilisateurs à cliquer dessus.

1. Ouvrez d'abord Weibo sur votre téléphone mobile et cliquez sur [Moi] dans le coin inférieur droit (comme indiqué sur l'image). 2. Cliquez ensuite sur [Gear] dans le coin supérieur droit pour ouvrir les paramètres (comme indiqué sur l'image). 3. Ensuite, recherchez et ouvrez [Paramètres généraux] (comme indiqué sur l'image). 4. Entrez ensuite l'option [Video Follow] (comme indiqué sur l'image). 5. Ensuite, ouvrez le paramètre [Résolution de téléchargement vidéo] (comme indiqué sur l'image). 6. Enfin, sélectionnez [Qualité d'image originale] pour éviter la compression (comme indiqué sur l'image).
