


Finale der Videosegmentierung! Die Universität Zhejiang hat kürzlich SAM-Track veröffentlicht: universelle intelligente Videosegmentierung mit einem Klick
Kürzlich hat das ReLER-Labor der Zhejiang-Universität SAM intensiv mit Videosegmentierung kombiniert und Segment-and-Track Anything (SAM-Track) veröffentlicht.
SAM-Track gibt SAM die Möglichkeit, Videoziele zu verfolgen und unterstützt mehrere Arten der Interaktion (Punkte, Pinsel, Text).
Auf dieser Basis vereint SAM-Track mehrere herkömmliche Videosegmentierungsaufgaben und erreicht eine Ein-Klick-Segmentierung, um jedes Ziel in jedem Video zu verfolgen und traditionelle Videos zu segmentieren Videosegmentierung.
SAM-Track verfügt über eine hervorragende Leistung und kann Hunderte von Zielen in komplexen Szenarien mit nur einer einzigen Karte stabil und mit hoher Qualität verfolgen.
Projektadresse: https://github.com /z-x-yang/Segment-and-Track-Anything
Papieradresse: https://arxiv.org/abs/2305.06558
Effektanzeige
SAM-Track unterstützt die Spracheingabe als Eingabeaufforderung. Wenn beispielsweise der Kategorietext „Panda“ angegeben ist, kann die Segmentierung auf Instanzebene mit einem Klick verwendet werden, um alle Ziele zu verfolgen, die zur Kategorie „Panda“ gehören.
Sie können auch eine detailliertere Beschreibung angeben, z. B. die Eingabe von Text " „Panda ganz links“, SAM-Track kann bestimmte Ziele für die Segmentierungsverfolgung lokalisieren.
Im Vergleich zu herkömmlichen Video-Tracking-Algorithmen ist SAM-Track eine weitere Stärke besteht darin, dass es eine große Anzahl von Zielen gleichzeitig verfolgen und segmentieren und auftauchende Objekte automatisch erkennen kann.
SAM-Track unterstützt auch die Kombination mehrerer interaktiver Methoden, die Benutzer können Passend zu den tatsächlichen Bedürfnissen. Verwenden Sie beispielsweise einen Pinsel, um ein Skateboard einzurahmen, das eng mit dem menschlichen Körper verbunden ist, um die Segmentierung überflüssiger Objekte zu verhindern, und wählen Sie dann mit Klicks den menschlichen Körper aus.
Vollautomatische Videozielsegmentierung und -verfolgung sind natürlich ein Kinderspiel. Verschiedene Anwendungsszenarien umfassen Straßenansichten, Luftaufnahmen, AR, Animationen, medizinische Bilder usw., alles mit Mit einem Klick segmentieren und auftauchende Objekte automatisch erkennen.
Wenn Sie mit den automatischen Segmentierungsergebnissen nicht zufrieden sind, kann der Benutzer dies tun Nehmen Sie Bearbeitungskorrekturen vor, z. B. die Verwendung von Klicks, um eine übersegmentierte Straßenbahn zu reparieren.
Gleichzeitig unterstützt die neueste Version von SAM-Track online Beim Durchsuchen der Tracking-Ergebnisse können Sie das Segmentierungsergebnis eines beliebigen Frames in der Mitte auswählen, um es zu ändern, ein Ziel hinzuzufügen und es erneut zu verfolgen.
Um das Online-Erlebnis der Benutzer zu erleichtern, stellt das Projekt eine WebUI bereit, die mit einem Klick bereitgestellt werden kann Colab: #🎜🎜 #
Modellzusammensetzung
Das SAM-Track-Modell basiert auf DeAOT, dem Meisterschaftsschema der vier Tracks des ECCV'22 VOT Workshop.
DeAOT ist ein effizientes VOS-Modell mit mehreren Zielen. Basierend auf der Objektanmerkung des ersten Frames kann es Objekte in den verbleibenden Frames des Videos verfolgen und segmentieren.
DeAOT nutzt einen Erkennungsmechanismus, um mehrere Ziele in einem Video in denselben hochdimensionalen Raum einzubetten und so eine gleichzeitige Verfolgung mehrerer Objekte zu erreichen.
Die Geschwindigkeitsleistung von DeAOT bei der Verfolgung mehrerer Objekte ist vergleichbar mit anderen VOS-Methoden zur Verfolgung einzelner Objekte.
Darüber hinaus aggregiert DeAOT durch den auf Layered Transformer basierenden Ausbreitungsmechanismus besser langfristige und kurzfristige Informationen und zeigt eine hervorragende Tracking-Leistung.
Da DeAOT für die Initialisierung Referenzrahmenanmerkungen erfordert, verwendet SAM-Track zur Verbesserung der Benutzerfreundlichkeit das Segment Anything Model (SAM)-Modell, das in letzter Zeit im Bereich der Bildsegmentierung populär geworden ist, um Anmerkungsinformationen zu erhalten.
Mit den hervorragenden Zero-Sample-Migrationsfähigkeiten und mehreren Interaktionsmethoden von SAM kann SAM-Track effizient hochwertige Referenzrahmen-Annotationsinformationen für DeAOT erhalten.
Obwohl das SAM-Modell im Bereich der Bildsegmentierung eine gute Leistung erbringt, kann es keine semantischen Beschriftungen ausgeben und Texthinweise können die Segmentierung verweisender Objekte und andere Aufgaben, die auf einem tiefen semantischen Verständnis beruhen, nicht gut unterstützen.
Daher integriert das SAM-Track-Modell Grounding-DINO weiter, um eine hochpräzise sprachgesteuerte Videosegmentierung zu erreichen. Grounding DINO ist ein offenes Objekterkennungsmodell mit guten Sprachverständnisfähigkeiten.
Basierend auf der Eingabekategorie oder der detaillierten Beschreibung des Zielobjekts kann Grounding-DINO das Ziel erkennen und das Standortfeld zurückgeben.
SAM-Track-Modellarchitektur
Wie in der Abbildung unten gezeigt, unterstützt das SAM-Track-Modell drei Objektverfolgungsmodi, nämlich den interaktiven Verfolgungsmodus, den automatischen Verfolgungsmodus und den Fusionsmodus.
Für den interaktiven Tracking-Modus wendet das SAM-Track-Modell zunächst SAM an und wählt das Ziel im Referenzrahmen durch Klicken oder Zeichnen eines Rahmens aus, bis ein interaktives Segmentierungsergebnis vorliegt, das für den Benutzer zufriedenstellend ist erhalten.
Wenn Sie eine sprachgesteuerte Segmentierung von Videoobjekten implementieren möchten, ruft SAM-Track Grounding-DINO auf, um zunächst den Positionsrahmen des Zielobjekts basierend auf dem Eingabetext zu ermitteln und auf dieser Grundlage die Segmentierung des Zielobjekts zu ermitteln Objekt von Interesse durch SAM-Ergebnis.
Abschließend verwendet DeAOT das Ergebnis der interaktiven Segmentierung als Referenzrahmen, um das ausgewählte Ziel zu verfolgen. Während des Tracking-Prozesses überträgt DeAOT die visuelle Einbettung und die hochdimensionale ID-Einbettung in vergangenen Frames hierarchisch auf den aktuellen Frame, um eine Frame-für-Frame-Verfolgung und Segmentierung mehrerer Zielobjekte zu erreichen. Daher kann SAM-Track durch die Unterstützung multimodaler Interaktionen interessante Objekte in segmentierten Videos verfolgen.
Der interaktive Tracking-Modus kann jedoch nicht mit neu aufgetauchten Objekten umgehen, die im Video erscheinen. Beschränkt die Anwendung von SAM-Track in bestimmten Bereichen, wie autonomes Fahren, Smart Cities usw.
Um den Anwendungsbereich und die Leistung von SAM-Track weiter zu erweitern, implementiert SAM-Track den automatischen Tracking-Modus, um neue Objekte zu verfolgen, die im Video erscheinen.
Der automatische Tracking-Modus verwendet „Alles segmentieren“ und „Objekt von Interesse“-Segmentierung, um Anmerkungen zu neuen Objekten zu erhalten, die alle n Frames erscheinen. Für das ID-Zuordnungsproblem neu entstehender Objekte nutzt SAM-Track das Vergleichsmaskenmodul (CMR), um die ID des neuen Objekts zu ermitteln.
Der Fusionsmodus kombiniert den interaktiven Tracking-Modus und den automatischen Tracking-Modus. Der interaktive Tracking-Modus ermöglicht Benutzern das einfache Abrufen von Anmerkungen für das erste Bild eines Videos, während der automatische Tracking-Modus neue, nicht ausgewählte Objekte verarbeitet, die in nachfolgenden Bildern des Videos erscheinen. Die Kombination von Tracking-Methoden erweitert den Anwendungsbereich von SAM-Track und erhöht die Praktikabilität von SAM-Track.
Das obige ist der detaillierte Inhalt vonFinale der Videosegmentierung! Die Universität Zhejiang hat kürzlich SAM-Track veröffentlicht: universelle intelligente Videosegmentierung mit einem Klick. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



In welchem Ordner speichert der Browser das Video? Wenn wir den Internetbrowser täglich nutzen, schauen wir uns häufig verschiedene Online-Videos an, z. B. Musikvideos auf YouTube oder Filme auf Netflix. Diese Videos werden während des Ladevorgangs vom Browser zwischengespeichert, sodass sie bei späterer erneuter Wiedergabe schnell geladen werden können. Die Frage ist also: In welchem Ordner werden diese zwischengespeicherten Videos tatsächlich gespeichert? Verschiedene Browser speichern zwischengespeicherte Videoordner an unterschiedlichen Orten. Im Folgenden stellen wir einige gängige Browser und deren Funktionen vor

Mit dem Aufkommen von Kurzvideoplattformen ist Douyin zu einem unverzichtbaren Bestandteil des täglichen Lebens eines jeden geworden. Auf TikTok können wir interessante Videos aus aller Welt sehen. Manche Leute posten gerne die Videos anderer Leute, was die Frage aufwirft: Verstößt Douyin gegen das Posten der Videos anderer Leute? In diesem Artikel wird dieses Problem erörtert und Ihnen erklärt, wie Sie Videos ohne Rechtsverletzung bearbeiten und Probleme mit Rechtsverletzungen vermeiden können. 1. Verstößt es gegen Douyins Veröffentlichung von Videos anderer Personen? Gemäß den Bestimmungen des Urheberrechtsgesetzes meines Landes stellt die unbefugte Nutzung der Werke des Urheberrechtsinhabers ohne die Erlaubnis des Urheberrechtsinhabers einen Verstoß dar. Daher stellt das Posten von Videos anderer Personen auf Douyin ohne die Erlaubnis des ursprünglichen Autors oder Urheberrechtsinhabers einen Verstoß dar. 2. Wie bearbeite ich ein Video ohne Urheberrechtsverletzung? 1. Verwendung von gemeinfreien oder lizenzierten Inhalten: Öffentlich

Wie entferne ich Wasserzeichen aus Videos in Wink? Es gibt ein Tool zum Entfernen von Wasserzeichen aus Videos in Wink, aber die meisten Freunde wissen nicht, wie man Wasserzeichen aus Videos in Wink entfernt Vom Herausgeber bereitgestelltes Text-Tutorial, interessierte Benutzer kommen vorbei und schauen es sich an! So entfernen Sie das Video-Wasserzeichen in Wink: 1. Öffnen Sie zunächst die Wink-App und wählen Sie im Startseitenbereich die Funktion [Wasserzeichen entfernen] aus. 2. Wählen Sie dann das Video aus, bei dem Sie das Wasserzeichen entfernen möchten in der oberen rechten Ecke nach der Bearbeitung des Videos [√] 4. Klicken Sie abschließend auf [Ein-Klick-Drucken] und dann auf [Verarbeiten].

Douyin, die nationale Kurzvideoplattform, ermöglicht uns nicht nur, in unserer Freizeit eine Vielzahl interessanter und neuartiger Kurzvideos zu genießen, sondern gibt uns auch eine Bühne, um uns zu zeigen und unsere Werte zu verwirklichen. Wie kann man also Geld verdienen, indem man Videos auf Douyin veröffentlicht? Dieser Artikel wird diese Frage ausführlich beantworten und Ihnen dabei helfen, mit TikTok mehr Geld zu verdienen. 1. Wie kann man mit dem Posten von Videos auf Douyin Geld verdienen? Nachdem Sie ein Video gepostet und eine bestimmte Anzahl an Aufrufen auf Douyin erreicht haben, haben Sie die Möglichkeit, am Werbe-Sharing-Plan teilzunehmen. Diese Einkommensmethode ist eine der bekanntesten unter Douyin-Benutzern und stellt auch für viele YouTuber die Haupteinnahmequelle dar. Douyin entscheidet anhand verschiedener Faktoren wie Kontogewicht, Videoinhalt und Publikumsfeedback, ob Möglichkeiten zum Teilen von Werbung bereitgestellt werden sollen. Die TikTok-Plattform ermöglicht es Zuschauern, ihre Lieblingsschöpfer durch das Versenden von Geschenken zu unterstützen.

1. Einleitung Mit der Popularisierung mobiler Geräte und der Verbesserung der Rechenleistung ist die Bildsegmentierungstechnologie zu einem Forschungsschwerpunkt geworden. MobileSAM (MobileSegmentAnythingModel) ist ein für mobile Geräte optimiertes Bildsegmentierungsmodell. Es zielt darauf ab, die Rechenkomplexität und den Speicherverbrauch zu reduzieren und gleichzeitig qualitativ hochwertige Segmentierungsergebnisse beizubehalten, um eine effiziente Ausführung auf mobilen Geräten mit begrenzten Ressourcen zu ermöglichen. In diesem Artikel werden die Prinzipien, Vorteile und Anwendungsszenarien von MobileSAM im Detail vorgestellt. 2. Designideen des MobileSAM-Modells umfassen hauptsächlich die folgenden Aspekte: Leichtgewichtiges Modell: Um sich an die Ressourcenbeschränkungen mobiler Geräte anzupassen, übernimmt das MobileSAM-Modell ein leichtes Modell.

Auf iOS-Geräten können Sie mit der Kamera-App Zeitlupenvideos aufnehmen, oder sogar 240 Bilder pro Sekunde, wenn Sie das neueste iPhone besitzen. Mit dieser Funktion können Sie High-Speed-Aktionen detailreich erfassen. Aber manchmal möchten Sie vielleicht Zeitlupenvideos mit normaler Geschwindigkeit abspielen, damit Sie die Details und das Geschehen im Video besser wahrnehmen können. In diesem Artikel erklären wir alle Methoden zum Entfernen von Zeitlupe aus vorhandenen Videos auf dem iPhone. So entfernen Sie Zeitlupe aus Videos auf dem iPhone [2 Methoden] Sie können die Fotos-App oder die iMovie-App verwenden, um Zeitlupe aus Videos auf Ihrem Gerät zu entfernen. Methode 1: Mit der Fotos-App auf dem iPhone öffnen

Mit dem Aufkommen von Kurzvideoplattformen ist Xiaohongshu für viele Menschen zu einer Plattform geworden, auf der sie ihr Leben teilen, sich ausdrücken und Traffic gewinnen können. Auf dieser Plattform ist die Veröffentlichung von Videoarbeiten eine sehr beliebte Art der Interaktion. Wie veröffentlicht man also Xiaohongshu-Videoarbeiten? 1. Wie veröffentliche ich Xiaohongshu-Videowerke? Stellen Sie zunächst sicher, dass Sie einen Videoinhalt zum Teilen bereit haben. Sie können zum Fotografieren Ihr Mobiltelefon oder eine andere Kameraausrüstung verwenden, Sie müssen jedoch auf die Bildqualität und die Klarheit des Tons achten. 2. Bearbeiten Sie das Video: Um die Arbeit attraktiver zu gestalten, können Sie das Video bearbeiten. Sie können professionelle Videobearbeitungssoftware wie Douyin, Kuaishou usw. verwenden, um Filter, Musik, Untertitel und andere Elemente hinzuzufügen. 3. Wählen Sie ein Cover: Das Cover ist der Schlüssel, um Benutzer zum Klicken zu bewegen. Wählen Sie ein klares und interessantes Bild als Cover, um Benutzer zum Klicken zu bewegen.

1. Öffnen Sie zunächst Weibo auf Ihrem Mobiltelefon und klicken Sie unten rechts auf [Ich] (wie im Bild gezeigt). 2. Klicken Sie dann oben rechts auf [Zahnrad], um die Einstellungen zu öffnen (wie im Bild gezeigt). 3. Suchen und öffnen Sie dann [Allgemeine Einstellungen] (wie im Bild gezeigt). 4. Geben Sie dann die Option [Video Follow] ein (wie im Bild gezeigt). 5. Öffnen Sie dann die Einstellung [Video-Upload-Auflösung] (wie im Bild gezeigt). 6. Wählen Sie abschließend [Originalbildqualität] aus, um eine Komprimierung zu vermeiden (wie im Bild gezeigt).
