Heim Technologie-Peripheriegeräte KI CVPR 2024 |. Byte schlägt eine neue Generation von COCONut-Datensätzen vor, die dichter als die granulare COCO-Segmentierung sind

CVPR 2024 |. Byte schlägt eine neue Generation von COCONut-Datensätzen vor, die dichter als die granulare COCO-Segmentierung sind

Apr 22, 2024 pm 04:20 PM
git 工程 视频编辑 cvpr2024 coconut

Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. E-Mail-Adresse: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com.

Mit der Entwicklung künstlicher Intelligenz haben Sprachmodelle und generative Modelle große Erfolge erzielt, und im Prozess des Modellentwurfs nimmt auch die Anzahl der Parameter des Modells zu. Für feinkörnige Verständnisaufgaben nimmt auch die Anzahl der Modellparameter zu. Es besteht jedoch ein Widerspruch zwischen Skalierung und Genauigkeit in vorhandenen Datensätzen. Beispielsweise sind 99,1 % der Masken im SA-1B-Datensatz maschinengeneriert, es gibt jedoch keine semantischen Bezeichnungen Probleme, und diese Die Größe des Datensatzes ist im Allgemeinen relativ klein.

Kürzlich hat ByteDance eine neue Generation feinkörniger Verständnisdatensätze vorgeschlagen. Als Reaktion auf die Designanforderungen moderner Deep-Learning-Modelle wurden insgesamt 383.000 Bilder für die Panoramasegmentierung manuell mit Anmerkungen versehen und schließlich 5,18 Millionen erreicht. Zhang Mask ist der bislang größte Datensatz zum Verständnis der Panoramasegmentierung mit künstlichen Etiketten und heißt COCONut. Dieses Ergebnis wurde für CVPR2024 ausgewählt.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

  • Papierlink: https://arxiv.org/abs/2404.08639
  • Code- und Datensatzlink: https://xdeng7.github.io/coconut.github.io/

Das Video zeigt die Maskendichte und die semantischen Kategoriestatistiken eines einzelnen Bildes von COCONut. Es ist ersichtlich, dass die Semantik des Datensatzes reichhaltig und die Granularität der Maskensegmentierung gut ist. Der Datensatz unterstützt auch eine Vielzahl von Verständnisaufgaben, wie z. B. Panoramasegmentierung, Instanzsegmentierung, semantische Segmentierung, Objekterkennung, semantisch kontrollierte Generierung und Segmentierung des offenen Vokabulars, wodurch allein durch das Ersetzen des Datensatzes erhebliche Leistungsverbesserungen bei mehreren Aufgaben erzielt werden.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

Annotationsmethode

Normalerweise ist nur die manuelle Annotation sehr teuer, was auch ein wichtiger Grund dafür ist, dass die meisten vorhandenen öffentlichen Datensätze nicht skaliert werden können. Es gibt auch einige Datensätze, die vom Modell generierte Beschriftungen direkt verwenden, aber oft verbessern solche generierten Beschriftungen das Training des Modells nicht wesentlich. Dieser Artikel bestätigt dies auch. Daher schlägt dieser Artikel eine neuartige Anmerkungsmethode vor, kombiniert mit einer manuellen halbautomatischen Etikettengenerierung. Dies kann nicht nur die Genauigkeit der Datenanmerkung gewährleisten, sondern auch die Kosten für manuelle Arbeit einsparen und gleichzeitig den Annotationsprozess beschleunigen.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

Vergleich der Anmerkungsgenauigkeit

Die Forscher verglichen die Anmerkungen von COCONut und COCO auf demselben Bild. Aus dem Vergleich in der folgenden Abbildung können wir erkennen, dass die in diesem Artikel vorgeschlagene Anmerkungsmethode fast die gleiche Genauigkeit wie die rein manuelle Anmerkung mit Photoshop erreicht, die Anmerkungsgeschwindigkeit jedoch um mehr als das Zehnfache erhöht wird.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

COCONut-Datensatzdetails

Im Vergleich zum vorhandenen COCO-Datensatz ist die Verteilung jeder Kategorie des Datensatzes relativ ähnlich, aber die Gesamtzahl der Masken in jedem Bild ist größer als COCO Datensatz, insbesondere wenn es eine große Anzahl von Einzelbildern mit mehr als 100 Masken gibt, was zeigt, dass die Annotation von COCONut verfeinert und die granulare Segmentierung dichter ist.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

Experimentelle Verifizierung

Zusätzlich zum Vorschlag eines besseren Trainingssatzes stellten die Forscher auch fest, dass der vorhandene Verifizierungssatz die Verbesserung der Modellleistung nicht gut widerspiegeln kann. Daher schlägt dieser Artikel auch einen anspruchsvolleren Testsatz vor Kann die Verbesserung des Modells widerspiegeln und heißt COCONut-val. Wie aus der folgenden Tabelle ersichtlich ist, kann nur das Ersetzen des Datensatzes und eines Trainingssatzes mit höherer Präzision zu großen Verbesserungen im Modell führen, z. B. zum Erreichen von mehr als 4 Zoll Panorama-Segmentierung. Wenn jedoch die Größe des Trainingssatzes zunimmt, kann festgestellt werden, dass das Testen mit dem vorhandenen Testsatz nicht die Verbesserung des Modells widerspiegelt, während COCONut-val widerspiegeln kann, dass das Modell nach einer Erhöhung des Trainingsumfangs immer noch offensichtliche Verbesserungen aufweist Daten festlegen.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

Die folgende Abbildung zeigt einen Vergleich der semantischen Kategorien und der Maskendichte des Verifizierungssatzes. Es ist ersichtlich, dass der neu vorgeschlagene Verifizierungssatz anspruchsvoller ist und die Verbesserung des Modells besser widerspiegeln kann.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

Weitere experimentelle Ergebnisse finden Sie im Originalpapier. Das Team stellt den Datensatz und das entsprechende Modell auf der GitHub-Homepage zum öffentlichen Download bereit.

ByteDance Intelligent Creation Team

Das Intelligent Creation Team ist das KI- und Multimedia-Technologieteam von ByteDance, das mit Hilfe Computer Vision, Audio- und Videobearbeitung, Spezialeffektverarbeitung und andere technische Bereiche abdeckt des Unternehmens Umfangreiche Geschäftsszenarien, Infrastrukturressourcen und eine Atmosphäre der technischen Zusammenarbeit realisieren einen geschlossenen Kreislauf modernster Algorithmen – technischer Systeme – Produkte mit dem Ziel, branchenführendes Inhaltsverständnis, Inhaltserstellung und Interaktion für verschiedene Unternehmen innerhalb des Unternehmens in verschiedenen Formen bereitzustellen . Erfahrungs- und Verbrauchsmöglichkeiten und Branchenlösungen.

Derzeit hat das Team für intelligente Kreation seine technischen Fähigkeiten und Dienste über Volcano Engine, eine Cloud-Service-Plattform von ByteDance, für Unternehmen geöffnet. Weitere Stellen im Zusammenhang mit großen Modellalgorithmen werden eröffnet.

Das obige ist der detaillierte Inhalt vonCVPR 2024 |. Byte schlägt eine neue Generation von COCONut-Datensätzen vor, die dichter als die granulare COCO-Segmentierung sind. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Welche Bibliotheken werden für die Operationen der schwimmenden Punktzahl in Go verwendet? Welche Bibliotheken werden für die Operationen der schwimmenden Punktzahl in Go verwendet? Apr 02, 2025 pm 02:06 PM

In der Bibliothek, die für den Betrieb der Schwimmpunktnummer in der GO-Sprache verwendet wird, wird die Genauigkeit sichergestellt, wie die Genauigkeit ...

So führen Sie das H5 -Projekt aus So führen Sie das H5 -Projekt aus Apr 06, 2025 pm 12:21 PM

Ausführen des H5 -Projekts erfordert die folgenden Schritte: Installation der erforderlichen Tools wie Webserver, Node.js, Entwicklungstools usw. Erstellen Sie eine Entwicklungsumgebung, erstellen Sie Projektordner, initialisieren Sie Projekte und schreiben Sie Code. Starten Sie den Entwicklungsserver und führen Sie den Befehl mit der Befehlszeile aus. Vorschau des Projekts in Ihrem Browser und geben Sie die Entwicklungsserver -URL ein. Veröffentlichen Sie Projekte, optimieren Sie Code, stellen Sie Projekte bereit und richten Sie die Webserverkonfiguration ein.

Gitee Pages statische Website -Bereitstellung fehlgeschlagen: Wie können Sie einzelne Dateien 404 Fehler beheben und beheben? Gitee Pages statische Website -Bereitstellung fehlgeschlagen: Wie können Sie einzelne Dateien 404 Fehler beheben und beheben? Apr 04, 2025 pm 11:54 PM

GitePages statische Website -Bereitstellung fehlgeschlagen: 404 Fehlerbehebung und Auflösung bei der Verwendung von Gitee ...

Wie gibt ich die mit dem Modell in Beego Orm zugeordnete Datenbank an? Wie gibt ich die mit dem Modell in Beego Orm zugeordnete Datenbank an? Apr 02, 2025 pm 03:54 PM

Wie kann man im Beegoorm -Framework die mit dem Modell zugeordnete Datenbank angeben? In vielen BeEGO -Projekten müssen mehrere Datenbanken gleichzeitig betrieben werden. Bei Verwendung von BeEGO ...

Welche Bibliotheken in GO werden von großen Unternehmen entwickelt oder von bekannten Open-Source-Projekten bereitgestellt? Welche Bibliotheken in GO werden von großen Unternehmen entwickelt oder von bekannten Open-Source-Projekten bereitgestellt? Apr 02, 2025 pm 04:12 PM

Welche Bibliotheken in GO werden von großen Unternehmen oder bekannten Open-Source-Projekten entwickelt? Bei der Programmierung in Go begegnen Entwickler häufig auf einige häufige Bedürfnisse, ...

Bedarf die Produktion von H5 -Seiten eine kontinuierliche Wartung? Bedarf die Produktion von H5 -Seiten eine kontinuierliche Wartung? Apr 05, 2025 pm 11:27 PM

Die H5 -Seite muss aufgrund von Faktoren wie Code -Schwachstellen, Browserkompatibilität, Leistungsoptimierung, Sicherheitsaktualisierungen und Verbesserungen der Benutzererfahrung kontinuierlich aufrechterhalten werden. Zu den effektiven Wartungsmethoden gehören das Erstellen eines vollständigen Testsystems, die Verwendung von Versionstools für Versionskontrolle, die regelmäßige Überwachung der Seitenleistung, das Sammeln von Benutzern und die Formulierung von Wartungsplänen.

Wie löste ich das Problem des Typs des user_id -Typs bei der Verwendung von Redis -Stream, um Nachrichtenwarteschlangen in GO -Sprache zu implementieren? Wie löste ich das Problem des Typs des user_id -Typs bei der Verwendung von Redis -Stream, um Nachrichtenwarteschlangen in GO -Sprache zu implementieren? Apr 02, 2025 pm 04:54 PM

Das Problem der Verwendung von RETISTREAM zur Implementierung von Nachrichtenwarteschlangen in der GO -Sprache besteht darin, die Go -Sprache und Redis zu verwenden ...

Wie verbessert man die Genauigkeit der Jiebeba -Wortsegmentierung in der malerischen Spot -Kommentaranalyse? Wie verbessert man die Genauigkeit der Jiebeba -Wortsegmentierung in der malerischen Spot -Kommentaranalyse? Apr 02, 2025 am 07:09 AM

Wie löste ich das Problem der Jiebeba -Wortsegmentierung in der malerischen Spot -Kommentaranalyse? Wenn wir malerische Spot -Kommentare und -analysen durchführen, verwenden wir häufig das Jieba -Word -Segmentierungstool, um den Text zu verarbeiten ...

See all articles