Inhaltsverzeichnis
Die Bewertungsmethode verwendet mAP (mean Average Precision), was bei visuellen Aufgaben wie der Zielerkennung üblich ist.
Vorstellung des Autors
Heim Technologie-Peripheriegeräte KI Was soll ich tun, wenn die KI „er, sie, es' nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.

Was soll ich tun, wenn die KI „er, sie, es' nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.

Apr 12, 2023 pm 07:46 PM
ai 模型 动词

Wenn Sie der KI Anweisungen geben, haben Sie immer das Gefühl, dass die Kommunikation mit Menschen anders ist?

Ja, KI kann einige spezifische menschliche Anweisungen verstehen, wie zum Beispiel:

Helfen Sie, einen Stuhl aus dem Restaurant zu bewegen.

Aber wenn es durch vage Anweisungen mit nur Pronomen (er/sie/es/dies/das/das/Ding...) und Verben ersetzt würde, wäre die KI verwirrt:

Hilfe Finden Sie etwas, worauf Sie Ihre Füße legen können.

Jetzt haben einige Forscher endlich einen neuen Weg gefunden, damit umzugehen: Wäre es nicht genug, wenn die KI lernen würde, Verben zu verstehen?

Das Verb selbst ist an einige bestimmte Substantive gebunden. Beispielsweise ist die Aktion „Butter verteilen“ definitiv untrennbar mit Substantiven wie „Messer“ und „Gabel“ verbunden.

Sie müssen sie nur zuordnen. Es sind auch keine Substantivbefehle wie „Messer und Gabel“ erforderlich, um das Zielobjekt genau zu finden:

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.# 🎜🎜 #

Derzeit ist dieses Papier offiziell in NeurIPS 2022 enthalten, und das zugehörige Modell ist ebenfalls Open Source:

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.

Also Wie trainiert es das KI-Verb?

Das Abdecken von Substantiven ermöglicht es der KI, „Bilder anzusehen, um Objekte zu finden“

Das Papier schlägt ein Framework namens TOIST vor.

TOIST steht für „Task Oriented Instance Segmentation Transformer“ (Task Oriented Instance Segmentation Transformer), eine neue Instanzsegmentierungslösung basierend auf Transformer.

Die Instanzsegmentierung unterscheidet sich vom „vollständigen Bildausschnitt“ der semantischen Segmentierung. Im folgenden Bild wird beispielsweise das Substantiv „Fließheckauto“ verwendet direkt finden Geben Sie das entsprechende Objekt aus:

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.

Bisher wurden Instanzsegmentierungsmodelle normalerweise in „zwei Schritte“ unterteilt. Der erste Schritt besteht darin Erkennen möglicher Ziele. Im zweiten Schritt werden mögliche Ziele eingestuft und das wahrscheinlichste Ergebnis vorhergesagt.

Aber im Gegensatz zu diesem Ansatz übernimmt das TOIST-Framework direkt eine vollständige Transformer-Architektur, in der der Selbstaufmerksamkeitsmechanismus im Decoder die Präferenzbeziehung zwischen Kandidatenzielen herstellen kann.

TOIST Das Gesamtgerüst ist in drei Teile gegliedert.

Unter diesen ist der multimodale Encoder (brauner Teil) für das Extrahieren von Feature-Markern verantwortlich, und der Transformer-Encoder (grüner Teil) ist für die Aggregation der Features der beiden Modalitäten verantwortlich und basiert auf dem Transformator-Decoder (blauer Teil) zur Vorhersage des am besten geeigneten Ziels.

Anschließend schlug das Papier eine neue Nomen-Pronomen-Destillationsmethode (Nomen-Pronomen-Destillation) zum Trainieren des Modells vor.

Konkret wird die KI auf der Grundlage des Wissensdestillationsrahmens (Lehrer-Schüler-Modell oben) darauf trainiert, Substantivprototypen basierend auf dem Kontext in einer unbeaufsichtigten Lernweise zu „erraten“.

Zum Beispiel lautet die ursprüngliche Instanzsegmentierungsaufgabe „Grabe ein Loch mit einem Skateboard“, aber beim Training des Modells wird das Substantiv „Skateboard“ durch das Pronomen „etwas“ ersetzt: # 🎜🎜 #

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt. Auf diese Weise kann die KI das richtige Substantiv aus dem Nichts erraten und das richtige Ziel im Bild segmentieren: #🎜🎜 ##🎜🎜 #

Wie wirkt sich dieser Segmentierungseffekt in konkreten Fällen aus?

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt. Zielerkennungsgenauigkeit um 10,9 % erhöht

Das Papier testete TOIST am groß angelegten Aufgabendatensatz COCO-Tasks.

Die Bewertungsmethode verwendet mAP (mean Average Precision), was bei visuellen Aufgaben wie der Zielerkennung üblich ist.

Einfach ausgedrückt: TOIST schneidet besser ab als das vorherige Instanzsegmentierungs- und Zielerkennungsmodell SOTA, und mit der „erweiterten Version“ TOIST, die durch die Nomen-Pronomen-Destillationsmethode hinzugefügt wird, ist die Leistung sogar besser als TOIST . Gehen Sie eine Etage höher.

Unter anderem stieg bei der Zielerkennungsaufgabe die „erweiterte Version“ von TOISTs Entscheidungsbox-Genauigkeit mAP um 10,9 % und bei der Instanzsegmentierungsaufgabe die Maskengenauigkeit war 6,6 % höher als Mask-RCNN+GGNN.

Was die vorgeschlagene Nomen-Pronomen-Destillationsmethode betrifft, wurde die Genauigkeit der Instanzsegmentierungsaufgabe im Vergleich zur Originalversion von TOIST um 2.8 verbessert % bzw. 3,8 %.

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.

Spezifisch für die Fallleistung liegt der Modelleffekt auch sehr nahe am tatsächlichen wahren Wert der Segmentierung.

In Abbildung (d) hat der Algorithmus beispielsweise sogar erkannt, dass der Bierflaschenverschluss mithilfe eines Tisches geöffnet werden kann, was als perfekte Bewertung für das Verständnis bezeichnet werden kann:

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.

Bezüglich der ursprünglichen Absicht, dies zu tun Nachforschungen antwortete der Autor:

Unser Labor ist eigentlich für die Erforschung von Robotern verantwortlich, aber bei täglichen Umfragen haben wir herausgefunden, dass Benutzer es manchmal vorziehen, dem Roboter „Bedürfnisse“ zu beschreiben, anstatt ihm direkt zu sagen, was er tun soll.

Mit anderen Worten, KI-Algorithmen werden verwendet, um den Roboter dazu zu bringen, „noch einen Schritt zu denken“, anstatt nur ein Assistent zu sein, der Befehle befolgt.

Vorstellung des Autors

Die Autoren dieses Artikels kommen vom Tsinghua University Intelligent Industry Research Institute (AIR), der Peking University und dem Intel Research Institute. Einer der Autoren ist auch der Dekan des AIR.

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.

Li Pengfei, der Erstautor des Artikels, ist Doktorand am Institut für Intelligente Industrie der Tsinghua-Universität. Zu seinen Forschungsinteressen gehört das autonome Fahren und Computer Vision.

Der korrespondierende Autor Zhao Hao ist neuer Assistenzprofessor am Intelligent Industry Research Institute der Tsinghua-Universität, Forschungswissenschaftler am Intel China Research Institute und gemeinsamer Postdoktorand an der Peking-Universität. Er schloss sein Studium an der Fakultät für Elektrotechnik ab an der Tsinghua-Universität. Seine Forschungsinteressen sind Roboter und Computer.

Was soll ich tun, wenn die KI „er, sie, es nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.

Papieradresse: https://arxiv.org/abs/2210.10775

Projektadresse: https://github.com/AIR-DISCOVER/TOIST

Das obige ist der detaillierte Inhalt vonWas soll ich tun, wenn die KI „er, sie, es' nicht verstehen kann? Verben sind zu einem neuen Durchbruch geworden. Wenn der Roboter Butter hört, weiß er, wie man Messer und Gabel aufnimmt.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Crossplay haben?
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Debian Mail Server Firewall -Konfigurationstipps Debian Mail Server Firewall -Konfigurationstipps Apr 13, 2025 am 11:42 AM

Das Konfigurieren der Firewall eines Debian -Mailservers ist ein wichtiger Schritt zur Gewährleistung der Serversicherheit. Im Folgenden sind mehrere häufig verwendete Firewall -Konfigurationsmethoden, einschließlich der Verwendung von Iptables und Firewalld. Verwenden Sie Iptables, um Firewall so zu konfigurieren, dass Iptables (falls bereits installiert) installiert werden:

Debian Mail Server SSL -Zertifikat -Installationsmethode Debian Mail Server SSL -Zertifikat -Installationsmethode Apr 13, 2025 am 11:39 AM

Die Schritte zur Installation eines SSL -Zertifikats auf dem Debian Mail -Server sind wie folgt: 1. Installieren Sie zuerst das OpenSSL -Toolkit und stellen Sie sicher, dass das OpenSSL -Toolkit bereits in Ihrem System installiert ist. Wenn nicht installiert, können Sie den folgenden Befehl installieren: sudoapt-getupdatesudoapt-getinstallopenssl2. Generieren Sie den privaten Schlüssel und die Zertifikatanforderung als nächst

CentOS Shutdown -Befehlszeile CentOS Shutdown -Befehlszeile Apr 14, 2025 pm 09:12 PM

Der Befehl centOS stilldown wird heruntergefahren und die Syntax wird von [Optionen] ausgeführt [Informationen]. Zu den Optionen gehören: -h das System sofort stoppen; -P schalten Sie die Leistung nach dem Herunterfahren aus; -r neu starten; -t Wartezeit. Zeiten können als unmittelbar (jetzt), Minuten (Minuten) oder als bestimmte Zeit (HH: MM) angegeben werden. Hinzugefügten Informationen können in Systemmeldungen angezeigt werden.

Sony bestätigt die Möglichkeit, spezielle GPUs für PS5 Pro zu verwenden, um KI mit AMD zu entwickeln Sony bestätigt die Möglichkeit, spezielle GPUs für PS5 Pro zu verwenden, um KI mit AMD zu entwickeln Apr 13, 2025 pm 11:45 PM

Mark Cerny, Chefarchitekt von SonyInteractiveStonterment (Siey Interactive Entertainment), hat weitere Hardware-Details der Host-PlayStation5pro (PS5PRO) der nächsten Generation veröffentlicht, darunter ein auf Performance verbessertes Amdrdna2.x-GPU und ein maschinelles Lernen/künstliches Intelligenzprogramm Code-genannt "Amethylst" mit Amd. Der Fokus der PS5PRO-Leistungsverbesserung liegt immer noch auf drei Säulen, darunter eine leistungsstärkere GPU, eine fortschrittliche Ray-Tracing und eine von KI betriebene PSSR-Superauflösung. GPU nimmt eine maßgeschneiderte AMDRDNA2 -Architektur an, die Sony RDNA2.x nennt, und es hat eine rDNA3 -Architektur.

Was sind die Backup -Methoden für Gitlab auf CentOS? Was sind die Backup -Methoden für Gitlab auf CentOS? Apr 14, 2025 pm 05:33 PM

Backup- und Wiederherstellungsrichtlinie von GitLab im Rahmen von CentOS -System Um die Datensicherheit und Wiederherstellung der Daten zu gewährleisten, bietet GitLab on CentOS eine Vielzahl von Sicherungsmethoden. In diesem Artikel werden mehrere gängige Sicherungsmethoden, Konfigurationsparameter und Wiederherstellungsprozesse im Detail eingeführt, um eine vollständige GitLab -Sicherungs- und Wiederherstellungsstrategie aufzubauen. 1. Manuell Backup Verwenden Sie den GitLab-RakegitLab: Backup: Befehl erstellen, um die manuelle Sicherung auszuführen. Dieser Befehl unterstützt wichtige Informationen wie GitLab Repository, Datenbank, Benutzer, Benutzergruppen, Schlüssel und Berechtigungen. Die Standardsicherungsdatei wird im Verzeichnis/var/opt/gitlab/backups gespeichert. Sie können /etc /gitlab ändern

Was sind die Methoden zur Abstimmung der Leistung von Zookeeper auf CentOS Was sind die Methoden zur Abstimmung der Leistung von Zookeeper auf CentOS Apr 14, 2025 pm 03:18 PM

Die Zookeper -Leistungsstimmung auf CentOS kann von mehreren Aspekten beginnen, einschließlich Hardwarekonfiguration, Betriebssystemoptimierung, Konfigurationsparameteranpassung, Überwachung und Wartung usw. Hier finden Sie einige spezifische Tuning -Methoden: SSD wird für die Hardwarekonfiguration: Da die Daten von Zookeeper an Disk geschrieben werden, wird empfohlen, SSD zu verbessern, um die I/O -Leistung zu verbessern. Genug Memory: Zookeeper genügend Speicherressourcen zuweisen, um häufige Lesen und Schreiben von häufigen Festplatten zu vermeiden. Multi-Core-CPU: Verwenden Sie Multi-Core-CPU, um sicherzustellen, dass Zookeeper es parallel verarbeiten kann.

Endlich verändert! Microsoft Windows -Suchfunktion wird ein neues Update einleiten Endlich verändert! Microsoft Windows -Suchfunktion wird ein neues Update einleiten Apr 13, 2025 pm 11:42 PM

Die Verbesserungen von Microsoft an Windows -Suchfunktionen wurden auf einigen Windows -Insider -Kanälen in der EU getestet. Zuvor wurde die integrierte Windows -Suchfunktion von Benutzern kritisiert und hatte schlechte Erfahrung. Dieses Update teilt die Suchfunktion in zwei Teile auf: lokale Suche und Bing-basierte Websuche, um die Benutzererfahrung zu verbessern. Die neue Version der Suchschnittstelle führt standardmäßig lokale Dateisuche durch. Wenn Sie online suchen müssen, müssen Sie auf die Registerkarte "Microsoft Bingwebsearch" klicken, um zu wechseln. Nach dem Umschalten wird in der Suchleiste "Microsoft Bingwebsearch:" angezeigt, in dem Benutzer Keywords eingeben können. Dieser Schritt vermeidet effektiv das Mischen lokaler Suchergebnisse mit Bing -Suchergebnissen

Wie man ein Pytorch -Modell auf CentOS trainiert Wie man ein Pytorch -Modell auf CentOS trainiert Apr 14, 2025 pm 03:03 PM

Effizientes Training von Pytorch -Modellen auf CentOS -Systemen erfordert Schritte, und dieser Artikel bietet detaillierte Anleitungen. 1.. Es wird empfohlen, YUM oder DNF zu verwenden, um Python 3 und Upgrade PIP zu installieren: Sudoyumupdatepython3 (oder sudodnfupdatepython3), PIP3Install-upgradepip. CUDA und CUDNN (GPU -Beschleunigung): Wenn Sie Nvidiagpu verwenden, müssen Sie Cudatool installieren

See all articles