Inhaltsverzeichnis
Experiment
Zusammenfassung
Heim Technologie-Peripheriegeräte KI Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.

May 15, 2023 pm 05:55 PM
机器人 指令 prompt

Xi Xiaoyao Technology Talk Original
Autor | Die Arbeit von InternChat legt Wert auf Benutzerfreundlichkeit, indem bei multimodalen Aufgaben mit dem Chatbot auf eine Weise interagiert wird, die über die Sprache (Cursor und Gesten) hinausgeht. Interessant ist auch der Name InternChat, der für Interaktion, Nonverbal und Chatbots steht. Im Gegensatz zu bestehenden interaktiven Systemen, die auf reiner Sprache basieren, verbessert iChat die Effizienz der Kommunikation zwischen Benutzern und Chatbots erheblich, indem es Zeigeanweisungen hinzufügt. Darüber hinaus stellt der Autor auch ein großes visuelles Sprachmodell namens Husky bereit, das Erfassung und visuelle Beantwortung von Fragen durchführen kann und auch GPT-3.5-Turbo mit nur 7 Milliarden Parametern beeindrucken kann.

Aufgrund der Beliebtheit der Demo-Website hat das Team die Erfahrungsseite jedoch vorübergehend offiziell geschlossen. Lassen Sie uns zunächst den Inhalt dieser Arbeit anhand des folgenden Videos verstehen Interaktion mit Chatbots Beyond Language

Papierlink:

https://www.php.cn/link/7c9966afcc510cf5a40621d1d92bdaf1

Demo. Adresse:
https://www.php.cn/link/e355ad06c5a89f911fbb0 aff2de52435

Projekt Adresse:
https://www.php.cn/link/2d13d901966a8eaa7f9c943eba6a540b

Hauptfunktionen des Systems
Der Autor hat auf der Projekthomepage einige Aufgaben-Screenshots bereitgestellt, damit Sie einige Funktionen und Effekte intuitiv erkennen können dieses interaktive System:

(a) Verdeckte Objekte entfernen

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen. (b) Interaktive Bildbearbeitung


(c) Bilderzeugung

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.

(d) Interaktive visuelle Frage und Antwort

(e) Interaktive Bildgenerierung Zentrale Aufgaben: Damit Computer verstehen, was sie in der Welt sehen, und entsprechend reagieren.

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.Kommunikation in Form von nonverbalen Anweisungen: Zeigeaktionen wie Cursor und Gesten.

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.▲ Abbildung 1 Die Gesamtarchitektur von iChat

iChat kombiniert die Vorteile von Zeige- und Sprachbefehlen, um visionsorientierte Aufgaben auszuführen. Wie in Abbildung 1 dargestellt, besteht dieses System aus drei Hauptkomponenten:

Eine Wahrnehmungseinheit, die Zeigeanweisungen auf Bildern oder Videos verarbeitet; Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.

Ein LLM-Controller mit einem Hilfssteuermechanismus, der Sprachanweisungen genau analysieren kann;

Integriertes HuggingFace Ein Open-World-Toolkit mit verschiedenen Online-Modellen, vom Benutzer trainierten privaten Modellen und anderen Anwendungen (z. B. Taschenrechner, Suchmaschinen).

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.

Es kann effektiv auf drei Ebenen arbeiten:

  1. Grundlegende Interaktion;
  2. Sprachgesteuerte Interaktion;
  3. Punkt-zu-Sprache-gestützte Interaktion.

Wenn ein reines Sprachsystem die Aufgabe nicht abschließen kann, kann das System, wie in Abbildung 2 dargestellt, dennoch komplexe interaktive Aufgaben erfolgreich ausführen.

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.

▲ Abbildung 2 weist auf die Vorteile sprachgesteuerter interaktiver Systeme hin

Experiment

Betrachten wir zunächst die Kombination verbaler und nonverbaler Anweisungen, um den Kommunikationseffekt mit dem interaktiven System zu verbessern. Um die Vorteile dieses Hybridmodells gegenüber reinen Sprachanweisungen aufzuzeigen, führte das Forschungsteam eine Benutzerbefragung durch. Die Teilnehmer chatteten mit Visual ChatGPT und iChat und gaben Feedback zu ihren Erfahrungen mit der Anwendung. Die Ergebnisse in den Tabellen 1 und 2 zeigen, dass iChat effizienter und benutzerfreundlicher ist als Visual ChatGPT.

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.

▲Tabelle 1 Benutzerumfrage zu „Etwas entfernen“

Eine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.

▲Tabelle 2 Benutzerumfrage zu „Etwas durch etwas ersetzen“

Zusammenfassung

Allerdings gibt es in diesem System immer noch einige Einschränkungen, darunter :

  • Die Wirksamkeit von iChat hängt stark von der Qualität und Genauigkeit des zugrunde liegenden Open-Source-Modells ab. Diese Modelle können jedoch Einschränkungen oder Vorurteile aufweisen, die sich negativ auf die Leistung von iChat auswirken.
  • Da Benutzerinteraktionen komplexer werden oder die Anzahl der Instanzen zunimmt, muss das System Genauigkeit und Reaktionszeit aufrechterhalten, was für iChat eine Herausforderung sein kann.
  • Darüber hinaus mangelt es an einer erlernbaren Zusammenarbeit zwischen aktuellen visionären und sprachbasierten Modellen, beispielsweise an Features, die durch Instruktionsdaten angepasst werden können.
  • iChat kann Schwierigkeiten haben, mit neuartigen oder ungewöhnlichen Situationen außerhalb der Trainingsdaten umzugehen, was zu Leistungseinbußen führt.
  • Das Erreichen einer nahtlosen Integration über verschiedene Geräte und Plattformen hinweg kann aufgrund unterschiedlicher Hardwarefunktionen, Softwareeinschränkungen und Zugänglichkeitsanforderungen eine Herausforderung darstellen.

Auf der auf der Projekthomepage aufgeführten Planliste stehen noch mehrere Ziele, die noch nicht erreicht wurden. Darunter ist auch die chinesische Interaktion, die der Redakteur derzeit auf dem neuen Dialogsystem erleben muss Es gibt noch kein chinesisches Problem, aber es scheint keine Lösung zu geben, da die meisten multimodalen Datensätze auf Englisch basieren Die Chineseisierung wird noch einige Zeit in Anspruch nehmen.

Das obige ist der detaillierte Inhalt vonEine Eingabeaufforderung ist nicht mehr erforderlich. Sie können das multimodale Dialogsystem nur mit Ihren Händen spielen.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wie bekomme ich Gegenstände mithilfe von Befehlen in Terraria? -Wie sammle ich Gegenstände in Terraria? Wie bekomme ich Gegenstände mithilfe von Befehlen in Terraria? -Wie sammle ich Gegenstände in Terraria? Mar 19, 2024 am 08:13 AM

Wie bekomme ich Gegenstände mithilfe von Befehlen in Terraria? 1. Was ist der Befehl zum Erteilen von Gegenständen in Terraria? Im Spiel Terraria ist das Erteilen von Befehlen an Gegenstände eine sehr praktische Funktion. Durch diesen Befehl können Spieler die benötigten Gegenstände direkt erhalten, ohne gegen Monster kämpfen oder sich an einen bestimmten Ort teleportieren zu müssen. Dies kann erheblich Zeit sparen, die Effizienz des Spiels verbessern und es den Spielern ermöglichen, sich mehr auf die Erkundung und den Aufbau der Welt zu konzentrieren. Insgesamt macht diese Funktion das Spielerlebnis flüssiger und angenehmer. 2. So verwenden Sie Terraria, um Objektbefehle zu erteilen 1. Öffnen Sie das Spiel und rufen Sie die Spieloberfläche auf. 2. Drücken Sie die „Enter“-Taste auf der Tastatur, um das Chat-Fenster zu öffnen. 3. Geben Sie im Chatfenster das Befehlsformat ein: „/give[Spielername][Artikel-ID][Artikelmenge]“.

Mar 18, 2024 am 09:20 AM

Heute möchte ich eine aktuelle Forschungsarbeit der University of Connecticut vorstellen, die eine Methode zum Abgleichen von Zeitreihendaten mit großen NLP-Modellen (Natural Language Processing) im latenten Raum vorschlägt, um die Leistung von Zeitreihenprognosen zu verbessern. Der Schlüssel zu dieser Methode besteht darin, latente räumliche Hinweise (Eingabeaufforderungen) zu verwenden, um die Genauigkeit von Zeitreihenvorhersagen zu verbessern. Titel des Papiers: S2IP-LLM: SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting Download-Adresse: https://arxiv.org/pdf/2403.05798v1.pdf 1. Hintergrundmodell für große Probleme

Der Ameca der zweiten Generation ist da! Er kann fließend mit dem Publikum kommunizieren, sein Gesichtsausdruck ist realistischer und er kann Dutzende Sprachen sprechen. Der Ameca der zweiten Generation ist da! Er kann fließend mit dem Publikum kommunizieren, sein Gesichtsausdruck ist realistischer und er kann Dutzende Sprachen sprechen. Mar 04, 2024 am 09:10 AM

Der humanoide Roboter Ameca wurde auf die zweite Generation aufgerüstet! Kürzlich erschien auf der World Mobile Communications Conference MWC2024 erneut der weltweit fortschrittlichste Roboter Ameca. Rund um den Veranstaltungsort lockte Ameca zahlreiche Zuschauer an. Mit dem Segen von GPT-4 kann Ameca in Echtzeit auf verschiedene Probleme reagieren. „Lass uns tanzen.“ Auf die Frage, ob sie Gefühle habe, antwortete Ameca mit einer Reihe von Gesichtsausdrücken, die sehr lebensecht aussahen. Erst vor wenigen Tagen stellte EngineeredArts, das britische Robotikunternehmen hinter Ameca, die neuesten Entwicklungsergebnisse des Teams vor. Im Video verfügt der Roboter Ameca über visuelle Fähigkeiten und kann den gesamten Raum und bestimmte Objekte sehen und beschreiben. Das Erstaunlichste ist, dass sie es auch kann

Der erste Roboter erscheint, der menschliche Aufgaben autonom erledigt, mit fünf flexiblen Fingern und übermenschlicher Geschwindigkeit, und große Modelle unterstützen das Training im virtuellen Raum Der erste Roboter erscheint, der menschliche Aufgaben autonom erledigt, mit fünf flexiblen Fingern und übermenschlicher Geschwindigkeit, und große Modelle unterstützen das Training im virtuellen Raum Mar 11, 2024 pm 12:10 PM

Diese Woche gab FigureAI, ein Robotikunternehmen, an dem OpenAI, Microsoft, Bezos und Nvidia beteiligt sind, bekannt, dass es fast 700 Millionen US-Dollar an Finanzmitteln erhalten hat und plant, im nächsten Jahr einen humanoiden Roboter zu entwickeln, der selbstständig gehen kann. Und Teslas Optimus Prime hat immer wieder gute Nachrichten erhalten. Niemand zweifelt daran, dass dieses Jahr das Jahr sein wird, in dem humanoide Roboter explodieren. SanctuaryAI, ein in Kanada ansässiges Robotikunternehmen, hat kürzlich einen neuen humanoiden Roboter auf den Markt gebracht: Phoenix. Beamte behaupten, dass es viele Aufgaben autonom und mit der gleichen Geschwindigkeit wie Menschen erledigen kann. Pheonix, der weltweit erste Roboter, der Aufgaben autonom in menschlicher Geschwindigkeit erledigen kann, kann jedes Objekt sanft greifen, bewegen und elegant auf der linken und rechten Seite platzieren. Es kann Objekte autonom identifizieren

Wie kann KI Roboter autonomer und anpassungsfähiger machen? Wie kann KI Roboter autonomer und anpassungsfähiger machen? Jun 03, 2024 pm 07:18 PM

Im Bereich der industriellen Automatisierungstechnik gibt es zwei aktuelle Hotspots, die kaum zu ignorieren sind: Künstliche Intelligenz (KI) und Nvidia. Ändern Sie nicht die Bedeutung des ursprünglichen Inhalts, optimieren Sie den Inhalt, schreiben Sie den Inhalt neu, fahren Sie nicht fort: „Darüber hinaus sind beide eng miteinander verbunden, da Nvidia nicht auf seine ursprüngliche Grafikverarbeitungseinheit (GPU) beschränkt ist ) erweitert es seine GPU. Die Technologie erstreckt sich auf den Bereich der digitalen Zwillinge und ist eng mit neuen KI-Technologien verbunden. „Vor kurzem hat NVIDIA eine Zusammenarbeit mit vielen Industrieunternehmen geschlossen, darunter führende Industrieautomatisierungsunternehmen wie Aveva, Rockwell Automation und Siemens und Schneider Electric sowie Teradyne Robotics und seine Unternehmen MiR und Universal Robots. Kürzlich hat Nvidia gesammelt

Nach 2 Monaten kann der humanoide Roboter Walker S Kleidung falten Nach 2 Monaten kann der humanoide Roboter Walker S Kleidung falten Apr 03, 2024 am 08:01 AM

Herausgeber des Machine Power Report: Wu Xin Die heimische Version des humanoiden Roboters + eines großen Modellteams hat zum ersten Mal die Betriebsaufgabe komplexer flexibler Materialien wie das Falten von Kleidung abgeschlossen. Mit der Enthüllung von Figure01, das das multimodale große Modell von OpenAI integriert, haben die damit verbundenen Fortschritte inländischer Kollegen Aufmerksamkeit erregt. Erst gestern veröffentlichte UBTECH, Chinas „größter Bestand an humanoiden Robotern“, die erste Demo des humanoiden Roboters WalkerS, der tief in das große Modell von Baidu Wenxin integriert ist und einige interessante neue Funktionen aufweist. Jetzt sieht WalkerS, gesegnet mit Baidu Wenxins großen Modellfähigkeiten, so aus. Wie Figure01 bewegt sich WalkerS nicht umher, sondern steht hinter einem Schreibtisch, um eine Reihe von Aufgaben zu erledigen. Es kann menschlichen Befehlen folgen und Kleidung falten

Zehn humanoide Roboter gestalten die Zukunft Zehn humanoide Roboter gestalten die Zukunft Mar 22, 2024 pm 08:51 PM

Die folgenden 10 humanoiden Roboter prägen unsere Zukunft: 1. ASIMO: ASIMO wurde von Honda entwickelt und ist einer der bekanntesten humanoiden Roboter. Mit einer Höhe von 1,20 m und einem Gewicht von 50 kg ist ASIMO mit fortschrittlichen Sensoren und künstlichen Intelligenzfunktionen ausgestattet, die es ihm ermöglichen, sich in komplexen Umgebungen zurechtzufinden und mit Menschen zu interagieren. Aufgrund seiner Vielseitigkeit eignet sich ASIMO für eine Vielzahl von Aufgaben, von der Unterstützung von Menschen mit Behinderungen bis hin zur Durchführung von Präsentationen bei Veranstaltungen. 2. Pepper: Pepper wurde von Softbank Robotics entwickelt und möchte ein sozialer Begleiter für Menschen sein. Mit seinem ausdrucksstarken Gesicht und der Fähigkeit, Emotionen zu erkennen, kann Pepper an Gesprächen teilnehmen, im Einzelhandel helfen und sogar pädagogische Unterstützung leisten. Pfeffer

Der Kehr- und Wischroboter Cloud Whale Xiaoyao 001 hat ein „Gehirn'! |. Erfahrung Der Kehr- und Wischroboter Cloud Whale Xiaoyao 001 hat ein „Gehirn'! |. Erfahrung Apr 26, 2024 pm 04:22 PM

Kehr- und Wischroboter gehören in den letzten Jahren zu den beliebtesten Smart-Home-Geräten bei Verbrauchern. Die damit verbundene Bequemlichkeit der Bedienung oder sogar die Notwendigkeit einer Bedienung ermöglicht es faulen Menschen, ihre Hände frei zu haben, was es den Verbrauchern ermöglicht, sich von der täglichen Hausarbeit zu „befreien“ und mehr Zeit mit den Dingen zu verbringen, die sie in getarnter Form genießen. Aufgrund dieser Begeisterung stellen fast alle Haushaltsgerätemarken auf dem Markt ihre eigenen Kehr- und Wischroboter her, was den gesamten Markt für Kehr- und Wischroboter sehr lebendig macht. Allerdings wird die schnelle Expansion des Marktes unweigerlich eine versteckte Gefahr mit sich bringen: Viele Hersteller werden die Taktik des Maschinenmeeres nutzen, um schnell mehr Marktanteile zu erobern, was zu vielen neuen Produkten ohne Upgrade-Punkte führen wird Es handelt sich um „Matroschka“-Modelle. Keine Übertreibung. Allerdings sind das nicht alle Kehr- und Wischroboter

See all articles