


Google veröffentlicht multimodalen Bard-Assistenten: ein weiterer Meilenstein in Richtung der Ära der interaktiven KI
Auf einer neuen Produkteinführungskonferenz hat Google vor einigen Tagen offiziell die neue Generation der Android-Flaggschiff-Telefone der Pixel 8/Pro-Serie vorgestellt, die mit dem Tensor G3-Chip ausgestattet sind. Dieser Chip kann komplexere ML-Modelle (maschinelles Lernen) ausführen und mehrere hinzufügen KI-Funktionen für das neue Telefon, wie das Vorlesen von Webseiten für Benutzer in verschiedenen Sprachen und „natürlicheren“ Stimmen sowie natürlicheres Sprechen virtueller Assistenten.
Google wies darauf hin, dass Pixel 8 Pro das erste Telefon ist, das das grundlegende große Modell von Google direkt auf dem Gerät ausführt, was eine 150-fache Berechnung des größten ML-Modells auf Pixel 7 erfordert.
Gleichzeitig kündigte Google die Einführung von „Assistant with Bard“ für Android- und iOS-Geräte an, das die persönliche Assistentenfunktion des Telefons mit generativer KI kombiniert. Benutzer können mit dem Bard Assistant über Text, Sprache oder Bilder interagieren Mit anderen Worten, es verfügt über multimodale Fähigkeiten.
Wenn Benutzer fragen: „Welche wichtigen E-Mails habe ich diese Woche verpasst?“, stellt Bard Assistant die folgenden Dienste bereit: Zunächst werden die wichtigsten Punkte und spezifischen Inhalte jeder wichtigen E-Mail aufgelistet und Links zu den entsprechenden E-Mails bereitgestellt. Zweitens kann es Benutzern auch dabei helfen, aktive Adressen zu extrahieren und sie in Google Maps anzuzeigen
Darüber hinaus sagte Mustafa Suleyman, Mitbegründer von DeepMind, kürzlich in einem Interview:
Die derzeitige generative KI ist nur eine technische Übergangsphase und wird als nächstes in die Ära der interaktiven KI eintreten. KI wird Aufgaben basierend auf den Unterschieden arrangieren Aufgabenanforderungen der Benutzer anderer Software und/oder Kontaktaufnahme mit echten Menschen, um die Arbeit zu erledigen.
Er glaubt, dass sich die erste Welle der künstlichen Intelligenz hauptsächlich auf die Klassifizierung konzentrierte – Deep Learning zeigt, dass Menschen künstliche Intelligenz trainieren können, um Eingabedaten wie Bilder, Videos, Audios und Sprachen zu klassifizieren. Die Menschheit befindet sich derzeit in der zweiten Welle der „generativen künstlichen Intelligenz“, die darin besteht, „Daten einzugeben und neue Daten zu generieren“. Die dritte Welle in der Zukunft wird zur „interaktiven künstlichen Intelligenz“ gehören. „Konversation ist die interaktive Schnittstelle der Zukunft.“ Bis dahin wird die interaktive künstliche Intelligenz nicht nur auf Schaltflächen klicken und Text eingeben selbstständig Maßnahmen zu ergreifenTianfeng Securities wies darauf hin, dass
Die Bedeutung von Szenarien in der Implementierungsphase von C-seitigen KI-Anwendungen immer wichtiger geworden ist, wobei Chatbots, KI-Begleiter und Content-Produktionstool-Szenarien die ersten sind, die implementiert werden. Die Entwicklungsgeschwindigkeit und der Kommerzialisierungsfortschritt von KI-Anwendungen in diesen Szenarien können die Erwartungen übertreffen.
Nach den Prognosen der Analysten werden sich die Iteration künstlicher Intelligenz und die katalytische Wirkung späterer Ereignisse weiter beschleunigen. In der zweiten Jahreshälfte wird die Iterationsgeschwindigkeit von Anwendungen und Modellen ausländischer Riesenunternehmen deutlich verbessert, und es wird erwartet, dass die Fähigkeiten allgemeiner Chatbots weiter verbessert werden. Dies kann zu einer Verbesserung des Benutzererlebnisses führen und die Anzahl der Benutzer weiter erhöhenDarüber hinaus fügte Huajin Securities hinzu, dass die Verlagerung großer Modelle von allgemeinen zu vertikalen Szenarien eher eine Untersuchung der Kommerzialisierung sei und die treibende Kraft dafür sei, dass große Modelle vom Training zur Inferenz übergehen.
Mit der Entwicklung und Verbesserung vertikaler Großmodelle ist die Anwendung großer Modelle der Schlüssel zur Erschließung größerer Wachstumsmöglichkeiten. Edge Computing ist ein klarer und riesiger inkrementeller Markt, der inzwischen die Phase der Branchenimplementierung erreicht hat. Cloud-Computing-Unternehmen, Telekommunikationsbetreiber, Gerätehersteller, CDN-Unternehmen usw. fördern aktiv die Branchenimplementierung. Der umgeschriebene Inhalt ist: Quelle: Financial Associated Press
Das obige ist der detaillierte Inhalt vonGoogle veröffentlicht multimodalen Bard-Assistenten: ein weiterer Meilenstein in Richtung der Ära der interaktiven KI. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Der Artikel überprüft Top -KI -Kunstgeneratoren, diskutiert ihre Funktionen, Eignung für kreative Projekte und Wert. Es zeigt MidJourney als den besten Wert für Fachkräfte und empfiehlt Dall-E 2 für hochwertige, anpassbare Kunst.

Chatgpt 4 ist derzeit verfügbar und weit verbreitet, wodurch im Vergleich zu seinen Vorgängern wie ChatGPT 3.5 signifikante Verbesserungen beim Verständnis des Kontextes und des Generierens kohärenter Antworten zeigt. Zukünftige Entwicklungen können mehr personalisierte Inters umfassen

Metas Lama 3.2: Ein Sprung nach vorne in der multimodalen und mobilen KI Meta hat kürzlich Lama 3.2 vorgestellt, ein bedeutender Fortschritt in der KI mit leistungsstarken Sichtfunktionen und leichten Textmodellen, die für mobile Geräte optimiert sind. Aufbau auf dem Erfolg o

Der Artikel vergleicht Top -KI -Chatbots wie Chatgpt, Gemini und Claude und konzentriert sich auf ihre einzigartigen Funktionen, Anpassungsoptionen und Leistung in der Verarbeitung und Zuverlässigkeit natürlicher Sprache.

In dem Artikel werden Top -KI -Schreibassistenten wie Grammarly, Jasper, Copy.ai, Writesonic und RYTR erläutert und sich auf ihre einzigartigen Funktionen für die Erstellung von Inhalten konzentrieren. Es wird argumentiert, dass Jasper in der SEO -Optimierung auszeichnet, während KI -Tools dazu beitragen, den Ton zu erhalten

Falcon 3: Ein revolutionäres Open-Source-Großsprachmodell Falcon 3, die neueste Iteration in der gefeierten Falcon -Serie von LLMs, stellt einen erheblichen Fortschritt in der AI -Technologie dar. Entwickelt vom Technology Innovation Institute (TII), diesem offen

2024 veränderte sich von einfacher Verwendung von LLMs für die Erzeugung von Inhalten zum Verständnis ihrer inneren Funktionsweise. Diese Erkundung führte zur Entdeckung von AI -Agenten - autonome Systeme zur Handhabung von Aufgaben und Entscheidungen mit minimalem menschlichen Eingreifen. Bauen

Der Artikel überprüft Top -KI -Sprachgeneratoren wie Google Cloud, Amazon Polly, Microsoft Azure, IBM Watson und Descript, wobei sie sich auf ihre Funktionen, die Sprachqualität und die Eignung für verschiedene Anforderungen konzentrieren.
