Heim > Technologie-Peripheriegeräte > KI > Die ChatGPT-Anwendung mit „Augen' ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

Die ChatGPT-Anwendung mit „Augen' ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

王林
Freigeben: 2023-04-11 13:55:03
nach vorne
1869 Leute haben es durchsucht

Die ChatGPT-Anwendung mit „Augen' ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

In den Augen vieler Menschen ist ChatGPT ein allmächtiges „Monster“.

Es kann Gedichte schreiben, codieren und sogar lange Artikel direkt erstellen ... Darüber hinaus ist ChatGPT auch sehr emotional und ausdrucksstark. Es sind nur wenige Gesprächsrunden erforderlich, um alle zu erobern.

Aber ist ChatGPT wirklich allmächtig?

Als Chatbot verfügt ChatGPT über hervorragende Sprachverständnis- und Textverarbeitungsfähigkeiten, aufgrund des Trainingsmodells unterstützt ChatGPT jedoch keine Bildgespräche. Stellen Sie sich vor, wenn Sie an Wochentagen mit Freunden chatten und keine Bilder senden können, geht Ihnen natürlich ein Teil des Spaßes verloren.

In China gibt es ein solches KI-Forschungs- und Entwicklungsteam, das Bilder genau identifizieren und mit Benutzern chatten kann. Es ist, als würde man ChatGPT ein Paar „Augen“ hinzufügen. Es kann auch Bilder perfekt erkennen. Vor ein paar Tagen erfuhr Magike.com vom Forschungs- und Entwicklungsteam von Yuanchengxiang, dass „Yuanchengxiang Chatlmg“ erst kürzlich gestartet wurde. Sie können die Anwendung erleben, indem Sie dem „öffentlichen WeChat-Konto“ „Yuanchengxiang“ folgen. (Hinweis: Aufgrund der Rechenleistung ist die Erstzugriffsmethode nur auf Einladung

)

Was ist also die Erfahrung mit der Verwendung von „Yuancheng Xiang Chatlmg“ und ist seine Bilderkennungsfunktion wirklich magisch? Am Vorabend der Produkteinführung führte Magike.com eine umfassende Bewertung und Zusammenfassung durch. Bild |. Yuan Cheng Xiang Chatlmg Logo

Schau dir das Bild an und lass uns reden? Diese ChatGPT-Anwendung ist erstaunlich

Geben Sie „Yuancheng Xiang Chatlmg“ ein. Sie können sehen, dass die Benutzeroberfläche der Anwendung sehr „einfach und klar“ ist – das Textdialogfeld unten, das symmetrische Avatar-Layout und verschiedene Elemente, die in unserem gemeinsamen Chat zusammengefasst sind Softwareschnittstelle. Die ChatGPT-Anwendung mit „Augen ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

Unten links in der App sehen Sie einen auffälligen „

Bild hochladen

“-Button.

Derzeit unterstützt die App drei Möglichkeiten zum Hochladen von Bildern, nämlich

Fotogalerie, Aufnehmen von Fotos und Dateiimport

, jeweils einzeln.

Anlässlich des Frauentags hat Magike.com außerdem zwei Artikel ausgewählt und an „Yuancheng Xiang Chatlmg“ übergeben, um festzustellen, ob sie geeignet sind. Bei einem davon handelt es sich um ein Lippenstiftbild, das von der ​

​Suchmaschine​

​ heruntergeladen wurde , das andere ist ein Notizblockbild , das mit dem Mobiltelefon aufgenommen wurde:

Es ist zu erkennen, dass „Yuancheng Xiang Chatlmg“ die Produkte auf den beiden Bildern genau identifiziert und auch einige andere Beschreibungen erweitert hat. wie der süße Bär auf dem Notizblock, der Lippenstift vor weißem Hintergrund usw. Gleichzeitig äußerte er auch sein eigenes Urteil darüber, ob diese beiden Artikel als Geschenke für Mädchen geeignet sind, und machte anhand der Vorlieben der Beschenkten auch rationale Vorschläge, ob die Geschenke geeignet sind.

Nachdem „Yuan Cheng Xiang Chatlmg“ die Antwort gegeben hatte, Die ChatGPT-Anwendung mit „Augen ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten. stellten wir eine weitere Frage

:

Die ChatGPT-Anwendung mit „Augen ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

Nun, die Vorschläge sind sehr relevant und die Logik des kontextuellen Verständnisses ist auch kohärent.

Darüber hinaus hat Meike.com auch einige andere Bilder zur Identifizierung von „Yuan Cheng Xiang Chatlmg“ hochgeladen.

Zum Beispiel dieses:

Die ChatGPT-Anwendung mit „Augen ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

Und dieses:

Die ChatGPT-Anwendung mit „Augen ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

Und diese:

Die ChatGPT-Anwendung mit „Augen ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

Die ChatGPT-Anwendung mit „Augen ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.

Man kann sehen, dass die Erkennungsfähigkeit von „Yuancheng Xiang Chatlmg“ ziemlich genau ist und kann Den Inhalt des Bildes, das Sie sehen, durch Text beschreiben.

Im Vergleich zu ChatGPT, das auf reiner Textinteraktion basiert, hat „Yuancheng Xiang Chatlmg“ mit einem zusätzlichen Paar „Augen“ neben grundlegenden Interaktionen wie dem Schreiben von Gedichten und Artikeln offensichtlich mehrere neue Funktionen entdeckt, darunter auch die Artikelerkennung seine wichtige Funktion.

Danach Mit der kontinuierlichen Erweiterung des Datenvolumens und der kontinuierlichen Optimierung der Produkte hofft Meike.com auch, dass „Yuanchengxiang Chatlmg“ uns weitere herausragende Leistungen bringen kann.

Angetrieben von einem großen Modell mit zig Milliarden Parametern wird es auch in Zukunft weiter verbessert.

Im Wesentlichen ist ChatGPT ein Chatbot-Produkt, das mithilfe des großen GPT-3-Modells Funktionen zur Textgenerierung bereitstellt. Die Leistungsfähigkeit von ChatGPT ist genau GPT-3 zu verdanken.

Als von OpenAI entwickeltes ​Modell zur Verarbeitung natürlicher Sprache​gibt es zu viele Diskussionspunkte. Lange vor dem Start von ChatGPT hatte sich GPT-3 bereits erfolgreich im KI-Bereich etabliert.

Es wird berichtet, dass das Modell 175 Milliarden Parameter erreicht und ein einzelnes Training Zehntausende GPUs erfordert, was fast 4,6 Millionen US-Dollar kostet. Solch eine verrückte „Goldschluckfähigkeit“ kann natürlich verrückte Anwendungen wie ChatGPT unterstützen.

Was sind also die Mängel von ChatGPT? Die Antwort ist ja!

Nach Angaben des Forschungs- und Entwicklungsteams von Yuanchengxiang ist „Yuanchengxiang Chatlmg“ mit einem selbst entwickelten „multimodalen Großmodell mit mehreren zehn Milliarden Parametern“ ausgestattet, was gleichbedeutend damit ist, ChatGPT mit „Augen“ zu versehen, um es menschlicher zu machen. wie Geh und unterhalte dich. Die sogenannte Multimodalität im Bereich der KI bezieht sich häufig auf die Zusammenarbeit sensorischer Informationen wie

Bilder, Text, Stimme

usw., um künstlicher Intelligenz dabei zu helfen, die Außenwelt genauer zu verstehen. Mit der Unterstützung multimodaler Großmodelle ist „Yuancheng Xiang Chatlmg“ auch in der Lage, Bilder zu verstehen.

Nach Angaben des Forschungs- und Entwicklungsteams von Yuanchengxiang beträgt die aktuelle Parameterskala des „Yuanchengxiang AI-Großmodells“ etwa 15 Milliarden; die Daten umfassen derzeit hauptsächlich „Bild-Text-Daten, VQA-Daten“ usw. Während des Trainingsprozesses gibt das Modell möglichst wenige lernbare Parameter frei, um ein effizientes Training bei begrenzter Rechenleistung zu gewährleisten.

Auf die Frage nach dem zukünftigen Entwicklungspfad des Modells verriet das Forschungs- und Entwicklungsteam von Yuanchengxiang gegenüber Meike.com, dass das große Modell in Zukunft zusätzlich zur aktuellen Bild- und Textinteraktion auch über die Fähigkeit zur Bilderzeugung verfügen wird. sodass Sie bei der Beantwortung auch mit selbst erstellten Bildern antworten können, was das Gespräch lebendiger macht.

Darüber hinaus wird dieser Modus weitere Modi wie Video, Audio usw. umfassen und sogar mit Technologien wie Digital Human kombiniert werden, um ein lebendigeres und dreidimensionaleres Bild zu entwickeln.

Es ist denkbar, dass unsere Gespräche mit Chatbots mit dem Segen der zig Milliarden Parameter multimodalen Großmodelle von Yuanchengxiang immer mehr zu echten Menschen werden und die KI-Technologie uns in Zukunft immer mehr Überraschungen bescheren wird.

Chinesische KI-Hersteller toben, wie weit ist das inländische ChatGPT?

Auf dem „Ministerial Channel“ der ersten Sitzung des 14. Nationalen Volkskongresses, der diesen Monat stattfand, lobte ​Minister für Wissenschaft und Technologie​​Wang ZhigangAls er über ChatGPT sprach, lobte er die Fortschritte, die es gebracht hat KI und verwandte Branchen.

Gleichzeitig wurden auch verschiedene durch ChatGPT ausgelöste Diskussionen von Vertretern und Ausschussmitgliedern in die beiden Sitzungen eingebracht.

Tatsächlich war KI bereits ein „häufiger Gast“ bei den National Two Sessions, noch bevor mein Land 2017 die Entwicklung künstlicher Intelligenz zu einer nationalen Strategie erhob. Heutzutage ist ChatGPT auf der ganzen Welt beliebt und die Menschen kommen nicht umhin, sich erneut zu fragen: Wie kann Chinas KI-Industrie den Trend von ChatGPT nutzen?

Magike.com nutzte die Gelegenheit zur Veröffentlichung neuer Produkte und diskutierte zu diesem Thema auch mit Dr. Gao Yizhao, dem Leiter des Forschungs- und Entwicklungsteams von Yuanchengxiang.

Seiner Meinung nach

Der Bau großer KI-Modelle in China erfordert eine langfristige Planung und Kontinuität der Arbeit, um wirklich innovative Technologie zu entwickeln.

Wenn wir auf die „Entwicklungsgeschichte“ von ChatGPT zurückblicken, stellen wir fest, dass es nicht einfach ist, ein großes KI-Modell aufzubauen. Darüber hinaus müssen wir es tun Berücksichtigen Sie auch die Optimierung von Trainingsdaten und der Reduzierung des Rechenleistungsverbrauchs.

Mit anderen Worten:

Wenn Sie eine ChatGPT-ähnliche Anwendung erstellen möchten, können Sie dies nicht durch einen einfachen „100-Meter-Sprint“ tun, sondern müssen geduldig einen „10.000-Meter-Langstreckenlauf“ absolvieren. bevor du ins „Rennen der Besten“ einsteigen kannst.

Nach dem aktuellen Entwicklungsstand zu urteilen, befinden sich die großen KI-Modelle inländischer Hersteller jedoch noch im Forschungs- und Entwicklungsstadium, und Teams wie „Yuancheng Xiang Chatlmg“, die die Anwendungsebene erreichen können, sind immer noch sehr selten – erstens Die Entwicklung großer inländischer KI-Modelle beginnt im Allgemeinen spät, und es besteht ein erheblicher Talentmangel. Zweitens ist die Ausbildung großer Modelle im chinesischen Kontext schwieriger und nimmt viel mehr Zeit in Anspruch als im englischen.

Diese Probleme hätten „Geduld“ erfordern müssen, um sie zu lösen, aber als die letzte Welle des KI-Investitionsbooms abkühlte, waren viele Unternehmen gezwungen, ihre Budgets zu kürzen, was schließlich zu einem Engpass bei der Entwicklung verwandter KI-Unternehmen führte.

Im Gegensatz dazu ist das Forschungs- und Entwicklungsteam von Yuanchengxiang relativ reibungslos gelaufen. Einerseits verfügt das Team über langfristige Forschung im Bereich der KI-Anwendungen, andererseits profitiert es auch von seinem korrekten Urteilsvermögen in Bezug auf Multimodalität Mit Weitsicht und Weitsicht haben wir schließlich mit der Beharrlichkeit des gesamten Teams „

Blooming and Fruiting

“ in die ChatGPT-Ära eingeleitet.

Als er über die zukünftige Erforschung von KI-Unternehmen sprach, brachte Dr. Gao auch einige seiner eigenen Meinungen zum Ausdruck: „In Bezug auf ökologisches Bauen kann China ​

​Open Source​

​ fördern. Schließlich liegt darin Stärke Zahlen. " Fazit

Seit seiner Veröffentlichung im letzten Jahr hat sich ChatGPT von einem „

phänomenalen Produkt

“ zu einem „

Tech-Symbol“ entwickelt. Inländische Technologiehersteller beeilen sich, ChatGPT-ähnliche Produkte auf den Markt zu bringen, in der Hoffnung, zu gewinnen Holen Sie sich in diesem Wettbewerb den sogenannten „Sieg“. Gleichzeitig löste die heimische KI-Branche mit der Popularität von ChatGPT erneut einen neuen Produktboom aus. In dieser Zeit stach „Yuancheng Xiang Chatlmg“ hervor.

Nach der Bewertung der Anwendung „Yuancheng Xiang Chatlmg“ zu urteilen, ist ihre Erfahrung bereits sehr benutzerfreundlich und sie verfügt sogar über „Bilderkennungs“-Funktionen, die ChatGPT nicht hat.

Natürlich gibt es als frühe Version von „Yuanchengxiang Chatlmg“ noch einige Mängel in einigen Details, aber ich glaube, dass die inländische ChatGPT-Anwendung mit den Bemühungen und der Beharrlichkeit des Forschungs- und Entwicklungsteams von Yuanchengxiang die Branche in Zukunft auch überraschen kann.

Das obige ist der detaillierte Inhalt vonDie ChatGPT-Anwendung mit „Augen' ist da! Unterstützt durch ein großes multimodales Modell mit 15 Milliarden Parametern ist es vielseitig beim Lesen von Bildern und Chatten.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:51cto.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage