Sehen Sie sich Videos an, zeichnen Sie CAD und erkennen Sie bewegte Bilder! Das große multimodale Industriemodell von 75B ist so leistungsfähig-KI-php.cn

Inhaltsverzeichnis

1. ChatCAD: Die Schönheit des industriellen „Wen Sheng-Diagramms“

2. ChatVision: ein neues Tool zur Arbeitssicherheitsüberwachung

3. ChatRobot Pro: „Motion Imagination Recognition“

4. Sich weiterentwickeln und vorankommen

Heim

Technologie-Peripheriegeräte

Sehen Sie sich Videos an, zeichnen Sie CAD und erkennen Sie bewegte Bilder! Das große multimodale Industriemodell von 75B ist so leistungsfähig

王林

Mar 28, 2024 pm 10:01 PM

产业 Innovation und Weisheit

Der Schwerpunkt des diesjährigen Upgrades liegt auf der Einführung multimodaler Großmodellfunktionen.

Während die von Sora und Suno geschaffenen Video- und Musikkompositionen weltweit eine audiovisuelle Revolution auslösen, wie werden sich groß angelegte multimodale Anwendungen in der Industrie entwickeln? Am 27. März stellte Innovation Qizhi als Chinas führender Lösungsanbieter für „KI+-Fertigung“ seine zukunftsweisende Antwort vor.

Nach einem halben Jahr harter Arbeit veröffentlichte Innovation Qizhi auf einer Pressekonferenz in Peking die leistungsstärkere Version des Qizhi Haiming Industrial Large Model 2.0 (AInno-75B). Mehrere große native Modellanwendungen kamen ebenfalls auf den Markt, darunter ChatVision, ChatCAD und ChatRobot wurde ebenfalls auf die Pro-Version aktualisiert.

Sehen Sie sich Videos an, zeichnen Sie CAD und erkennen Sie bewegte Bilder! Das große multimodale Industriemodell von 75B ist so leistungsfähig

^{raus raus}

Menge. Derzeit besteht ein gewisser Konsens über die Schnittstelle. Durch die Verbesserung der Parameter kann die Modellleistung verbessert werden. Im Vergleich zu AInno-15B hat AInno-75B ein deutliches Wachstum in Größe und Leistung erzielt.

Der Schwerpunkt des diesjährigen Upgrades liegt auf der Einführung von Multimode-Fähigkeiten für große Modelle. Zhang Faen erklärte, dass dieses fortschrittliche große Modell mehrere Informationsmodalitäten verarbeiten kann, darunter Text, Bilder und Videos, und sogar Datentypen integrieren kann, die nur für industrielle Szenarien gelten, wie etwa CAD-Zeichnungen und EEG-Signale. Die Ausgabe ist ebenso vielfältig und kann Text, Bilder, Videos, CAD-Konstruktionszeichnungen oder Betriebsverhalten von Werkzeugkörpern generieren.

Sehen Sie sich Videos an, zeichnen Sie CAD und erkennen Sie bewegte Bilder! Das große multimodale Industriemodell von 75B ist so leistungsfähig

1. ChatCAD: Die Schönheit des industriellen „Wen Sheng-Diagramms“

Die von der C-seitigen AIGC-Anwendung generierten Bilder und Videoarbeiten sind atemberaubend, und im Bereich der Unternehmensdienstleistungen sind die Ebenso spannend sind die Möglichkeiten zur KI-Generierung.

Industriedesign ist der Grundstein der Produktionsaktivitäten. Von Mobiltelefonen bis hin zu Fabriken für neue Energiefahrzeuge sollte das Industriedesign vor der Produktion und dem Bau abgeschlossen sein. Als Grundlage des Industriedesigns nimmt CAD-Software eine wichtige Stellung in der Industriekette ein. Der Medien-CAD-Softwaremarkt meines Landes wurde lange Zeit von ausländischen Herstellern dominiert, mit komplexen Schnittstellen und hohen Nutzungsbarrieren.

Wang Ein einzelnes Gebäude, egal ob es sich um ein Standardgeschoss oder einen Komplex handelt, erfordert, dass Designer es einzeln zeichnen. Das Gleiche gilt für Industriezeichnungen, die viel Arbeitskraft und Materialressourcen verbrauchen. Darüber hinaus gibt es viele Branchenspezifikationen und häufige Überarbeitungen, was die Designschwierigkeit weiter erhöht.

Um diese Situation zu durchbrechen, übernahm Chuangxinqizhi die Führung bei der Einführung der industriellen Großmodelltechnologie im Bereich des Industriedesigns und startete eine Text-zu-CAD-Anwendung – „ChatCAD“: durch ein einfaches Dialog- und Frage-und-Antwort-Format Sie können die kreativen Absichten des Designers schnell verstehen, automatisch Industriedesignzeichnungen erstellen, die den Anforderungen entsprechen, und den Export in herkömmliche Software zur Feinabstimmung unterstützen.

Geben Sie „Helfen Sie mir, eine industrielle Riemenscheibe zu entwerfen“ ein. Die Parameter lauten wie folgt: Der Radius der Riemenscheibe beträgt 6, die Dicke beträgt 5, die Kante der Riemenscheibe ragt um 0,8 nach außen, die Dicke des hervorstehenden Teils beträgt 0,5 Die Höhe der Mittelachse der Riemenscheibe beträgt 5 Zoll und der Radius beträgt 4 Zoll. ChatCAD generiert sofort Grafiken und verfeinert das Design kontinuierlich auf der Grundlage des Feedbacks. ^{{ Zum Beispiel: „Helfen Sie mir, eine Turbine zu entwerfen. Die Turbine besteht aus einem Motor und einer Motorabdeckung. Die spezifischen Anforderungen sind wie folgt: Der Motor ist zylindrisch, 20 cm lang und 16 cm im Durchmesser. Die Turbine besteht aus einer zylindrischen Turbinenwelle und 5 Lüfterblätter. Der Durchmesser beträgt 12, die Oberseite der Turbine sollte eine zylindrische, konische rotierende Welle haben, die Wellenkappenlänge beträgt 9, der Durchmesser beträgt 50 Die Länge beträgt 30 und der Abstand zwischen der Turbinenschaufel und der Haube beträgt 1.}ChatCAD kann weiterhin Ergebnisse generieren und basierend auf Feedback weiter verbessern. Die von ChatCAD generierten Designs unterstützen auch gängige Dateiformate und können nahtlos mit anderer Industriesoftware verbunden werden, um die spätere Integration und Änderung zu erleichtern.

Live-Demonstration des Turbinendesigns

Diese Funktion begeistert Herrn Wang sehr. Er ist davon überzeugt, dass ChatCAD der Branche dabei helfen soll, sich wiederholende Arbeiten zu reduzieren und starre Spezifikationsbeschränkungen zu vermeiden, wodurch die manuelle Angebotserstellung in der gesamten Branche beeinträchtigt wird.

Wie wird ChatCAD also implementiert? CAD unterscheidet sich von gängigen Modalitäten wie Text, Bildern und Videos. Es muss geometrische Daten wie Punkte, Linien, Kanten, Kreise, Spalten und Prozesse darstellen. „Deshalb nennen wir es auch eine Modalität, eine Modalität, die es auf der C-Seite nicht gibt. Wir müssen unsere eigene Zwischensprache erfinden, um CAD auszudrücken, diese Zwischensprache oder diesen Zwischencode für große Modelle generieren und diese Zwischencodes dann übersetzen.“ in CAD "

^{Offiziell veröffentlicht Chatcad Demo}

Zhang Fa'en sagte ehrlich, dass die aktuellen einfachen Zeichnungen, die von Chatcad erzeugt wurden, direkt zur Verarbeitung verwendet werden können, aber komplexe Designs müssen noch verbessert werden. Das Ziel von ChatCAD ist es, ein Assistent der rechten Hand für Ingenieure in Designinstituten zu werden. Es wird erwartet, dass der Designprozess, der ursprünglich zehn Stunden dauerte, auf eine Stunde verkürzt wird, wobei das große Modell für 90 % der Arbeit verantwortlich ist und die restlichen 10 % manuell optimiert werden.

Erwähnenswert ist, dass Chuangxinqizhi fortschrittliche Großmodelltechnologie erfolgreich in verschiedene Industriesoftware wie CAD, MES und BI integriert und so die Intelligenz des gesamten Prozesses „F&E-Design-Produktionssteuerung-Informationsmanagement“ bei Renovierungen und Upgrades realisiert hat.

2. ChatVision: ein neues Tool zur Arbeitssicherheitsüberwachung

Produktionssicherheit und Compliance im Werk sind von entscheidender Bedeutung, Videoüberwachung und Bildanalyse sind unverzichtbar. Nehmen wir als Beispiel das Wellenlöten in einer Leiterplattenfabrik, wenn Arbeiter 280-Grad-Hochtemperatur-Zinnöfen reinigen, wenn sie nicht unbedingt Sicherheitsschutzausrüstung wie luftdichte Aktivkohlemasken, Hochtemperatur-Schutzhandschuhe usw. tragen ., es besteht die Gefahr schwerer Verbrennungen.

Herkömmliche Überwachungsmethoden sind ineffizient, versteckte Gefahren sind leicht zu übersehen und es kommt zu offensichtlichen Verzögerungen bei nachfolgenden Inspektionen. Basierend auf dem industriellen Großmodell Alnno-75B kann ChatVision Überwachungsvideostreams, Videodateien und Bilder in Echtzeit mithilfe natürlicher Sprache analysieren, nicht konformes Verhalten genau identifizieren und sofort das Alarmsystem auslösen (z. B. automatisches Versenden von E-Mails an Administratoren). um die Sicherheit von Industrieunternehmen in der Produktion zu unterstützen.

Bei der Live-Demonstration auf der Pressekonferenz reagierte ChatVision präzise auf umfassende Verständnisbefehle wie „Schauen Sie sich den aktuellen Bildschirm genau an und sagen Sie mir, wo dieser sein könnte“, sowie „Suchen Sie die Steckdose im Bildschirm“, „ „Finde den weißen Schutzhelm“ usw. Spezifische Zielerkennungsaufgaben zeigen seine breiten Anwendungsaussichten.
Während der Vorführung vor Ort hat C演Hasion die konkreten Ziele wie die Steckdose im Bild gefunden“ und „den weißen Helm gefunden“.
Diese Anleitung scheint sehr einfach zu sein, nein Bei großen Modellen müssen für jede kleine Erkennungskategorie (z. B. Schutzhelme und Rauchen) spezifische Algorithmen entwickelt werden. Es ist schwierig, sie nach dem Debuggen und Bereitstellen zu ändern, und die Implementierungskosten sind hoch Große Modelle untergraben das traditionelle Paradigma. Ein einzelnes großes Modell kann die Funktionen mehrerer kleiner Modelle abdecken, übertrifft alle Aspekte in Bezug auf Leistung, Genauigkeit und Generalisierungsfähigkeiten und unterstützt die Interaktion in natürlicher Sprache, was den Entwicklungs- und Bereitstellungsprozess erheblich vereinfacht. Während der Live-Demonstration veränderte sich der Bildschirm: Ein Kollege zog ihn aus. Während der Arbeiter mit seinem Handy spielte, zog ein anderer Kollege seine Sicherheitskleidung aus und gab eine Anweisung: „Bitte analysieren Sie dieses Bild sorgfältig und senden Sie eine E-Mail an.“ Diese Anleitung ist sehr wissensintensiv und beinhaltet mehr als nur Verstöße. Zur Beurteilung müssen Sie auch entscheiden, ob der E-Mail-Versand und die Empfänger ausgelöst werden sollen. Dies ist der typische Servicemodus von großen -Modellieren Sie native Anwendungen. Daher nutzt ChatVision viele Sicherheitsüberwachungsfunktionen, um drei Verstöße zu identifizieren und nicht nur zu markieren. Rufen Sie externe Tools auf, um komplexe Videoverständnisaufgaben ordnungsgemäß abzuschließen Zhang Faen, CTO von Innovation Qizhi, sagte, dass das Unternehmen in den letzten Jahren mehr als 200 visuelle Algorithmen und Modell-Assets angesammelt habe und industrielle Großmodelle eine neue Welt für die Anwendung dieser Assets eröffnet hätten Intelligenter Orchestrator zur Optimierung des Benutzererlebnisses, aber seine multimodalen Fähigkeiten können auch das Videoverständnis verbessern und eine wichtige Rolle im Bereich der Unternehmenssicherheit spielen .

Der letzte Demonstrationsfall verdeutlicht die innovative Anwendung großer Modelle im multimodalen Bereich. Angesichts eines echten Werkstattvideos stellte der Demonstrator eine schwierige Forderung: „Bitte analysieren Sie dieses Video sorgfältig, sagen Sie mir, ob jemand isst und markieren Sie den Zeitpunkt, zu dem diese Aktion stattgefunden hat.“ Für diese Aufgabe ist ein großes Modell erforderlich, um eine kontinuierliche Aktionserkennung für Langzeitsequenzbilder durchzuführen und die Start- und Endzeiten der Aktionen zu markieren. Dadurch konnte ChatVision die Szene, in der die Arbeiter aßen, innerhalb der ersten 15 Sekunden des Videos genau lokalisieren.

„Essen ist ein sehr häufiges Ereignis, und die Fähigkeit großer Modelle, Ereignisse zu verstehen, ist weitaus besser als bei herkömmlichen kleinen Algorithmusmodellen“, erklärte Zhang Faen. Es besteht seit langem ein dringender Bedarf, die Produktions- und Techniksicherheit durch Video zu gewährleisten. Zukünftig wird erwartet, dass damit verbundene Arbeiten rund um große Modelle ein intelligentes Videoverständnis der Produktionssicherheitsbedingungen und der Einhaltung von Produktionsprozessen ermöglichen.

Nach Ansicht von Wang Xian hat Sicherheit bei Ingenieurprojekten immer oberste Priorität. Seit vielen Jahren beinhaltet die technische Sicherheitsschulung selten die Gefahrenerkennung vor Ort. Er glaubt, dass ChatVision breite Anwendungsaussichten hat und voraussichtlich bei der Erkennung von Schutzhelmen vor Ort, dem Tragen von Sicherheitsseilen in großer Höhe, dem Tragen von Sicherheitsausrüstung und anderen Szenarien implementiert wird. ChatVision hat auch in der Überwachungsbranche großes Potenzial. Derzeit sind viele Sicherheitsinspektionen vor Ort immer noch stark auf Arbeitskräfte angewiesen.

3. ChatRobot Pro: „Motion Imagination Recognition“

Die native Anwendung ChatRobot von AInno-15B hat die Sprachsteuerung von Industrierobotern implementiert. Sagen Sie ChatRobot einfach „Bring mir eine Tasse Kaffee“, und er kann den Industrieroboterarm anweisen, im Regal nach Kaffee zu suchen und seine eigene Route zu entwerfen, um die Waren an Sie zu liefern. ChatRobot Pro kann komplexere Informationsträger-EEG-Signale verarbeiten.

Bei der Pressekonferenz wählte der Demonstrator nach dem Zufallsprinzip ein Produkt (Uniform Green Tea) aus und bat eine Person mit mehreren an der Kopfhaut befestigten Elektroden, mithilfe ihrer motorischen Vorstellungskraft einen Industrieroboter zu steuern, der ihm das Getränk in die Hand gab. Der Mann, der den Kollektor trägt, versucht, an drei Dinge zu denken: links, rechts und Auswahl. Der Cursor bewegt sich basierend auf den vom großen Modell übersetzten Signalen auch nach links und rechts. Wenn sich der Cursor zum Zielsymbol bewegt, starrt er auf das Symbol und klickt mit dem Cursor, um es auszuwählen.

Als nächstes führt ChatRobot Pro selbstständig die intelligente Orchestrierung von Aufgaben durch, generiert ausführbare Aufgabenschritte und interagiert in Echtzeit mit der Schnittstelle des Industrieroboters, um den Roboter anzuweisen, die Aufgabe zu erledigen.

EEG-Signale sind Signale, die während der Gehirnaktivität erzeugt werden. Der Zusammenhang zwischen Gehirnaktivität und EEG-Signalen ist für Forscher zu einem großen Problem geworden. Während herkömmliche Ansätze eine geringe Genauigkeit aufweisen, zeigt AInno-75B Potenzial für die Interpretation dieser Art multimodaler Informationen. Einige ausländische Gehirn-Computer-Schnittstellentechnologien verwenden invasive Elektroden, um EEG-Signale zu erhalten, was eine Reihe technischer Probleme mit sich bringt, wie z. B. Elektrodendesign, chirurgische Implantation, Abstoßungsreaktion, Signalübertragung und Signaldekodierung. Innovation Qizhi verwendet nicht-invasive EEG-Kappen zur Erfassung von EEG-Informationen, was den technischen Aufwand erheblich reduziert.

Zhang Faen sagte jedoch auch, dass mit der invasiven Methode mehr Kanäle und klarere EEG-Signale erhalten werden können, was die spätere Entschlüsselung komplexerer Gehirnabsichten erleichtern wird. Eine anschauliche Metapher ist: Die invasive Methode zur Erfassung von EEG-Signalen ist so, als würde man einem Konzert in einem Stadion zuhören, während die nicht-invasive Methode so ist, als würde man einem Konzert außerhalb des Stadions zuhören. Es wird einen großen Unterschied in der Klarheit des Gesangs geben . Derzeit besteht die Forschungs- und Entwicklungsarbeit von Innovation Qizhi darin, die multimodalen Fähigkeiten großer Industriemodelle zu überprüfen und technische Voruntersuchungen für mögliche zukünftige gehirngesteuerte industrielle Automatisierungsszenarien durchzuführen.

Dies ist auch eine native End-to-End-Anwendung, betonte Zhang Faen. Der gesamte Prozess von der Eingabe des EEG-Signals bis zur direkten Ausgabe des Endergebnisses (ein Roboterarm, der die Waren an den Demonstrator liefert) wird vom neuronalen Netzwerk abgeschlossen, ohne dass man sich auf manuell entworfene Funktionen oder traditionelle Datenverarbeitung verlassen muss.

Zusätzlich zur natürlichen Sprachinteraktion und der Erkennung motorischer Vorstellungskraft nutzt ChatRobot Pro auch die industriellen Großmodell-Folgefähigkeiten voll aus, um die Orchestrierung langer Aufgabensequenzen und die komplexe Entscheidungsfindung zu erreichen. Die zukünftige Ausrichtung des innovativen Großmodells Qizhi Industrial wird auch darin bestehen, verschiedenen Körpern (sei es industrielle Roboterarme oder AGVs usw.) leistungsstarke intelligente Steuerungs- und Entscheidungsfähigkeiten zu verleihen.

4. Sich weiterentwickeln und vorankommen

Im Zeitalter der generativen KI gibt es keinen Präzedenzfall für industrielle Innovationen. Qizhi hat verschiedene Möglichkeiten in industriellen Szenarien erkundet.

Zhang Faen nennt die Aussicht auf große Modelle in Richtung Unternehmensdienstleistungen „vielversprechend“. Aber er räumte ein, dass in der Zeit des technologischen Wandels das Verständnis aller Menschen oft uneinheitlich ist, insbesondere bei relativ großen Veränderungen. Das Verständnis der Menschen braucht Zeit, um weiterzuverfolgen, und er ist keine Ausnahme.

Zusätzlich zu den neuen nativen Anwendungen wurden die Gesamtleistung und Wirkung von ChatDOC, das letztes Jahr veröffentlicht wurde, verbessert und die Produktfunktionen sind vollständiger geworden. ChatBI hat Unterstützung für Excel- und CSV-Daten hinzugefügt und jetzt ist die Genauigkeit der Generierung von SQL-Anweisungen und Analyseberichten um 15 % gestiegen. Große Modellbereitstellungs-Engines sind einfacher bereitzustellen und bieten eine höhere Inferenzleistung.

„Innovation Qizhi wird die ChatX-Anwendung weiter verbessern, die direkt auf den Kerngenerierungsfunktionen industrieller Großmodelle basiert.“

Das obige ist der detaillierte Inhalt vonSehen Sie sich Videos an, zeichnen Sie CAD und erkennen Sie bewegte Bilder! Das große multimodale Industriemodell von 75B ist so leistungsfähig. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Repo: Wie man Teamkollegen wiederbelebt

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Wie lange dauert es, um Split Fiction zu schlagen?

3 Wochen vor By DDD

R.E.P.O. Dateispeicherspeicherort: Wo ist es und wie schützt sie?

3 Wochen vor By DDD

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7347

Java-Tutorial

1627

CakePHP-Tutorial

1352

Laravel-Tutorial

1265

PHP-Tutorial

1214

Related knowledge

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden Aug 09, 2024 pm 04:01 PM

Aber vielleicht kann er den alten Mann im Park nicht besiegen? Die Olympischen Spiele in Paris sind in vollem Gange und Tischtennis hat viel Aufmerksamkeit erregt. Gleichzeitig haben Roboter auch beim Tischtennisspielen neue Durchbrüche erzielt. Gerade hat DeepMind den ersten lernenden Roboteragenten vorgeschlagen, der das Niveau menschlicher Amateurspieler im Tischtennis-Wettkampf erreichen kann. Papieradresse: https://arxiv.org/pdf/2408.03906 Wie gut ist der DeepMind-Roboter beim Tischtennisspielen? Vermutlich auf Augenhöhe mit menschlichen Amateurspielern: Sowohl Vorhand als auch Rückhand: Der Gegner nutzt unterschiedliche Spielstile, und auch der Roboter hält aus: Aufschlagannahme mit unterschiedlichem Spin: Allerdings scheint die Intensität des Spiels nicht so intensiv zu sein wie Der alte Mann im Park. Für Roboter, Tischtennis

Die erste mechanische Klaue! Yuanluobao trat auf der Weltroboterkonferenz 2024 auf und stellte den ersten Schachroboter vor, der das Haus betreten kann Aug 21, 2024 pm 07:33 PM

Am 21. August fand in Peking die Weltroboterkonferenz 2024 im großen Stil statt. Die Heimrobotermarke „Yuanluobot SenseRobot“ von SenseTime hat ihre gesamte Produktfamilie vorgestellt und kürzlich den Yuanluobot AI-Schachspielroboter – Chess Professional Edition (im Folgenden als „Yuanluobot SenseRobot“ bezeichnet) herausgebracht und ist damit der weltweit erste A-Schachroboter für heim. Als drittes schachspielendes Roboterprodukt von Yuanluobo hat der neue Guoxiang-Roboter eine Vielzahl spezieller technischer Verbesserungen und Innovationen in den Bereichen KI und Maschinenbau erfahren und erstmals die Fähigkeit erkannt, dreidimensionale Schachfiguren aufzunehmen B. durch mechanische Klauen an einem Heimroboter, und führen Sie Mensch-Maschine-Funktionen aus, z. B. Schach spielen, jeder spielt Schach, Überprüfung der Notation usw.

Claude ist auch faul geworden! Netizen: Lernen Sie, sich einen Urlaub zu gönnen Sep 02, 2024 pm 01:56 PM

Der Schulstart steht vor der Tür und nicht nur die Schüler, die bald ins neue Semester starten, sollten auf sich selbst aufpassen, sondern auch die großen KI-Modelle. Vor einiger Zeit war Reddit voller Internetnutzer, die sich darüber beschwerten, dass Claude faul werde. „Sein Niveau ist stark gesunken, es kommt oft zu Pausen und sogar die Ausgabe wird sehr kurz. In der ersten Woche der Veröffentlichung konnte es ein komplettes 4-seitiges Dokument auf einmal übersetzen, aber jetzt kann es nicht einmal eine halbe Seite ausgeben.“ !

Auf der Weltroboterkonferenz wurde dieser Haushaltsroboter, der „die Hoffnung auf eine zukünftige Altenpflege' in sich trägt, umzingelt Aug 22, 2024 pm 10:35 PM

Auf der World Robot Conference in Peking ist die Präsentation humanoider Roboter zum absoluten Mittelpunkt der Szene geworden. Am Stand von Stardust Intelligent führte der KI-Roboterassistent S1 drei große Darbietungen mit Hackbrett, Kampfkunst und Kalligraphie auf Ein Ausstellungsbereich, der sowohl Literatur als auch Kampfkunst umfasst, zog eine große Anzahl von Fachpublikum und Medien an. Durch das elegante Spiel auf den elastischen Saiten demonstriert der S1 eine feine Bedienung und absolute Kontrolle mit Geschwindigkeit, Kraft und Präzision. CCTV News führte einen Sonderbericht über das Nachahmungslernen und die intelligente Steuerung hinter „Kalligraphie“ durch. Firmengründer Lai Jie erklärte, dass hinter den seidenweichen Bewegungen die Hardware-Seite die beste Kraftkontrolle und die menschenähnlichsten Körperindikatoren (Geschwindigkeit, Belastung) anstrebt. usw.), aber auf der KI-Seite werden die realen Bewegungsdaten von Menschen gesammelt, sodass der Roboter stärker werden kann, wenn er auf eine schwierige Situation stößt, und lernen kann, sich schnell weiterzuentwickeln. Und agil

Das Team von Li Feifei schlug ReKep vor, um Robotern räumliche Intelligenz zu verleihen und GPT-4o zu integrieren Sep 03, 2024 pm 05:18 PM

Tiefe Integration von Vision und Roboterlernen. Wenn zwei Roboterhände reibungslos zusammenarbeiten, um Kleidung zu falten, Tee einzuschenken und Schuhe zu packen, gepaart mit dem humanoiden 1X-Roboter NEO, der in letzter Zeit für Schlagzeilen gesorgt hat, haben Sie vielleicht das Gefühl: Wir scheinen in das Zeitalter der Roboter einzutreten. Tatsächlich sind diese seidigen Bewegungen das Produkt fortschrittlicher Robotertechnologie + exquisitem Rahmendesign + multimodaler großer Modelle. Wir wissen, dass nützliche Roboter oft komplexe und exquisite Interaktionen mit der Umgebung erfordern und die Umgebung als Einschränkungen im räumlichen und zeitlichen Bereich dargestellt werden kann. Wenn Sie beispielsweise möchten, dass ein Roboter Tee einschenkt, muss der Roboter zunächst den Griff der Teekanne ergreifen und sie aufrecht halten, ohne den Tee zu verschütten, und ihn dann sanft bewegen, bis die Öffnung der Kanne mit der Öffnung der Tasse übereinstimmt , und neigen Sie dann die Teekanne in einem bestimmten Winkel. Das

Bekanntgabe der ACL 2024 Awards: Eines der besten Papers zum Thema Oracle Deciphering von HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Bei dieser ACL-Konferenz haben die Teilnehmer viel gewonnen. Die sechstägige ACL2024 findet in Bangkok, Thailand, statt. ACL ist die führende internationale Konferenz im Bereich Computerlinguistik und Verarbeitung natürlicher Sprache. Sie wird von der International Association for Computational Linguistics organisiert und findet jährlich statt. ACL steht seit jeher an erster Stelle, wenn es um akademischen Einfluss im Bereich NLP geht, und ist außerdem eine von der CCF-A empfohlene Konferenz. Die diesjährige ACL-Konferenz ist die 62. und hat mehr als 400 innovative Arbeiten im Bereich NLP eingereicht. Gestern Nachmittag gab die Konferenz den besten Vortrag und weitere Auszeichnungen bekannt. Diesmal gibt es 7 Best Paper Awards (zwei davon unveröffentlicht), 1 Best Theme Paper Award und 35 Outstanding Paper Awards. Die Konferenz verlieh außerdem drei Resource Paper Awards (ResourceAward) und einen Social Impact Award (

Hongmeng Smart Travel S9 und die umfassende Einführungskonferenz für neue Produkte wurden gemeinsam mit einer Reihe neuer Blockbuster-Produkte veröffentlicht Aug 08, 2024 am 07:02 AM

Heute Nachmittag begrüßte Hongmeng Zhixing offiziell neue Marken und neue Autos. Am 6. August veranstaltete Huawei die Hongmeng Smart Xingxing S9 und die Huawei-Konferenz zur Einführung neuer Produkte mit umfassendem Szenario und brachte die Panorama-Smart-Flaggschiff-Limousine Xiangjie S9, das neue M7Pro und Huawei novaFlip, MatePad Pro 12,2 Zoll, das neue MatePad Air und Huawei Bisheng mit Mit vielen neuen Smart-Produkten für alle Szenarien, darunter die Laserdrucker der X1-Serie, FreeBuds6i, WATCHFIT3 und der Smart Screen S5Pro, von Smart Travel über Smart Office bis hin zu Smart Wear baut Huawei weiterhin ein Smart-Ökosystem für alle Szenarien auf, um Verbrauchern ein Smart-Erlebnis zu bieten Internet von allem. Hongmeng Zhixing: Huawei arbeitet mit chinesischen Partnern aus der Automobilindustrie zusammen, um die Modernisierung der Smart-Car-Industrie voranzutreiben

Das erste große UI-Modell in China wird veröffentlicht! Das große Modell von Motiff ist der beste Assistent für Designer und optimiert den UI-Design-Workflow Aug 19, 2024 pm 04:48 PM

Künstliche Intelligenz entwickelt sich schneller, als Sie sich vorstellen können. Seit GPT-4 die multimodale Technologie in die Öffentlichkeit gebracht hat, sind multimodale Großmodelle in eine Phase rasanter Entwicklung eingetreten, die sich allmählich von der reinen Modellforschung und -entwicklung hin zur Erforschung und Anwendung in vertikalen Bereichen verlagert und tief in alle Lebensbereiche integriert ist. Im Bereich der Schnittstelleninteraktion haben internationale Technologiegiganten wie Google und Apple in die Forschung und Entwicklung großer multimodaler UI-Modelle investiert, die als einziger Weg für die KI-Revolution im Mobiltelefon gelten. In diesem Zusammenhang wurde das erste groß angelegte UI-Modell in China geboren. Am 17. August stellte Motiff, ein Designtool im KI-Zeitalter, auf der IXDC2024 International Experience Design Conference sein unabhängig entwickeltes multimodales UI-Modell vor – das Motiff Model. Dies ist das weltweit erste UI-Design-Tool

See all articles