AI Weekly News: Ma Huateng sagte, dass KI eine einmalige Chance sei, OpenAI iOS nutzt, um die Benutzerbindung zu sichern, und verkörperte Intelligenz es KI ermöglicht, die reale Welt wahrzunehmen-KI-php.cn

Ab nächster Woche werden die wöchentlichen AI-News täglich aktualisiert – die tägliche AI-News-Kolumne. Jeder ist herzlich eingeladen, weiterhin Wall Street-News und Weisheitsforschung zu verfolgen.

Neue KI-Nachrichten diese Woche – neue Perspektive der Nachrichten

Wöchentliche Nachrichten

Zusammenfassung der wichtigsten Punkte dieser Woche:

1. Ma Huateng sagte, dass KI mit der industriellen Revolution im Bereich der elektrischen Energie vergleichbar sei;

2. OpenAI veröffentlicht die iOS-Version von chatGPT und öffnet 70 Plug-ins für Plus-Benutzer

3. Meta veröffentlicht den KI-Chip – MTIA, dessen Veröffentlichung 25 Jahre dauern wird. Er wird weiterhin eine NVIDIA-GPU verwenden.

4. Ein neuer Meilenstein im KI-Zeichnen – DragGAN ermöglicht es einem Elefanten, sich umzudrehen und ein Auto mit einem Klick zu „konvertieren“.

5. Verkörperte Intelligenz schafft KI-aktive Wahrnehmung, die nächste Welle der künstlichen Intelligenz.

6. Yuncong Technology veröffentlicht das Großmodell. Der Kommerzialisierungspfad im vertikalen Bereich ist die Chance für inländische Großmodelle.

7. KI-Schwarz-Technologie – Sie können Disneys „Beyond the Horizon“ zu Hause erleben; der halbmechanische „Spider-Man“ untergräbt die Wahrnehmung der Mensch-Computer-Interaktion.

Sehen Sie die Nachrichten aus einer neuen Perspektive

Auf der Aktionärsversammlung von Tencent im Jahr 2023 sagte Ma Huateng: „Zuerst dachten alle, KI sei eine einmalige Chance für das Internet, aber jetzt hat sich das Verständnis von KI zu einer jahrhundertealten Entwicklungschance entwickelt.“ Das kann mit der industriellen Revolution im Bereich der elektrischen Energie verglichen werden.“ Auch Tencent beschäftigt sich derzeit mit der Forschung und Entwicklung der KI-Technologie, aber wir sind nicht bestrebt, in Zukunft mehr Wert zu schaffen Wir werden uns nicht nur auf die To-C-Seite konzentrieren, sondern auch Wert auf die To-B-Seite-Möglichkeiten legen.

Darüber hinaus entwickelt Meituan heimlich große Modelle und bereitet das Feld seit Anfang März vor. Kürzlich wurde auch das Algorithmenteam erweitert und plant außerdem die Einrichtung einer separaten „Plattformabteilung“, um die großen Modelle von Meituan zu unterstützen bestimmte Vermarktungsformulare übergeben.

Jianzhi Research glaubt: Der aktuelle Wettbewerb zwischen großen Modellen ist sehr hart und das Aufkommen vieler großer Open-Source-Modelle hat die Geschwindigkeit dieser Entwicklung erhöht. Das Problem bei Open-Source-Großmodellen besteht jedoch darin, dass sie schwer zu kommerzialisieren sind und hauptsächlich für die akademische Forschung verwendet werden. Wenn jedoch in einigen Schlüsselbereichen geschlossene, fortgeschrittene Großmodelle im Ausland verwendet werden, bestehen Sicherheitsrisiken.

Der Trend zur Entwicklung inländischer Großmodelle liegt also im Reichtum chinesischer Vorhersagebibliotheken, starken Lokalisierungsvorteilen sowie hoher Sicherheit und Vertraulichkeit. Die Marktnachfrage nach chinesisch-spezifischen Großmodellen wird in Zukunft sehr hoch sein.

Was besondere Aufmerksamkeit verdient, ist der kommerzielle Wert der Kombination großer Modelle und Anwendungen. Sowohl openAI als auch Microsoft und Google haben sukzessive begonnen, ihr ökologisches Territorium zu erweitern. Dies ist auch der unvermeidliche Weg für die heimische KI-Entwicklung, die letztendlich realisiert werden muss und einen größeren kommerziellen Wert generiert.

Breaking Release

1. OpenAI veröffentlicht die iOS-Version von chatGPT und öffnet 70 Plug-ins für Plus-Benutzer

OpenA hat diese Woche offiziell die iOS-Version von chatGPT eingeführt. Benutzer müssen iOS 16.1 oder eine höhere Betriebssystemversion verwenden. Und verspricht, dass bald eine Android-Version veröffentlicht wird.

ChatGPT auf dem Mobiltelefon unterstützt die geräteübergreifende Synchronisierung der Verlaufsaufzeichnungen der Benutzer und integriert außerdem das Open-Source-Spracherkennungssystem Whisper. Benutzer können Inhalte per Sprache eingeben, Fragen und Antworten durchführen, Sprachcoaching durchführen und automatisch Text generieren .

Darüber hinaus öffnet ChatGPT die Netzwerkfunktion für PLUS-Benutzer und ermöglicht die Verwendung von 70 Plug-ins von Drittanbietern.

Jianzhi Research glaubt: Ob es sich um die Förderung mobiler Anwendungen oder die Verwendung offener Plug-Ins von Drittanbietern handelt, dies sind die Bemühungen von OpenAI, die Benutzerbindung zu erhöhen und die Benutzerdurchdringung weiter zu erreichen.

Das Öffnen der mobilen Version erhöht die Nutzungshäufigkeit der Benutzer erheblich, da sie bequemer und einfacher zu verwenden ist als die PC-Version. Seit der Einführung von ChatGPT wollten Benutzer ChatGPT auf Mobilgeräten verwenden. Der kommerzielle Wert und das tägliche aktive Volumen von ChatGPT werden mit der Eröffnung des mobilen Terminals erneut neue Höhen erreichen. Darüber hinaus wird mit zunehmender Besucherzahl der Bedarf an Rechenleistung weiter steigen.

Darüber hinaus sind Plug-ins von Drittanbietern zwar derzeit nur PLUS-zahlenden Benutzern zugänglich, gemessen am aktuellen Grad der KI-Integration wird es jedoch bald völlig kostenlos sein.

2. Meta veröffentlicht KI-dedizierten Chip-MTIA

MTIA ist ein programmierbarer Chip, der für Training und Inferenz entwickelt wurde. Seine Einführung hat die Hardwarestärke von Meta im Bereich der künstlichen Intelligenz erheblich verbessert. Letztendlich kann sich der Wettbewerb zwischen Technologiegiganten der Kernhardware nicht entziehen. Insbesondere im Zeitalter der Entwicklung von KI ist das Rechenleistungsniveau der Eckpfeiler der Entwicklung. Wenn die Rechenleistung nicht beherrscht werden kann, wird der Entwicklungsprozess zwangsläufig von „anderen“ kontrolliert. .

Aber MTIA hat noch viel Raum für Optimierung und es wird erwartet, dass es bis zur Veröffentlichung noch 25 Jahre warten wird. In Bezug auf NNP- und GPU-Leistungstests weist MTIA eine bessere Leistung bei Modellen mit niedriger und mittlerer Komplexität auf, liegt jedoch bei Modellen mit hoher Komplexität immer noch weit hinter der GPU zurück.

Zhizhi Research glaubt: Meta entwickelt KI-Chips für die Zukunft. Schließlich ist der Weg zur Hochleistungs-Chipentwicklung auch sehr lang bereits 2020 fertiggestellt. Los geht's. Derzeit wird Meta noch NVIDIA-GPUs verwenden. Schließlich hat Meta im Jahr 2022 gerade ein bahnbrechendes Design für sein Rechenzentrum durchgeführt, um NVIDIA-GPUs einzuführen. In Zukunft wird es sich bei der Entwicklung von KI hauptsächlich auf das RSC-Supercomputing-Zentrum verlassen.

3. Ein neuer Meilenstein im KI-Zeichnen – DragGAN verwirklicht alle Vorstellungen

DragGAN bricht vollständig die exklusive Position des Diffusionsmodells im Bereich des KI-Zeichnens. Das Papier mit dem Titel „Drag Your GAN“ hat den KI-Zeichnungskreis zum Leuchten gebracht. Das Papier wurde gemeinsam von Wissenschaftlern des MPII, des MIT, der University of Pennsylvania, Google und anderen Institutionen veröffentlicht und von SIGGRAPH2023 angenommen.

Dieses Modell kann fast alle Anforderungen an die Fotobearbeitung erfüllen. Es kann die Form, Details und sogar die Richtung und Anordnung von Objekten ändern. Es kann als Photoshop auf Atombombenebene bezeichnet werden.

AI一周见闻：马化腾表示AI是百年一遇的机会，OpenAI用iOS锁定用户粘性，具身智能让AI感知真实世界 | 见智研究

Benutzer müssen lediglich einige Arbeitspunkte (rote Punkte) und Zielpunkte (blaue Punkte) auf dem Foto festlegen und dann per Drag & Drop ein neues Bild erstellen.

Jizhi Research glaubt, dass: Das Aufkommen von DragGAN zeigt, dass das maschinelle Training beim Bildlernen ein neues Niveau erreicht hat. Es ist erwähnenswert, dass DragGAN über leistungsfähigere Generalisierungsfähigkeiten verfügt und Bilder erstellen kann, die über die Trainingsdaten hinausgehen. Beispielsweise wurde die Form des Löwenmauls vollständig geändert, und nicht die ursprünglich angenommene Änderung . Diagrammfunktion.

AI一周见闻：马化腾表示AI是百年一遇的机会，OpenAI用iOS锁定用户粘性，具身智能让AI感知真实世界 | 见智研究

Im Vergleich zu früheren Methoden ist DragGAN nicht auf Modellierung oder Hilfsnetzwerke in bestimmten Bereichen angewiesen, sondern verwendet ein allgemeines Framework, verwendet GAN zur Identifizierung der Bildqualität und verwendet Punktverfolgung, um die Bildverformungsfunktion zu vervollständigen. Mit dieser leistungsstarken Funktion werden Videofilmer und Fotoretuscheure viel Spaß haben.

4. Verkörperte Intelligenz schafft KI-aktive Wahrnehmung, die nächste Welle der künstlichen Intelligenz.

Auf der ITF World 2023 Semiconductor Conference machte NVIDIA-CEO Jensen Huang eine weitere mutige Aussage, dass die nächste Welle der künstlichen Intelligenz verkörperte Intelligenz sein wird.

Jianzhi Research glaubt, dass: Der Wert der KI durch verkörperte Intelligenz weitaus größer ist als der von humanoiden Robotern. Das größte Merkmal der verkörperten Intelligenz ist die Fähigkeit, die physische Welt autonom aus der Perspektive des Protagonisten wahrzunehmen, anhand eines anthropomorphen Denkpfads zu lernen und so das von Menschen erwartete Verhaltensfeedback zu geben, anstatt passiv auf die Eingabe von Daten zu warten. Unter den fünf wichtigsten menschlichen Sinnen macht das Sehen mehr als 80 % der erfassten Informationen aus, und es ist auch für Maschinen sehr wichtig, die menschliche Sprache zu verstehen. Daher sind maschinelles Sehen und multimodale große Modelle die beiden Schlüssel zur Erschließung des maschinellen Selbst -Wahrnehmungslernen. Einzelheiten finden Sie unter Was ist NVIDIAs beliebte „verkörperte Intelligenz“? Der Wert von KI ist weitaus größer als der von Robotern.

5. Yuncong Technology veröffentlicht das große Modell von Congrong

Yuncong Technology, ein Unternehmen für Plattformen für künstliche Intelligenz, veröffentlichte das Congrong-Modell in Guangzhou und demonstrierte seine grundlegenden Fähigkeiten wie Dialog, Programmieren, Lesen und Beantworten echter Fragen in der Aufnahmeprüfung für die High School. Das große Modell befindet sich derzeit in der internen Beta-Phase. Dieses Modell ist ein großes vinzentinisches Modell und kann die Funktionen multimodaler großer Modelle wie vinzentinischer Diagramme noch nicht erfüllen.

Leistung im offenen Test: Die Reaktionsgeschwindigkeit ist schnell, aber die Inhaltsgenauigkeit muss verbessert werden. Darüber hinaus ist die Aktualität der Datenbank relativ gering, sie ist immer noch 21 Jahre alt. Darüber hinaus hat die Leistung des Modells in den Bereichen Mathematik und Denkvermögen noch nicht den Erwartungen entsprochen.

Jianzhi Research glaubt: Der Vorteil inländischer Großmodelle besteht darin, dass der Reichtum des chinesischen Korpus viel höher ist als der fortgeschrittener Großmodelle im Ausland. Obwohl es schwierig ist, mit ChatGPT in Bezug auf die Führung mitzuhalten, wird das Congrong Big Model in Zukunft die Führung bei der Anwendungsentwicklung vertikaler Branchen übernehmen, insbesondere bei der Entwicklung exklusiver Branchenmodelle in den Bereichen Finanzen, Regierungsangelegenheiten, und Herstellung und engagiert sich für die Kommerzialisierung von Modellen.

AI Black Technology

1. Sie können Disneys „Beyond the Horizon“ zu Hause erleben

Der ausländische Entwickler Nils Bakker hat mithilfe von ChatGPT und der Unreal Engine 5.1 + ChatGPT + Google Maps 3D Tiles erfolgreich ein „Virtual Space Transmission“-System erstellt. Benutzer müssen nur den Standort eingeben und das System führt Sie aus der Ego-Perspektive Mit Blick auf die wunderschöne Landschaft rund um die Welt ist dies die Zeit, die Freude zu erleben, zu Hause über den Horizont zu fliegen.

AI一周见闻：马化腾表示AI是百年一遇的机会，OpenAI用iOS锁定用户粘性，具身智能让AI感知真实世界 | 见智研究

Kombinieren Sie die APIs von Google 3D Tiles und ChatGPT und nutzen Sie dann die Funktionen der Unreal Engine, um Benutzern ein immersives Erlebnis der Raumfahrt zu ermöglichen. Jetzt können Sie den Charme des Fliegens über den Horizont spüren, während Sie zu Hause liegen.

Jianzhi Research glaubt: KI befindet sich noch im Anfangsstadium der Branchenentwicklung, Vorstellungskraft und Kreativität sind sehr wichtig und Branchenpfade und Geschäftsmöglichkeiten werden nach dem Regen wie Pilze aus dem Boden schießen.

2. Der Cyborg „Spider-Man“ ist da

Das japanische Robotikunternehmen Jizai Arms hat ein spinnenähnliches Roboter-Gliedmaßensystem entwickelt, das Menschen frei steuerbare Roboterarme ermöglicht. Das System besteht aus sechs Armen, die vom Benutzer, der sie trägt, gesteuert werden können. Es können bis zu vier Roboterarme installiert werden. Bemerkenswert ist, dass dieses System die Art und Weise der Mensch-Maschine-Interaktion verändert.

Diese Prothese ist sehr flexibel und kann verschiedene Aufgaben übernehmen, von Lagerhallen bis hin zu Operationssälen im Krankenhaus. Sie kann dazu beitragen, die Lebensqualität behinderter Menschen in Zukunft zu verbessern.

Jianzhi Research glaubt, dass: Die „Fusion“ von Roboterarmen und realen Menschen den Vorstellungsraum der Mensch-Maschine-Integration öffnet und die Obergrenze der kognitiven Entwicklung von Robotern durch den Menschen neu definiert .

Was Sie nächste Woche sehen sollten

Wir freuen uns auf das erste Open-Source-Großmodell von OpenAI. Kann es Metas Status als Open-Source-König neu schreiben?

Das obige ist der detaillierte Inhalt vonAI Weekly News: Ma Huateng sagte, dass KI eine einmalige Chance sei, OpenAI iOS nutzt, um die Benutzerbindung zu sichern, und verkörperte Intelligenz es KI ermöglicht, die reale Welt wahrzunehmen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!