


Yancore Digital veröffentlicht ein groß angelegtes Nicht-Attention-Mechanismusmodell, das die Offline-Bereitstellung auf der Geräteseite unterstützt
Am 24. Januar startete Shanghai Yanxinshuzhi Artificial Intelligence Technology Co., Ltd. ein großes allgemeines natürliches Sprachmodell ohne Aufmerksamkeitsmechanismus – das Yan-Modell. Laut der Pressekonferenz von Yancore Digital Intelligence verwendet das Yan-Modell eine neue selbst entwickelte „Yan-Architektur“, um die Transformer-Architektur zu ersetzen. Im Vergleich zur Transformer-Architektur verfügt die Yan-Architektur über eine um das Dreifache erhöhte Speicherkapazität und eine um das Siebenfache erhöhte Geschwindigkeit Zeiten bei gleichzeitiger Verbesserung des Inferenzdurchsatzes um das Fünffache. Liu Fanping, CEO von Yancore Digital Intelligence, glaubt, dass die hohe Rechenleistung und die hohen Kosten von Transformer, das für seine große Reichweite in der Praxis bekannt ist, viele kleine und mittlere Unternehmen entmutigt haben. Die Komplexität seiner internen Architektur macht es schwierig, den Entscheidungsprozess zu erklären; die Schwierigkeit, lange Sequenzen zu verarbeiten, und das Problem unkontrollierbarer Halluzinationen schränken auch die breite Anwendung großer Modelle in bestimmten Schlüsselbereichen und speziellen Szenarien ein. Mit der Popularisierung von Cloud Computing und Edge Computing wächst die Nachfrage der Branche nach groß angelegten KI-Modellen mit hoher Leistung und geringem Energieverbrauch.
„Weltweit haben viele herausragende Forscher versucht, die übermäßige Abhängigkeit von der Transformer-Architektur grundlegend zu lösen und nach besseren Möglichkeiten zu suchen, Transformer zu ersetzen. Sogar Llion Jones, einer der Autoren des Transformer-Artikels, untersucht ebenfalls „Möglichkeiten nach Transformer“. versucht, eine von der Natur inspirierte intelligente Methode zu verwenden, die auf evolutionären Prinzipien basiert, um eine Neudefinition des KI-Frameworks aus verschiedenen Blickwinkeln zu erstellen des Yan-Architekturmodells sind 7-mal bzw. 5-mal so groß wie die der Transformer-Architektur, und die Speicherkapazität ist um das Dreifache verbessert. Das Design der Yan-Architektur sorgt dafür, dass die räumliche Komplexität des Yan-Modells während der Inferenz konstant bleibt. Daher schneidet das Yan-Modell auch bei den langen Sequenzproblemen des Transformers gut ab. Vergleichsdaten zeigen, dass auf einer einzelnen 4090 24G-Grafikkarte das Transformer-Modell unter unzureichendem Videospeicher leidet, wenn die Länge des Modellausgabetokens 2600 überschreitet, während die Videospeichernutzung des Yan-Modells immer stabil bei etwa 14G liegt Ermöglicht theoretisch die Inferenz unendlicher Länge.
Darüber hinaus entwickelte das Forschungsteam eine sinnvolle Korrelationscharakteristikfunktion und einen Speicheroperator in Kombination mit linearen Berechnungsmethoden, um die Komplexität der internen Struktur des Modells zu reduzieren. Das Yan-Modell unter der neuen Architektur wird die „uninterpretierbare Blackbox“ der natürlichen Sprachverarbeitung in der Vergangenheit öffnen, die Transparenz und Erklärbarkeit des Entscheidungsprozesses vollständig erforschen und so die weit verbreitete Verwendung großer Modelle in Hochrisikobereichen erleichtern wie medizinische Versorgung, Finanzen und Recht.
Das obige ist der detaillierte Inhalt vonYancore Digital veröffentlicht ein groß angelegtes Nicht-Attention-Mechanismusmodell, das die Offline-Bereitstellung auf der Geräteseite unterstützt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Diffusion kann nicht nur besser imitieren, sondern auch „erschaffen“. Das Diffusionsmodell (DiffusionModel) ist ein Bilderzeugungsmodell. Im Vergleich zu bekannten Algorithmen wie GAN und VAE im Bereich der KI verfolgt das Diffusionsmodell einen anderen Ansatz. Seine Hauptidee besteht darin, dem Bild zunächst Rauschen hinzuzufügen und es dann schrittweise zu entrauschen. Das Entrauschen und Wiederherstellen des Originalbilds ist der Kernbestandteil des Algorithmus. Der endgültige Algorithmus ist in der Lage, aus einem zufälligen verrauschten Bild ein Bild zu erzeugen. In den letzten Jahren hat das phänomenale Wachstum der generativen KI viele spannende Anwendungen in der Text-zu-Bild-Generierung, Videogenerierung und mehr ermöglicht. Das Grundprinzip dieser generativen Werkzeuge ist das Konzept der Diffusion, ein spezieller Sampling-Mechanismus, der die Einschränkungen bisheriger Methoden überwindet.

Kimi: In nur einem Satz, in nur zehn Sekunden ist ein PPT fertig. PPT ist so nervig! Um ein Meeting abzuhalten, benötigen Sie einen PPT; um einen wöchentlichen Bericht zu schreiben, müssen Sie einen PPT vorlegen, auch wenn Sie jemanden des Betrugs beschuldigen PPT. Das College ähnelt eher dem Studium eines PPT-Hauptfachs. Man schaut sich PPT im Unterricht an und macht PPT nach dem Unterricht. Als Dennis Austin vor 37 Jahren PPT erfand, hatte er vielleicht nicht damit gerechnet, dass PPT eines Tages so weit verbreitet sein würde. Wenn wir über unsere harte Erfahrung bei der Erstellung von PPT sprechen, treiben uns Tränen in die Augen. „Es dauerte drei Monate, ein PPT mit mehr als 20 Seiten zu erstellen, und ich habe es Dutzende Male überarbeitet. Als ich das PPT sah, musste ich mich übergeben.“ war PPT.“ Wenn Sie ein spontanes Meeting haben, sollten Sie es tun

Am frühen Morgen des 20. Juni (Pekinger Zeit) gab CVPR2024, die wichtigste internationale Computer-Vision-Konferenz in Seattle, offiziell die besten Beiträge und andere Auszeichnungen bekannt. In diesem Jahr wurden insgesamt 10 Arbeiten ausgezeichnet, darunter zwei beste Arbeiten und zwei beste studentische Arbeiten. Darüber hinaus gab es zwei Nominierungen für die beste Arbeit und vier Nominierungen für die beste studentische Arbeit. Die Top-Konferenz im Bereich Computer Vision (CV) ist die CVPR, die jedes Jahr zahlreiche Forschungseinrichtungen und Universitäten anzieht. Laut Statistik wurden in diesem Jahr insgesamt 11.532 Arbeiten eingereicht, von denen 2.719 angenommen wurden, was einer Annahmequote von 23,6 % entspricht. Laut der statistischen Analyse der CVPR2024-Daten des Georgia Institute of Technology befassen sich die meisten Arbeiten aus Sicht der Forschungsthemen mit der Bild- und Videosynthese und -generierung (Imageandvideosyn

Als weit verbreitete Programmiersprache ist die C-Sprache eine der grundlegenden Sprachen, die für diejenigen erlernt werden müssen, die sich mit Computerprogrammierung befassen möchten. Für Anfänger kann das Erlernen einer neuen Programmiersprache jedoch etwas schwierig sein, insbesondere aufgrund des Mangels an entsprechenden Lernwerkzeugen und Lehrmaterialien. In diesem Artikel werde ich fünf Programmiersoftware vorstellen, die Anfängern den Einstieg in die C-Sprache erleichtert und Ihnen einen schnellen Einstieg ermöglicht. Die erste Programmiersoftware war Code::Blocks. Code::Blocks ist eine kostenlose integrierte Open-Source-Entwicklungsumgebung (IDE) für

Schnellstart mit PyCharm Community Edition: Detailliertes Installations-Tutorial, vollständige Analyse Einführung: PyCharm ist eine leistungsstarke integrierte Python-Entwicklungsumgebung (IDE), die einen umfassenden Satz an Tools bereitstellt, mit denen Entwickler Python-Code effizienter schreiben können. In diesem Artikel wird die Installation der PyCharm Community Edition im Detail vorgestellt und spezifische Codebeispiele bereitgestellt, um Anfängern den schnellen Einstieg zu erleichtern. Schritt 1: PyCharm Community Edition herunterladen und installieren Um PyCharm verwenden zu können, müssen Sie es zunächst von der offiziellen Website herunterladen

Titel: Ein Muss für technische Anfänger: Schwierigkeitsanalyse der C-Sprache und Python, die spezifische Codebeispiele erfordert. Im heutigen digitalen Zeitalter ist Programmiertechnologie zu einer immer wichtigeren Fähigkeit geworden. Ob Sie in Bereichen wie Softwareentwicklung, Datenanalyse, künstliche Intelligenz arbeiten oder einfach nur aus Interesse Programmieren lernen möchten, die Wahl einer geeigneten Programmiersprache ist der erste Schritt. Unter vielen Programmiersprachen sind C-Sprache und Python zwei weit verbreitete Programmiersprachen, jede mit ihren eigenen Merkmalen. In diesem Artikel werden die Schwierigkeitsgrade der C-Sprache und von Python analysiert

Wir wissen, dass LLM auf großen Computerclustern unter Verwendung umfangreicher Daten trainiert wird. Auf dieser Website wurden viele Methoden und Technologien vorgestellt, die den LLM-Trainingsprozess unterstützen und verbessern. Was wir heute teilen möchten, ist ein Artikel, der tief in die zugrunde liegende Technologie eintaucht und vorstellt, wie man einen Haufen „Bare-Metals“ ohne Betriebssystem in einen Computercluster für das LLM-Training verwandelt. Dieser Artikel stammt von Imbue, einem KI-Startup, das allgemeine Intelligenz durch das Verständnis der Denkweise von Maschinen erreichen möchte. Natürlich ist es kein einfacher Prozess, einen Haufen „Bare Metal“ ohne Betriebssystem in einen Computercluster für das Training von LLM zu verwandeln, aber Imbue hat schließlich erfolgreich ein LLM mit 70 Milliarden Parametern trainiert der Prozess akkumuliert

Herausgeber des Machine Power Report: Yang Wen Die Welle der künstlichen Intelligenz, repräsentiert durch große Modelle und AIGC, hat unsere Lebens- und Arbeitsweise still und leise verändert, aber die meisten Menschen wissen immer noch nicht, wie sie sie nutzen sollen. Aus diesem Grund haben wir die Kolumne „KI im Einsatz“ ins Leben gerufen, um detailliert vorzustellen, wie KI durch intuitive, interessante und prägnante Anwendungsfälle für künstliche Intelligenz genutzt werden kann, und um das Denken aller anzuregen. Wir heißen Leser auch willkommen, innovative, praktische Anwendungsfälle einzureichen. Videolink: https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ Vor kurzem wurde der Lebens-Vlog eines allein lebenden Mädchens auf Xiaohongshu populär. Eine Animation im Illustrationsstil, gepaart mit ein paar heilenden Worten, kann in nur wenigen Tagen leicht erlernt werden.
