Inländische Großmodelle sind in eine langfristige Laufzeit eingetreten und verlagern sich von Parameter zuerst zu praktischer Priorität.
Am 7. September wurde auf der Tencent Global Digital Ecology Conference 2023 das Hunyuan-Großmodell von Tencent offiziell vorgestellt und angekündigt, dass es über Tencent Cloud für die Außenwelt zugänglich sein würde.
Tencent Hunyuan Large Model ist ein universelles großes Sprachmodell, das von Tencent Full Link selbst entwickelt wurde. Es verfügt über eine Parameterskala von über 100 Milliarden und einen vorab trainierten Korpus von über 2 Billionen Token. Es verfügt über starke chinesische Erstellungsfähigkeiten und komplexe Sprache. Logisches Denken in der Umgebung und zuverlässige Fähigkeit zur Aufgabenausführung.
Es ist erwähnenswert, dass das große Modell von Tencent Hunyuan ein großes Modell auf praktischer Ebene ist, das „aus der Praxis kommt und zur Praxis geht“. Mehr als 50 Tencent-Unternehmen und -Produkte, darunter Tencent Cloud, Tencent Advertising, Tencent Games, Tencent Financial Technology, Tencent Conference, Tencent Documents, WeChat Souyisou und QQ Browser, wurden zum Testen mit dem Tencent Hunyuan-Großmodell verbunden und haben erste Erfolge erzielt Ergebnisse.
Es wird davon ausgegangen, dass das große Hunyuan-Modell als Basis für den Tencent Cloud MaaS-Dienst dienen wird. Kunden können Hunyuan nicht nur direkt über die API aufrufen, sondern Hunyuan auch als Basismodell verwenden, um exklusive Anwendungen für verschiedene Industrieszenarien zu erstellen .
Tang Daosheng, Senior Executive Vice President der Tencent Group und CEO der Cloud and Smart Industry Group, sagte: „Mit der Technologie zur Generierung großer Modelle als Kern wird künstliche Intelligenz zu einer wichtigen treibenden Kraft für die nächste Runde.“ Digitale Entwicklung und bietet auch eine Lösung für Branchenprobleme. Große Modelle müssen auf Industrieszenarien basieren und mit Unternehmensdaten integriert werden, um den größten Wert zu erzielen. Laut Jiang Jie, Vizepräsident der Tencent Group, wurde das Tencent Hunyuan Large Model vom ersten Token an von Grund auf trainiert und beherrscht die selbstentwickelte Full-Link-Technologie von Modellalgorithmen über Frameworks für maschinelles Lernen bis hin zur KI-Infrastruktur. „Jiang Jie, Vizepräsident der Tencent-Gruppe“ Erzielung eines neuen Durchbruchs in der Fähigkeit, Chinesisch zu verstehen.
Derzeit ist der Einsatz großer Modelle in der Branche in Szenen noch begrenzt und konzentriert sich hauptsächlich auf Freizeitszenen mit hoher Fehlertoleranz und einfachen Aufgaben. Tencent hat eine Reihe von Selbstforschungsinnovationen auf Algorithmusebene durchgeführt, um die Modellzuverlässigkeit und -reife zu verbessern.
Als Reaktion auf das Problem, dass große Modelle anfällig für „Kauderwelsch“ sind, hat Tencent den Algorithmus und die Strategie vor dem Training optimiert und die Illusion großer Hunyuan-Modelle im Vergleich zu Mainstream-Open-Source um 30 bis 50 % reduziert Durch die Stärkung der Lernmethode wird das Erlernen von Fallenproblemen ermöglicht. Durch die Optimierung der Positionscodierung werden der Verarbeitungseffekt und die Leistung sehr langer Dokumente verbessert, um die Denkweise großer Modelle zu verbessern Treffen Sie Entscheidungen auf der Grundlage tatsächlicher Anwendungsszenarien wie Menschen.
Darüber hinaus hat Tencent auch sein eigenes Machine-Learning-Framework Angel entwickelt, das die Trainingsgeschwindigkeit um das 1-fache und die Inferenzgeschwindigkeit um das 1,3-fache im Vergleich zu den gängigen Frameworks der Branche erhöht. ? kann mehrere Gesprächsrunden im beruflichen Bereich reibungslos führen. Darüber hinaus können auch Inhalte wie literarische Kreationen, Textzusammenfassungen und Rollenspiele erstellt werden, um die Absichten der Benutzer vollständig zu verstehen und zeitnahe Antworten effizient und genau zu geben.
Im Standard-Compliance-Test der China Academy of Information and Communications Technology „Evaluation Methods for Large-scale Pre-Training Model Technology and Applications“ bewertete das Hunyuan-Großmodell insgesamt 66 Fähigkeitselemente, in „ „Modellentwicklung“ und „Modellfähigkeit“ „Die umfassende Bewertung in zwei wichtigen Bereichen hat die höchste aktuelle Bewertung erhalten. In den Mainstream-Bewertungssätzen MMLU, CEval und AGI-eval weist das Hunyuan-Großmodell hervorragende Leistungen auf, insbesondere in den chinesischen Naturwissenschaften, Fragen zur Hochschulaufnahmeprüfung, Mathematik und anderen Unterpunkten.
Liu Yuanchun, Präsident der Shanghai University of Finance and Economics, glaubt: „Mit Hilfe der umfassenden Selbstforschung wird China weiterhin Talente und Technologien im Zusammenhang mit großen Modellen ansammeln und nach und nach eine systematische Industriekette und Talentkette bilden.“ , Technologiekette und Innovationskette und schließlich die Schaffung eines chinesischen Wegs zur Entwicklung allgemeiner künstlicher Intelligenz, der uns dabei helfen wird, Durchbrüche bei der Innovation digitaler Technologien zu erzielen sagte: „Wir entwickeln große Modelle. Das Ziel besteht nicht darin, bei der Bewertung hohe Punktzahlen zu erzielen, sondern die Technologie auf tatsächliche Szenarien anzuwenden.“
Auf dieser Konferenz zeigte Jiang Jie Tencent-Konferenzen und Tencent-Dokumente. , Tencent Advertising und andere Unternehmen, die tatsächliche Anwendungssituation nach dem Zugriff auf das große Tencent Hunyuan-Modell.
Zum Beispiel hat Tencent Conference einen KI-Assistenten entwickelt, der auf dem großen Hunyuan-Modell basiert. Er benötigt nur einfache Anweisungen in natürlicher Sprache, um komplexe Aufgaben wie die Extraktion von Besprechungsinformationen und die Inhaltsanalyse durchzuführen, und kann auch intelligente Zusammenfassungsprotokolle erstellen nach dem Treffen. Tatsächlichen Messungen zufolge hat das Hunyuan-Großmodell in vielen Aspekten wie dem Verständnis von Anweisungen, Fragen und Antworten während Besprechungen, Besprechungszusammenfassungen und Besprechungsaufgaben eine hohe Benutzerakzeptanzrate erreicht.
Anwendung des Tencent Hunyuan Large Model in Tencent-Konferenzen
In Bezug auf die Dokumentenverarbeitung unterstützt das Tencent Hunyuan Large Model Dutzende von Texterstellungsszenarien, und die in Tencent Documents eingeführte intelligente Assistentenfunktion wurde eingeführt angewendet in. Gleichzeitig kann Hunyuan auch Texte im Standardformat mit einem Klick generieren, beherrscht Hunderte von Excel-Formeln, unterstützt Funktionen zur Generierung natürlicher Sprache und generiert Diagramme basierend auf Tabelleninhalten. Diese Funktionen befinden sich derzeit in der internen Testphase und werden es auch sein offen für Benutzer, wenn sie reif sind.
Im Werbegeschäftsszenario unterstützt das große Modell von Tencent Hunyuan die Erstellung intelligenter Werbematerialien, die sich an Branchen- und regionale Besonderheiten anpassen, die Bedürfnisse Tausender Menschen erfüllen und die natürliche Integration von Text und Bildern erreichen können und Videos. Darüber hinaus kann die Werbung für intelligente Einkaufsführer basierend auf den Fähigkeiten des großen Hunyuan-Modells Händlern dabei helfen, die Servicequalität und Effizienz in Szenarien wie Unternehmens-WeChat zu verbessern.
Anwendung des großen Tencent Hunyuan-Modells in der Tencent-Werbung
Es wird davon ausgegangen, dass Tencent Cloud im Juni dieses Jahres eine Model-as-a-Service-Lösung (MaaS) auf den Markt gebracht hat, die eine Abdeckung von Modellvorab-Modellen bietet. Schulungen, Branchendienstleistungen für große Modelle aus einer Hand, wie z. B. Modell-Feinabstimmung und intelligente Anwendungsentwicklung.
Vor kurzem wurde Tencent Cloud auch vollständig in mehr als 20 Mainstream-Modelle wie Llama 2 und Bloom integriert, die alle direkte Bereitstellungsaufrufe unterstützen. Kunden können ihre eigenen exklusiven Branchenmodelle basierend auf Hunyuan oder Open-Source-Modelle basierend auf tatsächlichen Anforderungen erstellen.Das obige ist der detaillierte Inhalt vonTencents selbst entwickeltes Hunyuan-Großmodell wird offiziell vorgestellt und ist über Tencent Cloud für die Außenwelt zugänglich. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!