


Das große Hunyuan-Modell von Tencent wurde offiziell vorgestellt und wir übernahmen die Führung bei der Erprobung seiner Produktivität
Vergangene Woche wurden die ersten inländischen Zulassungen für Großmodelle genehmigt und die Dienstleistungen wurden für die gesamte Gesellschaft geöffnet. Dies markiert, dass Großmodelle in eine neue Phase der Großmodellanwendung eingetreten sind. Unter den Unternehmen, die bereits Anwendungen veröffentlicht haben, scheinen einige Technologiegiganten noch keine Maßnahmen ergriffen zu haben
Am 7. September 2023 stellte Tencent das Hunyuan-Großmodell auf der Tencent Global Digital Ecology Conference offiziell vor und öffnete Tencent Cloud für die Außenwelt
Als großes Modell mit über 100 Milliarden Parametern verwendet Hunyuan mehr als 2 Billionen Token im Pre-Training-Korpus. Es stützt sich auf eine Reihe einzigartiger technischer Fähigkeiten, um starke chinesische Erstellungsfähigkeiten, logische Denkfähigkeiten in komplexen Kontexten und eine zuverlässige Aufgabenausführung zu erlangen Fähigkeiten.
Tencent Group Vice President Jiang Jie sagte: „Das große Modell von Tencent Hunyuan wird vom ersten Token an von Grund auf trainiert. Wir beherrschen die gesamte Kette vom Modellalgorithmus über das Framework für maschinelles Lernen bis hin zur KI-Infrastruktur. Road selbst entwickelte Technologie.“ . „
Öffnen Sie das große Modell, es geht um Produktivität.“
Was ist das Niveau dieses großen Modells, wenn es sich nicht um „neue Technologie“ handelt? Auf der Konferenz enthüllte Jiang Jie einige grundlegende Informationen, indem er direkt nach dem Hunyuan-Modell fragte. Sein Parametervolumen hat Hunderte von Milliarden erreicht, und die für das Training verwendeten Daten stammen aus dem Juli dieses Jahres. Darüber hinaus gab Tencent an, dass das Wissen über das große Modell jeden Monat aktualisiert wird. Zu den vor Ort angezeigten Inhalten gehören das große Modell-Applet Tencent Hunyuan, der KI-Assistent in Tencent-Dokumenten und die Funktionen der Tencent-Konferenz KI-AssistentDiese Seite ist die erste, die dies tut. Nachdem ich die Testqualifikation erhalten hatte, probierte ich zunächst einmal das WeChat-Applet aus.Als wir das Miniprogramm betraten, waren wir angenehm überrascht, dass der darin enthaltene Inhalt nicht geringer war als bei anderen großen Anwendungen. Hier können wir uns inspirieren lassen und sehen, welche Funktionen Hunyuan bieten kann
Von Produktivität, Leben, Unterhaltung bis hin zur Programmentwicklung kann man sagen, dass seine offenen Fähigkeiten sehr umfassend sind und der Identität von Hundert Milliarden entsprechen. Ebene Großmodell. Kann Hunyuan diese Aufgaben also wirklich effektiv erledigen?
Ich muss eine PPT vorbereiten. Ich habe mich für das Thema entschieden, weiß aber nicht, wo ich anfangen soll. Ich habe dem Hunyuan-Modell eine Frage gestellt, und es dauerte nur wenige Sekunden, bis die KI einen Überblick über sieben Teile gab, wobei jeder Teil auch die wichtigsten Aufschlüsselungspunkte enthielt. Geben Sie im September einen Artikel auf arXiv ein Der von Google eingereichte Zusammenfassungs- und Einführungsteil „RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback“ besteht aus mehreren langen Absätzen. Viele große Modelle unterstützen überhaupt nicht so viele Eingabeinhalte es ins Chinesische.
Wahrscheinlich bedeutet dies, dass künstliche Intelligenz die Rolle des Human Reinforcement Learning Feedback (RLHF) im groß angelegten Modelltraining ersetzen kann
Ein großes Modell, das das praktische Stadium erreicht hat, kann uns beim Schreiben von Code helfen. Jetzt geben wir der KI einen Code und lassen sie den Inhalt erklären, den sie nicht verstehen kann und der keine klaren Kommentare enthält:
Es erklärt ausführlich die Bedeutung der Zahlen im Quadratwurzel-Reziprok-Algorithmus (aber es versteht nicht (Lesen Sie die Kommentare gründlich durch). Vielleicht wird es nicht mehr lange dauern, bis wir ohne große Modelle keine Entwicklung mehr machen können.
Dann geben Sie den Befehl für natürliche Sprache ein, und die Generierungsfähigkeit des großen Modells kann Ihnen dabei helfen, den Langtext in Tencent-Dokumenten zusammenzufassen:
Es scheint beim Schreiben einer Arbeit sehr nützlich zu sein
Natürlich, wenn Sie geben ein Thema vor, es kann Text erstellen, und dann wählen Sie einen Teil des generierten Inhalts aus, und die KI kann ihn mehrmals verfeinern und bearbeiten. Nachdem Sie mit dem Schreiben fertig sind, können Sie es mit einem Klick übersetzen:
Darüber hinaus erfolgen die Tabellendatenberechnung und die Diagrammerstellung in einem Satz.
Diese Funktionen befinden sich derzeit in der internen Testphase und stehen Benutzern zur Verfügung, wenn sie ausgereift sind.
Bei Tencent-Meetings kann die Anwendung des Hunyuan-Großmodells dazu beitragen, dass Sie während des Meetings nicht mehr abgelenkt werden. Sie können den KI-Assistenten beispielsweise jederzeit fragen, was gerade gesagt wurde oder worum es bei dem Streit zwischen diesen beiden Personen ging. KI kann den Inhalt ruhig in ein paar kurzen Sätzen zusammenfassen und eins, zwei oder drei klar auflisten
Natürlich kann das Hunyuan-Großmodell nach dem Meeting auch den Meeting-Inhalt schneller und umfassender zusammenfassen und markieren -do items
hat mehr als 50 Unternehmen von Tencent abgedeckt
Jiang Jie fasste die drei Hauptmerkmale des Hunyuan-Modells zusammen: starke chinesische Kreativität, Fähigkeit zum logischen Denken in komplexen Kontexten und Zuverlässigkeit bei der Aufgabenausführung.
Derzeit sind viele große Modelle in der Branche noch nur begrenzt in Szenen einsetzbar. Das Hauptproblem besteht darin, dass sie eine hohe Fehlertoleranz aufweisen und nur für Gelegenheitsszenen mit einfachen Aufgaben geeignet sind. Tencent hat eine Reihe von Selbstforschungsinnovationen auf Algorithmusebene durchgeführt, um die Modellzuverlässigkeit und -reife zu verbessern.

Tencent Group-Vizepräsident Jiang Jie erschien auf der Veranstaltung
Angesichts des Problems, dass große Modelle anfällig für „Kauderwelsch“ sind, hat Tencent den Algorithmus und die Strategie vor dem Training optimiert, und zwar selbst -Entwickelte „Wahrheitserkennungs“-Technologie. Die „Illusion“ der großen Hunyuan-Modelle wird im Vergleich zu Mainstream-Open-Source-Großmodellen um 30-50 % reduziert.
„Der Ansatz der Branche besteht darin, Suchverbesserungen, Wissensdiagramme und andere „Plug-Ins“ bereitzustellen, um die Fähigkeit von Open-Book-Prüfungen mit großen Modellen zu verbessern. Diese Methode erhöht das Wissen über das Modell, es gibt jedoch viele Einschränkungen in der praktischen Anwendung „, sagte Jiang Jie. „In den frühen Entwicklungsstadien des Hunyuan-Großmodells haben wir über eine Methode nachgedacht, die überhaupt nicht auf externen Daten basiert, und viele Forschungsversuche durchgeführt. Die von uns gefundene Vortrainingsmethode hat das Problem der Halluzinationen weitgehend gelöst.“ "
Tencent verwendet auch Verstärkungslernen. Mit dieser Methode kann das Modell lernen, Trap-Probleme zu identifizieren, und durch die Optimierung der Positionscodierung werden die Wirkung und Leistung des Modells bei der Verarbeitung ultralanger Texte verbessert. In Bezug auf die Logik hat Tencent eine neue Strategie der Denkkette vorgeschlagen, die es großen Modellen ermöglicht, auf der Grundlage tatsächlicher Anwendungsszenarien zu argumentieren und Entscheidungen zu treffen. Sie verfügen über Textspeicherfähigkeiten und können fließend mehrere Gesprächsrunden in beruflichen Bereichen führen. Darüber hinaus können auch Inhalte wie literarische Kreationen, Textzusammenfassungen und Rollenspiele erstellt werden, um die Absichten der Benutzer vollständig zu verstehen und zeitnahe Antworten effizient und genau zu geben. Nur wenn eine solche Technologie implementiert wird, kann die Produktivität wirklich verbessert werden.

Im „Großformatigen Vortraining“. Modelltechnologie“ der China Academy of Information and Communications Technology Im Standardkonformitätstest „Bewertungsmethoden für Anwendungen und Anwendungen“ bewertete das Hunyuan-Großmodell insgesamt 66 Fähigkeitselemente und erzielte bei beiden die höchste Punktzahl in der umfassenden Bewertung Bereichen „Modellentwicklung“ und „Modellfähigkeit“. In den Mainstream-Bewertungssätzen MMLU, CEval und AGI-eval weist das große Hunyuan-Modell hervorragende Leistungen auf, insbesondere in den chinesischen Naturwissenschaften, Fragen zu Hochschulaufnahmeprüfungen und Mathematik.
Die Bedeutung des Baus großer Modelle liegt in industriellen Anwendungen. Es wird davon ausgegangen, dass mehr als 50 Unternehmen und Produkte innerhalb von Tencent auf das Tencent Hunyuan-Modell zugegriffen und es getestet haben, darunter Tencent Cloud, Tencent Advertising, Tencent Games, Tencent Financial Technology, Tencent Conference, Tencent Documents, WeChat Souyisou, QQ Browser usw. und erste Ergebnisse erzielt. Tencent-Programmierer haben begonnen, große Modelltools zu verwenden, um die Entwicklungseffizienz zu verbessern
Darüber hinaus hat Tencent auch sein eigenes Framework für maschinelles Lernen Angel entwickelt, um die Trainingsgeschwindigkeit des Modells zu verdoppeln und die Inferenzgeschwindigkeit im Vergleich zum Mainstream-Framework der Branche zu erhöhen. 1,3 Mal.
Auch die Infrastruktur für den Bau großer Modelle wurde nicht abgerissen. Tencent hat bereits erklärt, dass es Anfang dieses Jahres ein großes Rechenzentrum gebaut hat. Kürzlich haben die großen Modelle von MiniMax und Baichuan Intelligence die Rechenleistung von Tencent genutzt.
Tencent arbeitet außerdem intensiv daran, Branchendaten mit seinen eigenen Fähigkeiten zu kombinieren, indem es branchenspezifische Daten externer Kunden nutzt, um Probleme in bestimmten Branchen zu lösen, und sich in die reale Branche integriert, um die sozialen, wirtschaftlichen Vorteile und den Geschäftswert großer Unternehmen kontinuierlich zu fördern -maßstabsgetreue Modelle
„Öffentlichen Daten zufolge wurden in China 130 große Modelle veröffentlicht. Es gibt sowohl allgemeine Modelle als auch professionelle Feldmodelle. Als allgemeines Modell kann Hunyuan die meisten internen Geschäfte von Tencent unterstützen. Heute zeige ich mehrere tief miteinander verbundene Modelle. Das Geschäft.“ hat eine große Anzahl von Benutzern und große Modelle wurden in unseren Kernbereichen intensiv eingesetzt“, sagte Jiang Jie. „Mein großes Modell dient erstens dem Unternehmen selbst und wird zweitens über Tencent Cloud für die Außenwelt geöffnet. Wenn es für Kunden geöffnet wird, wird Hunyuan Big Model als Basis für Tencent Cloud Model as a Service MaaS dienen.“ Kunden können die Hunyuan-API entweder direkt aufrufen oder Hunyuan als Basismodell verwenden, um exklusive Anwendungen für verschiedene Industrieszenarien zu erstellen.
Es ist ersichtlich, dass die Strategie von Tencent im Bereich der großen Modelle auf Stabilität ausgerichtet ist: Konzentrieren Sie sich darauf, ein solides Fundament zu legen und sich nicht zu beeilen, halbfertige Produkte zur Schau zu stellen. Und dieser Zug zeigte hervorragende Stärke.
Die Entwicklung großer Modelle ist immer noch im Gange, wie Jiang Jie sagte: „Es ist keine Übertreibung zu sagen, dass Tencent große Modelle voll und ganz angenommen hat. Unsere Fähigkeiten haben sich ständig weiterentwickelt und ich glaube, dass das Potenzial von AIGC unbegrenzt ist.“ . Wir sind bereits auf diesem Weg.“
Das obige ist der detaillierte Inhalt vonDas große Hunyuan-Modell von Tencent wurde offiziell vorgestellt und wir übernahmen die Führung bei der Erprobung seiner Produktivität. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Aber vielleicht kann er den alten Mann im Park nicht besiegen? Die Olympischen Spiele in Paris sind in vollem Gange und Tischtennis hat viel Aufmerksamkeit erregt. Gleichzeitig haben Roboter auch beim Tischtennisspielen neue Durchbrüche erzielt. Gerade hat DeepMind den ersten lernenden Roboteragenten vorgeschlagen, der das Niveau menschlicher Amateurspieler im Tischtennis-Wettkampf erreichen kann. Papieradresse: https://arxiv.org/pdf/2408.03906 Wie gut ist der DeepMind-Roboter beim Tischtennisspielen? Vermutlich auf Augenhöhe mit menschlichen Amateurspielern: Sowohl Vorhand als auch Rückhand: Der Gegner nutzt unterschiedliche Spielstile, und auch der Roboter hält aus: Aufschlagannahme mit unterschiedlichem Spin: Allerdings scheint die Intensität des Spiels nicht so intensiv zu sein wie Der alte Mann im Park. Für Roboter, Tischtennis

Am 21. August fand in Peking die Weltroboterkonferenz 2024 im großen Stil statt. Die Heimrobotermarke „Yuanluobot SenseRobot“ von SenseTime hat ihre gesamte Produktfamilie vorgestellt und kürzlich den Yuanluobot AI-Schachspielroboter – Chess Professional Edition (im Folgenden als „Yuanluobot SenseRobot“ bezeichnet) herausgebracht und ist damit der weltweit erste A-Schachroboter für heim. Als drittes schachspielendes Roboterprodukt von Yuanluobo hat der neue Guoxiang-Roboter eine Vielzahl spezieller technischer Verbesserungen und Innovationen in den Bereichen KI und Maschinenbau erfahren und erstmals die Fähigkeit erkannt, dreidimensionale Schachfiguren aufzunehmen B. durch mechanische Klauen an einem Heimroboter, und führen Sie Mensch-Maschine-Funktionen aus, z. B. Schach spielen, jeder spielt Schach, Überprüfung der Notation usw.

Der Schulstart steht vor der Tür und nicht nur die Schüler, die bald ins neue Semester starten, sollten auf sich selbst aufpassen, sondern auch die großen KI-Modelle. Vor einiger Zeit war Reddit voller Internetnutzer, die sich darüber beschwerten, dass Claude faul werde. „Sein Niveau ist stark gesunken, es kommt oft zu Pausen und sogar die Ausgabe wird sehr kurz. In der ersten Woche der Veröffentlichung konnte es ein komplettes 4-seitiges Dokument auf einmal übersetzen, aber jetzt kann es nicht einmal eine halbe Seite ausgeben.“ !

Auf der World Robot Conference in Peking ist die Präsentation humanoider Roboter zum absoluten Mittelpunkt der Szene geworden. Am Stand von Stardust Intelligent führte der KI-Roboterassistent S1 drei große Darbietungen mit Hackbrett, Kampfkunst und Kalligraphie auf Ein Ausstellungsbereich, der sowohl Literatur als auch Kampfkunst umfasst, zog eine große Anzahl von Fachpublikum und Medien an. Durch das elegante Spiel auf den elastischen Saiten demonstriert der S1 eine feine Bedienung und absolute Kontrolle mit Geschwindigkeit, Kraft und Präzision. CCTV News führte einen Sonderbericht über das Nachahmungslernen und die intelligente Steuerung hinter „Kalligraphie“ durch. Firmengründer Lai Jie erklärte, dass hinter den seidenweichen Bewegungen die Hardware-Seite die beste Kraftkontrolle und die menschenähnlichsten Körperindikatoren (Geschwindigkeit, Belastung) anstrebt. usw.), aber auf der KI-Seite werden die realen Bewegungsdaten von Menschen gesammelt, sodass der Roboter stärker werden kann, wenn er auf eine schwierige Situation stößt, und lernen kann, sich schnell weiterzuentwickeln. Und agil

Bei dieser ACL-Konferenz haben die Teilnehmer viel gewonnen. Die sechstägige ACL2024 findet in Bangkok, Thailand, statt. ACL ist die führende internationale Konferenz im Bereich Computerlinguistik und Verarbeitung natürlicher Sprache. Sie wird von der International Association for Computational Linguistics organisiert und findet jährlich statt. ACL steht seit jeher an erster Stelle, wenn es um akademischen Einfluss im Bereich NLP geht, und ist außerdem eine von der CCF-A empfohlene Konferenz. Die diesjährige ACL-Konferenz ist die 62. und hat mehr als 400 innovative Arbeiten im Bereich NLP eingereicht. Gestern Nachmittag gab die Konferenz den besten Vortrag und weitere Auszeichnungen bekannt. Diesmal gibt es 7 Best Paper Awards (zwei davon unveröffentlicht), 1 Best Theme Paper Award und 35 Outstanding Paper Awards. Die Konferenz verlieh außerdem drei Resource Paper Awards (ResourceAward) und einen Social Impact Award (

Laut Nachrichten dieser Website vom 7. August wurde Tencents Campus-Rekrutierung für 2025 offiziell gestartet. Nach der Rekrutierung von Praktikanten im Jahr 2024 und dem KI-Sonderprojekt „Qingyun-Projekt“ zur Rekrutierung von Großmodellen gab es erneut ein Signal zur „Erweiterung der Einschreibung“: Nicht nur, dass der Rekrutierungsumfang größer ist als in den letzten zwei Jahren. Es gab ein enormes Wachstum, und auch die Abschlusszeitspanne für Menschen wurde weiter ausgeweitet. Berichten zufolge wird die Campus-Rekrutierung von Tencent im Jahr 2025 mehr als 70 Stellen in fünf Hauptkategorien eröffnen: Technologie, Produkt, Markt, Design und Funktion. In diesem Jahr wird es viele Änderungen bei der Campus-Rekrutierung von Tencent geben. Die Abschlusszeitspanne für die Campus-Rekrutierung wird von einem Jahr auf zwei Jahre erweitert. Studierende, die zwischen Januar 2024 und Dezember 2025 ihren Abschluss machen (das Abschlusszeugnis gilt in Festlandchina, das Abschlusszeugnis gilt in Hongkong, Macau, Taiwan und Übersee), können sich über die offizielle Website von Tencent Recruitment und „Tencent“ bewerben

Heute Nachmittag begrüßte Hongmeng Zhixing offiziell neue Marken und neue Autos. Am 6. August veranstaltete Huawei die Hongmeng Smart Xingxing S9 und die Huawei-Konferenz zur Einführung neuer Produkte mit umfassendem Szenario und brachte die Panorama-Smart-Flaggschiff-Limousine Xiangjie S9, das neue M7Pro und Huawei novaFlip, MatePad Pro 12,2 Zoll, das neue MatePad Air und Huawei Bisheng mit Mit vielen neuen Smart-Produkten für alle Szenarien, darunter die Laserdrucker der X1-Serie, FreeBuds6i, WATCHFIT3 und der Smart Screen S5Pro, von Smart Travel über Smart Office bis hin zu Smart Wear baut Huawei weiterhin ein Smart-Ökosystem für alle Szenarien auf, um Verbrauchern ein Smart-Erlebnis zu bieten Internet von allem. Hongmeng Zhixing: Huawei arbeitet mit chinesischen Partnern aus der Automobilindustrie zusammen, um die Modernisierung der Smart-Car-Industrie voranzutreiben

Tiefe Integration von Vision und Roboterlernen. Wenn zwei Roboterhände reibungslos zusammenarbeiten, um Kleidung zu falten, Tee einzuschenken und Schuhe zu packen, gepaart mit dem humanoiden 1X-Roboter NEO, der in letzter Zeit für Schlagzeilen gesorgt hat, haben Sie vielleicht das Gefühl: Wir scheinen in das Zeitalter der Roboter einzutreten. Tatsächlich sind diese seidigen Bewegungen das Produkt fortschrittlicher Robotertechnologie + exquisitem Rahmendesign + multimodaler großer Modelle. Wir wissen, dass nützliche Roboter oft komplexe und exquisite Interaktionen mit der Umgebung erfordern und die Umgebung als Einschränkungen im räumlichen und zeitlichen Bereich dargestellt werden kann. Wenn Sie beispielsweise möchten, dass ein Roboter Tee einschenkt, muss der Roboter zunächst den Griff der Teekanne ergreifen und sie aufrecht halten, ohne den Tee zu verschütten, und ihn dann sanft bewegen, bis die Öffnung der Kanne mit der Öffnung der Tasse übereinstimmt , und neigen Sie dann die Teekanne in einem bestimmten Winkel. Das
