Inhaltsverzeichnis

Ein praktischer Test des Tongyi-Hörverständnisses

Große Modellöffnung, Benutzer profitieren davon

Heim

Das neue große Modell von Alibaba Cloud ist erschienen! Das KI-Artefakt „Tongyi Listening' befindet sich in der öffentlichen Beta: Lange Videos können in einer Sekunde zusammengefasst werden, außerdem können automatisch Notizen gemacht und Untertitel erstellt werden

Das neue große Modell von Alibaba Cloud ist erschienen! Das KI-Artefakt „Tongyi Listening' befindet sich in der öffentlichen Beta: Lange Videos können in einer Sekunde zusammengefasst werden, außerdem können automatisch Notizen gemacht und Untertitel erstellt werden

王林

Jun 03, 2023 pm 05:23 PM

阿里云智能大模型

Ein weiteres praktisches Tool für Gruppentreffen mit Zugriff auf große Modellfunktionen, jetzt für die kostenlose öffentliche Beta verfügbar!

Das große Vorbild dahinter ist Alibabas Tongyi Qianwen. Warum es angeblich ein magisches Werkzeug für Gruppentreffen ist –

Sehen Sie, das ist mein Lehrer an Station B, Herr Li Mu, der Schüler dazu bringt, eine große Modellarbeit intensiv zu lesen.

Leider drängte mich in diesem Moment der Chef, die Steine schnell zu bewegen. Mir blieb nichts anderes übrig, als lautlos meine Kopfhörer abzunehmen, auf das Plug-in „Tongyi Listening“ zu klicken und dann die Seite zu wechseln.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Wissen Sie was? Obwohl ich nicht beim „Gruppentreffen“ dabei war, hat mir Tingwu dabei geholfen, den Inhalt des Gruppentreffens vollständig aufzuzeichnen.

Es hat mir sogar geholfen, Schlüsselwörter, Volltextzusammenfassungen und Lernpunkte mit einem Klick zusammenzufassen.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Um es einfach auszudrücken: Dieses „Allgemeine Bedeutungshören“, das gerade mit der Großmodellfunktion verbunden wurde, ist eine Großmodellversion eines KI-Assistenten im Arbeitsstudium, der sich auf Audio- und Videoinhalte konzentriert.

Im Gegensatz zu früheren Tools zur Transkription von Aufnahmen können damit nicht nur Aufnahmen und Videos in Text umgewandelt werden. Es kann den gesamten Text mit einem Klick zusammenfassen und auch die Meinungen verschiedener Sprecher zusammenfassen:

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Es kann sogar als Echtzeit-Untertitelübersetzung verwendet werden:

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Es scheint, dass dies nicht nur der Fall ist Nützlich für die Abhaltung von Gruppentreffen, aber auch für regelmäßige Qubits, die mit vielen Aufzeichnungen, langem Aufbleiben und verschiedenen ausländischen Konferenzen zu kämpfen haben, ist es wirklich ein neues Artefakt für die tägliche Arbeit.

Wir haben schnell einen ausführlichen Test durchgeführt.

Ein praktischer Test des Tongyi-Hörverständnisses

Der grundlegendste und wichtigste Aspekt beim Organisieren und Analysieren von Audioinhalten ist die Genauigkeit der Transkription.

In Runde 1 laden wir zunächst ein etwa 10-minütiges chinesisches Video hoch, um zu sehen, wie Tingwu im Vergleich zu ähnlichen Tools hinsichtlich der Genauigkeit abschneidet.

Grundsätzlich verarbeitet die KI dieses mittellange Audio- und Videomaterial sehr schnell und kann in weniger als 2 Minuten transkribiert werden.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Werfen wir zunächst einen Blick auf Tingwus Leistung:

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

In diesem etwa 200 Wörter langen Absatz machte Tingwu nur zwei Fehler: stark → Wand, beides gut → genau richtig. Physikalische Begriffe wie Atomkern, elektrische Ladung und Abstoßung können durch Zuhören verstanden werden.

Wir haben es auch an Feishu Miaoji mit dem gleichen Video getestet. Das Grundproblem ist nicht groß, aber im Vergleich zum Zuhören von Wu machte Feishu zwei weitere Fehler. Eines der „Atome“ wurde als „Garten“ geschrieben und „Abstoßung“ wurde als „Macht“ gelesen.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Interessant ist, dass Feishu auch die Fehler, die Hengwu gemacht hat, einzeln reproduziert hat. Es scheint, dass dieser Topf von einem bestimmten Meister getragen werden muss, der in Qubit (manueller Hundekopf) spricht und Wörter schluckt.

Als iFlytek es hörte, konnte es das „genau Richtige“ unterscheiden, das die ersten beiden Teilnehmer nicht erkannten. Aber iFlytek übersetzte im Grunde alles „Wand“ in „stark“ und es entstand die magische Kombination aus „starken Zuckerkörnern“. Darüber hinaus missverstand von den drei Teilnehmern nur iFlytek „elektromagnetische Kraft“ als „elektronische Kraft“.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Im Allgemeinen ist die Erkennung von Chinesisch für diese KI-Tools nicht schwierig. Wie werden sie angesichts englischer Materialien abschneiden?

Wir haben ein aktuelles Interview mit Musk über seine früheren Streitigkeiten mit OpenAI hochgeladen.

Werfen wir zunächst einen Blick auf die Ergebnisse von Tingwu. In Musks Antworten identifizierte Hua Wu mit Ausnahme des Namens von Larry Page im Grunde alle anderen korrekt.

Erwähnenswert ist, dass Tingwu die Ergebnisse der englischen Transliteration direkt ins Chinesische übersetzen und zweisprachige Vergleiche anzeigen kann. Die Übersetzungsqualität ist ebenfalls recht gut.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Feishu Miaoji hat den Namen von Larry Page erfolgreich gehört, aber wie beim Zuhören war Musks allgemeine Sprechgeschwindigkeit langsamer. Es ist schnell und hat einige umgangssprachliche Ausdrücke, mit einigen Moll Fehler, wie zum Beispiel „Bleib in seinem Haus“ statt „Sag dieses Haus“.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

iFlytek hat hier gehört, dass die Namen und Aussprachedetails gut gehandhabt werden, aber es gibt auch Fälle, in denen man sich durch Musks umgangssprachliche Ausdrücke in die Irre führen lässt. „bis weit in den Abend hinein“ gilt als „Sehnsucht nach dem Abend“.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Es scheint, dass KI-Tools in Bezug auf die grundlegende Fähigkeit der Spracherkennung eine sehr hohe Genauigkeitsrate erreicht haben, trotz teilweise extrem hoher Effizienz Kleine Probleme überwogen die Mängel.

Dann erhöhen wir den Schwierigkeitsgrad auf Runde 2, um ihre Fähigkeit zu testen, etwa einstündige Videos zusammenzufassen.

Das Testvideo ist eine 40-minütige Diskussionsrunde zum Thema neue Möglichkeiten für AIGC in China. Insgesamt nahmen 5 Personen an der Diskussionsrunde teil.

Auf der Hörseite dauerte es vom Abschluss der Transkription bis zur KI, Schlüsselwörter zu extrahieren und eine vollständige Textzusammenfassung bereitzustellen, insgesamt weniger als 5 Minuten.

Das Ergebnis ist das von Tante Jiang:

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

gab nicht nur Schlüsselwörter Auch der Inhalt der Roundtable-Diskussion ist gut zusammengefasst und die Kernpunkte des Videos sind ebenfalls unterteilt.

Wenn ich die von menschlichen Redakteuren ausgelesenen Themenpunkte vergleiche, rieche ich einen Hauch von Krise ...

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Es ist erwähnenswert dass zum Anhören der Reden verschiedener Gäste entsprechende Zusammenfassungen ihrer Reden gegeben werden können.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Die gleiche Frage wurde Feishu Miaoji gestellt. Derzeit kann Feishu Miaoji in Bezug auf die Inhaltszusammenfassung nur Schlüsselwörter bereitstellen.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Besprechungsprotokolle müssen manuell im transkribierten Text markiert werden.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

iFlytek hat gehört, dass sie intern ein Produkt testen, das auf dem kognitiven Großmodell Spark basiert, das den Inhalt von Dateien analysieren kann, aber das Ausfüllen einer Datei erfordert Bewerbung und Warteschlangen. (Freunde, die für interne Tests qualifiziert sind, können gerne ihre Erfahrungen teilen~)

Im Basis-iFlytek gibt es derzeit keine ähnliche Zusammenfassungsfunktion.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Es scheint, dass diese Testrunde:

Das Überraschendste an Tongyi Tingwu in diesem aktuellen Test ist jedoch tatsächlich ein „kleines“ Design:

Chrome-Plug-in-Funktion.

Ganz gleich, ob Sie englische Videos ansehen, Live-Übertragungen ansehen oder an Besprechungen im Unterricht teilnehmen, Sie können eine Transkription und Übersetzung von Audio und Video in Echtzeit erreichen, indem Sie auf das Listening-Plug-in klicken.

Wie eingangs gezeigt, kann es als Echtzeit-Untertitel mit geringer Latenz, schneller Übersetzung und zweisprachiger Vergleichsfunktion verwendet werden. Gleichzeitig können der aufgezeichnete und transkribierte Text mit einem Klick für die spätere Verwendung gespeichert werden.

Mama muss sich keine Sorgen mehr machen, dass ich das englische Videomaterial nicht lesen kann.

Außerdem habe ich eine mutige Idee ...

Schalten Sie das Zuhören ein, wenn Sie ein Gruppentreffen abhalten, damit Sie sich keine Sorgen mehr machen müssen, dass Sie plötzlich vom Lehrer überprüft werden.

Derzeit ist Tingwu mit Alibaba Cloud Disk verbunden. Auf der Cloud Disk gespeicherte Audio- und Videoinhalte können mit einem Klick transkribiert werden, und Untertitel können automatisch angezeigt werden, wenn Cloud Disk-Videos online abgespielt werden. KI-verarbeitete Audio- und Videodateien können künftig in der Enterprise-Version schnell intern geteilt werden.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Der Hengwu-Beamte gab außerdem bekannt, dass Hengwu in Zukunft weiterhin neue Funktionen für große Modelle hinzufügen wird, z. B. das direkte Extrahieren von PPT-Screenshots aus Videos und das direkte Stellen von KI-Fragen zu Audio- und Videoinhalten ...

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Der Schlüssel ist, dass die öffentlichen Beta-Vorteile jetzt für alle verfügbar sind, indem Sie sich jeden Tag anmelden Große Plattform-Communities werden außerdem eine große Anzahl von 20-Stunden-Transkribierungs-Passwortcodes herausgeben, und die Dauer kann gestapelt werden, gültig innerhalb eines Jahres.

Als fleißiger Wollmeister ist es kein Traum, mehr als 100 Stunden Freizeit zu sparen (manueller Hundekopf).

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Die Technologie dahinter: großes Sprachmodell + Stimme SOTA

Tatsächlich wurde Tongyi Listening vor der öffentlichen Beta innerhalb von Alibaba sorgfältig aufpoliert.

Ende letzten Jahres haben einige Qubit-Leser die Listening Internal Beta Experience Card erhalten. Die damalige Version enthielt bereits Offline-Sprach-/Videotranskription und Echtzeit-Transkriptionsfunktionen.

In dieser offenen Beta hat Tingwu hauptsächlich Zugriff auf die Zusammenfassungs- und Dialogfunktionen des großen Tongyi Qianwen-Modells. Genauer gesagt basiert diese Arbeit auf dem großen Modell von Tongyi Qianwen und integriert die Forschungsergebnisse des Forschungsteams in die Argumentation, Ausrichtung und Beantwortung von Konversationsfragen.

Zuallererst ist die genaue Extraktion wichtiger Informationen der Schlüssel zur Verbesserung der Arbeitseffizienz mit dieser Art von Artefakten. Dies erfordert die Argumentationsfähigkeiten großer Modelle.

Das Alibaba AI-Team schlug im Jahr 2022 Proton (Probing Turning from Large Language Models) vor, ein Framework zur Wissenserkennung und Argumentationsnutzung, das auf großen Sprachmodellen basiert. Das entsprechende Papier wird auf internationalen Top-Konferenzen wie KDD2022 und SIGIR2023 veröffentlicht.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Die Kernidee dieses Frameworks besteht darin, das interne Wissen großer Modelle zu erkennen und die Denkkette als Träger für Wissensfluss und -nutzung zu nutzen.

Proton belegt den ersten Platz in den drei Hauptlisten Commonsense QA2.0, Physical Commonsense Reasoning PIQA und Numerical Commonsense Reasoning Numbersense.

Auf der TabFact-Liste (Faktenüberprüfung) hat Proton mit seiner Wissenszerlegungs- und vertrauenswürdigen Denkkettentechnologie zum ersten Mal übermenschliche Ergebnisse erzielt.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Zweitens: Um sicherzustellen, dass der Inhalt und das Format der Zusammenfassung in Bezug auf die Ausrichtung den Erwartungen der Benutzer entsprechen, verwendet Listening auch ELHF, eine effiziente Ausrichtungsmethode, die auf menschlichem Feedback basiert.

Diese Methode erfordert nur eine kleine Anzahl hochwertiger manueller Feedback-Beispiele, um eine Ausrichtung zu erreichen. Bei der subjektiven Bewertung von Modelleffekten kann ELHF die Erfolgsquote des Modells um 20 % steigern.

Darüber hinaus hat das Forschungs- und Entwicklungsteam hinter Wu auch Doc2Bot veröffentlicht, einen sehr umfangreichen Datensatz für chinesische Dokumentkonversationen. Die Re3G-Methode des Teams zur Verbesserung der Fragebeantwortungsfähigkeiten des Modells wurde für ICASSP 2023 ausgewählt: Diese Methode kann die Antwort des Modells auf Benutzerfragen in vier Phasen verbessern: Retrieve (Abruf), Rerank (Neuranking), Refine (Feinabstimmung) und Generate ( Seine Fähigkeiten zum Verstehen, zum Wissensabruf und zur Antwortgenerierung belegten den ersten Platz in den beiden wichtigsten Dokumentendialoglisten von Doc2Dial und Multi Doc2Dial.

Neben den Fähigkeiten großer Modelle beherrscht Tingwu auch die Sprachtechnologie von Alibaba.

Das dahinter stehende Spracherkennungsmodell Paraformer von der Alibaba Damo Academy löst das Problem des Ausgleichs von End-to-End-Erkennungseffekt und -effizienz erstmals auf Anwendungsebene auf industrieller Ebene:

Es verbessert nicht nur die Argumentationseffizienz um 10 Zeiten im Vergleich zu herkömmlichen Modellen und brach bei seiner ersten Einführung auch die Rekorde vieler maßgeblicher Datensätze, wodurch die Genauigkeit der Spracherkennung SOTA aufgefrischt wurde. Im professionellen White-Box-Test zur Bewertung der chinesischen Spracherkennung SpeechIO TIOBE in der öffentlichen Cloud mit vollständigem Netzwerk eines Drittanbieters ist Paraformer-large immer noch das chinesische Spracherkennungsmodell mit der höchsten Genauigkeit.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Paraformer ist ein nicht autoregressives Einzelrundenmodell, das aus fünf Teilen besteht: Encoder, Prädiktor, Sampler, Decoder und Verlustfunktion.

Durch das innovative Design des Prädiktors erreicht Paraformer eine genaue Vorhersage der Anzahl der Zielwörter und der entsprechenden akustischen latenten Variablen.

Darüber hinaus führten die Forscher auch die Idee des Browsing Language Model (GLM) im Bereich der maschinellen Übersetzung ein, entwarfen einen auf GLM basierenden Sampler und verbesserten die Modellierung der kontextuellen Semantik durch das Modell.

Gleichzeitig nutzte Paraformer auch Zehntausende Trainingsstunden für extrem große Industriedatensätze, die umfangreiche Szenarien abdeckten, wodurch die Erkennungsgenauigkeit weiter verbessert wurde.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Die genaue Identifizierung von Sprechern in Diskussionen mit mehreren Personen profitiert vom CAM++-Grundmodell der Sprechererkennung der DAMO Academy. Dieses Modell verwendet ein Verzögerungsnetzwerk D-TDNN, das auf dichten Verbindungen basiert. Die Eingabe jeder Schicht wird aus der Ausgabe aller vorherigen Schichten gespleißt. Dieses hierarchische Merkmalsmultiplexen und die eindimensionale Faltung des Verzögerungsnetzwerks können die Recheneffizienz erheblich verbessern das Netzwerk.

Auf den gängigen chinesischen und englischen Testsets VoxCeleb und CN-Celeb der Branche hat CAM++ die beste Genauigkeitsrate aktualisiert.

阿里云大模型上新！AI神器「通义听悟」公测中：长视频一秒总结，还能自动做笔记、翻字幕 | 羊毛可薅

Große Modellöffnung, Benutzer profitieren davon

Laut dem Bericht des China Institute of Scientific and Technological Information wurden unvollständigen Statistiken zufolge 79 große Modelle in China veröffentlicht.

Unter diesem Trend der groß angelegten Modellentwicklung ist die Geschwindigkeit der Entwicklung von KI-Anwendungen erneut in ein Sprintstadium eingetreten.

Aus Sicht der Anwender zeichnet sich allmählich eine erfreuliche Situation ab:

Unter der „Koordination“ großer Modelle beginnen auf der Anwendungsseite verschiedene KI-Technologien zu gedeihen, die Werkzeuge immer effizienter und intelligenter machen.

Von intelligenten Dokumenten, die Ihnen dabei helfen können, automatisch einen Arbeitsplan mit einem Schrägstrich zu schreiben, bis hin zu Audio- und Videoaufzeichnungs- und Analysetools, die Ihnen dabei helfen, Elemente schnell zusammenzufassen: Der Funke von AGI, generativen großen Modellen, lässt immer mehr Menschen spüren die Magie der KI.

Gleichzeitig haben sich für Technologieunternehmen zweifellos neue Herausforderungen und neue Chancen ergeben.

Die Herausforderung besteht darin, dass alle Produkte vom Sturm der großen Modelle erfasst werden und technologische Innovation zu einem unvermeidlichen Schlüsselthema geworden ist.

Die bestehende Marktstruktur hat den Moment erreicht, in dem sie für neue Killeranwendungen umgestaltet werden kann. Wer die Führung übernehmen kann, hängt davon ab, wer technisch besser vorbereitet ist und wessen Technologie sich schneller weiterentwickelt.

Egal was passiert, die technische Entwicklung wird letztendlich den Benutzern zugute kommen.

Das obige ist der detaillierte Inhalt vonDas neue große Modell von Alibaba Cloud ist erschienen! Das KI-Artefakt „Tongyi Listening' befindet sich in der öffentlichen Beta: Lange Videos können in einer Sekunde zusammengefasst werden, außerdem können automatisch Notizen gemacht und Untertitel erstellt werden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

2 Wochen vor By DDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Wie man alles in Myrise freischaltet

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7471

CakePHP-Tutorial

1377

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

Related knowledge

Alibaba Cloud gab bekannt, dass die Yunqi-Konferenz 2024 vom 19. bis 21. September in Hangzhou stattfinden wird. Kostenlose Anmeldung für kostenlose Tickets Aug 07, 2024 pm 07:12 PM

Laut Nachrichten dieser Website vom 5. August gab Alibaba Cloud bekannt, dass die Yunqi-Konferenz 2024 vom 19. bis 21. September in der Stadt Yunqi in Hangzhou stattfinden wird. Es wird ein dreitägiges Hauptforum, 400 Unterforen und parallele Themen geben. sowie knapp vierzehntausend Quadratmeter Ausstellungsfläche. Die Yunqi-Konferenz ist kostenlos und für die Öffentlichkeit zugänglich. Ab sofort kann die Öffentlichkeit kostenlose Tickets über die offizielle Website der Yunqi-Konferenz erwerben. Die Ticket-Website ist auf dieser Website angehängt. https://yunqi.aliyun.com/2024 /ticket-list Berichten zufolge entstand die Yunqi-Konferenz im Jahr 2009 und hieß ursprünglich „First China Website Development Forum“. Im Jahr 2015 entwickelte sie sich zur Alibaba Cloud Developer Conference , wurde sie offiziell in „Yunqi-Konferenz“ umbenannt und verlief weiterhin erfolgreich

Die große Model-App Tencent Yuanbao ist online! Hunyuan wird zu einem Allround-KI-Assistenten aufgerüstet, der überall hin mitgenommen werden kann Jun 09, 2024 pm 10:38 PM

Am 30. Mai kündigte Tencent ein umfassendes Upgrade seines Hunyuan-Modells an. Die auf dem Hunyuan-Modell basierende App „Tencent Yuanbao“ wurde offiziell eingeführt und kann in den App-Stores von Apple und Android heruntergeladen werden. Im Vergleich zur Hunyuan-Applet-Version in der vorherigen Testphase bietet Tencent Yuanbao Kernfunktionen wie KI-Suche, KI-Zusammenfassung und KI-Schreiben für Arbeitseffizienzszenarien. Yuanbaos Gameplay ist außerdem umfangreicher und bietet mehrere Funktionen für KI-Anwendungen , und neue Spielmethoden wie das Erstellen persönlicher Agenten werden hinzugefügt. „Tencent strebt nicht danach, der Erste zu sein, der große Modelle herstellt.“ Liu Yuhong, Vizepräsident von Tencent Cloud und Leiter des großen Modells von Tencent Hunyuan, sagte: „Im vergangenen Jahr haben wir die Fähigkeiten des großen Modells von Tencent Hunyuan weiter gefördert.“ . In die reichhaltige und umfangreiche polnische Technologie in Geschäftsszenarien eintauchen und gleichzeitig Einblicke in die tatsächlichen Bedürfnisse der Benutzer gewinnen

Das große Bytedance Beanbao-Modell wurde veröffentlicht. Der Full-Stack-KI-Dienst Volcano Engine unterstützt Unternehmen bei der intelligenten Transformation Jun 05, 2024 pm 07:59 PM

Tan Dai, Präsident von Volcano Engine, sagte, dass Unternehmen, die große Modelle gut implementieren wollen, vor drei zentralen Herausforderungen stehen: Modelleffekt, Inferenzkosten und Implementierungsschwierigkeiten: Sie müssen über eine gute Basisunterstützung für große Modelle verfügen, um komplexe Probleme zu lösen, und das müssen sie auch Dank der kostengünstigen Inferenzdienste können große Modelle weit verbreitet verwendet werden, und es werden mehr Tools, Plattformen und Anwendungen benötigt, um Unternehmen bei der Implementierung von Szenarien zu unterstützen. ——Tan Dai, Präsident von Huoshan Engine 01. Das große Sitzsackmodell feiert sein Debüt und wird häufig genutzt. Das Polieren des Modelleffekts ist die größte Herausforderung für die Implementierung von KI. Tan Dai wies darauf hin, dass ein gutes Modell nur durch ausgiebigen Gebrauch poliert werden kann. Derzeit verarbeitet das Doubao-Modell täglich 120 Milliarden Text-Tokens und generiert 30 Millionen Bilder. Um Unternehmen bei der Umsetzung groß angelegter Modellszenarien zu unterstützen, wird das von ByteDance unabhängig entwickelte Beanbao-Großmodell durch den Vulkan gestartet

Entdeckung des NVIDIA-Inferenz-Frameworks für große Modelle: TensorRT-LLM Feb 01, 2024 pm 05:24 PM

1. Produktpositionierung von TensorRT-LLM TensorRT-LLM ist eine von NVIDIA entwickelte skalierbare Inferenzlösung für große Sprachmodelle (LLM). Es erstellt, kompiliert und führt Berechnungsdiagramme auf der Grundlage des TensorRT-Deep-Learning-Kompilierungsframeworks aus und stützt sich auf die effiziente Kernels-Implementierung in FastTransformer. Darüber hinaus nutzt es NCCL für die Kommunikation zwischen Geräten. Entwickler können Betreiber entsprechend der Technologieentwicklung und Nachfrageunterschieden an spezifische Anforderungen anpassen, beispielsweise durch die Entwicklung maßgeschneiderter GEMM auf Basis von Entermessern. TensorRT-LLM ist die offizielle Inferenzlösung von NVIDIA, die sich der Bereitstellung hoher Leistung und der kontinuierlichen Verbesserung ihrer Praktikabilität verschrieben hat. TensorRT-LL

Benchmark GPT-4! Das große Jiutian-Modell von China Mobile hat die doppelte Registrierung bestanden Apr 04, 2024 am 09:31 AM

Laut Nachrichten vom 4. April hat die Cyberspace Administration of China kürzlich eine Liste registrierter großer Modelle veröffentlicht, in der das „Jiutian Natural Language Interaction Large Model“ von China Mobile enthalten ist, was darauf hinweist, dass das große Jiutian AI-Modell von China Mobile offiziell generative künstliche Intelligenz bereitstellen kann Geheimdienste nach außen. China Mobile gab an, dass dies das erste groß angelegte Modell sei, das von einem zentralen Unternehmen entwickelt wurde und sowohl die nationale Doppelregistrierung „Generative Artificial Intelligence Service Registration“ als auch die „Domestic Deep Synthetic Service Algorithm Registration“ bestanden habe. Berichten zufolge zeichnet sich Jiutians großes Modell für die Interaktion mit natürlicher Sprache durch verbesserte Branchenfähigkeiten, Sicherheit und Glaubwürdigkeit aus und unterstützt die vollständige Lokalisierung. Es hat mehrere Parameterversionen wie 9 Milliarden, 13,9 Milliarden, 57 Milliarden und 100 Milliarden gebildet. und kann flexibel in der Cloud eingesetzt werden, Edge und End sind unterschiedliche Situationen

Neuer Test-Benchmark veröffentlicht, der leistungsstärkste Open-Source-Llama 3 ist peinlich Apr 23, 2024 pm 12:13 PM

Wenn die Testfragen zu einfach sind, können sowohl Spitzenschüler als auch schlechte Schüler 90 Punkte erreichen, und der Abstand kann nicht vergrößert werden ... Mit der Veröffentlichung stärkerer Modelle wie Claude3, Llama3 und später sogar GPT-5 ist die Branche in Bewegung Dringender Bedarf an einem schwierigeren und differenzierteren Benchmark-Modell. LMSYS, die Organisation hinter der großen Modellarena, brachte den Benchmark der nächsten Generation, Arena-Hard, auf den Markt, der große Aufmerksamkeit erregte. Es gibt auch die neueste Referenz zur Stärke der beiden fein abgestimmten Versionen der Llama3-Anweisungen. Im Vergleich zu MTBench, das zuvor ähnliche Ergebnisse erzielte, stieg die Arena-Hard-Diskriminierung von 22,6 % auf 87,4 %, was auf den ersten Blick stärker und schwächer ist. Arena-Hard basiert auf menschlichen Echtzeitdaten aus der Arena und seine Übereinstimmungsrate mit menschlichen Vorlieben liegt bei bis zu 89,1 %.

Fortgeschrittene Praxis des industriellen Wissensgraphen Jun 13, 2024 am 11:59 AM

1. Einführung in den Hintergrund Lassen Sie uns zunächst die Entwicklungsgeschichte von Yunwen Technology vorstellen. Yunwen Technology Company ... 2023 ist die Zeit, in der große Modelle vorherrschen. Viele Unternehmen glauben, dass die Bedeutung von Diagrammen nach großen Modellen stark abgenommen hat und die zuvor untersuchten voreingestellten Informationssysteme nicht mehr wichtig sind. Mit der Förderung von RAG und der Verbreitung von Data Governance haben wir jedoch festgestellt, dass eine effizientere Datenverwaltung und qualitativ hochwertige Daten wichtige Voraussetzungen für die Verbesserung der Wirksamkeit privatisierter Großmodelle sind. Deshalb beginnen immer mehr Unternehmen, darauf zu achten zu wissenskonstruktionsbezogenen Inhalten. Dies fördert auch den Aufbau und die Verarbeitung von Wissen auf einer höheren Ebene, wo es viele Techniken und Methoden gibt, die erforscht werden können. Es ist ersichtlich, dass das Aufkommen einer neuen Technologie nicht alle alten Technologien besiegt, sondern auch neue und alte Technologien integrieren kann.

Xiaomi Byte schließt sich zusammen! Ein großes Modell von Xiao Ais Zugang zu Doubao: bereits auf Mobiltelefonen und SU7 installiert Jun 13, 2024 pm 05:11 PM

Laut Nachrichten vom 13. Juni hat Xiaomis Assistent für künstliche Intelligenz „Xiao Ai“ laut Bytes öffentlichem Bericht „Volcano Engine“ eine Zusammenarbeit mit Volcano Engine erzielt. Die beiden Parteien werden ein intelligenteres interaktives KI-Erlebnis auf der Grundlage des großen Beanbao-Modells erzielen . Berichten zufolge kann das von ByteDance erstellte groß angelegte Beanbao-Modell bis zu 120 Milliarden Text-Tokens effizient verarbeiten und täglich 30 Millionen Inhalte generieren. Xiaomi nutzte das große Doubao-Modell, um die Lern- und Denkfähigkeiten seines eigenen Modells zu verbessern und einen neuen „Xiao Ai Classmate“ zu schaffen, der nicht nur die Benutzerbedürfnisse genauer erfasst, sondern auch eine schnellere Reaktionsgeschwindigkeit und umfassendere Inhaltsdienste bietet. Wenn ein Benutzer beispielsweise nach einem komplexen wissenschaftlichen Konzept fragt, &ldq

See all articles