


Der „Android-Moment' der inländischen großen KI-Modelle ist da! Alibaba Cloud Tongyi Qianwen ist kostenlos, Open Source und für die kommerzielle Nutzung verfügbar
Nach Meta in Übersee ist Alibaba zu einem weiteren Technologieriesen geworden, der den Trend der künstlichen Intelligenz (KI) im großen Modell „Android Moment“ vorantreibt
Laut Berichten von Beijing Business Daily wird Alibaba Cloud am Donnerstag, den 3. August, das allgemeine Open-Source-Frage- und Antwortmodell Qwen-7B und das Konversationsmodell Qwen-7B-Chat veröffentlichen. Beide Modelle verfügen über 7 Milliarden Parameter. Sie haben die erste offene „Model as a Service“-Plattform in China, die Magic Community, gestartet, die kostenlos genutzt werden kann, auch kommerzielle Nutzung ist erlaubt
Benutzer können Qwen-7B und Qwen-7B-Chat über Open-Source-Code quantifizieren und Modelle auf Grafikkarten für Endverbraucher bereitstellen und ausführen. Sie können das Modell direkt von der Moda-Community herunterladen oder über die Alibaba Cloud Lingji-Plattform auf Qwen-7B und Qwen-7B-Chat zugreifen und diese anrufen. Alibaba Cloud bietet Benutzern Dienste wie Modellschulung, Inferenz, Bereitstellung und Feinabstimmung
In der Magic Tower-Community gibt es einen Beitrag, der sich der Einführung in die Installationsmethode des Tongyi Qianwen-Modells, der Erfahrung beim Schaffen von Raum, den Best Practices der Modellbegründung und des Modelltrainings widmet und außerdem Screenshots des Modell-Links und der Download-Situation beifügt
Öffentlichen Informationen zufolge handelt es sich bei Qwen-7B um ein Basismodell, das nach Deduplizierung und Filterung mit mehr als 2,2 Billionen Token vorab trainiert wird. Es unterstützt mehrere Sprachen wie Chinesisch und Englisch und hat eine Kontextfensterlänge von 8 KB. Das Modell enthält hochwertige chinesische, englische, mehrsprachige, Code-, Mathematik- und andere Daten und deckt den gesamten Netzwerktext, Enzyklopädien, Bücher, Code, Mathematik und vertikale Felder in verschiedenen Bereichen ab
Den MMLU-Bewertungsergebnissen zufolge schnitt Qwen-7B in der englischen Bewertung gut ab, übertraf andere ähnliche Open-Source-Pre-Training-Modelle und war mit größeren Modellen konkurrenzfähig. In Bezug auf die chinesische Bewertung erreichte Qwen-7B die höchste Punktzahl im C-Eval-Validierungssatz und war selbst mit größeren Modellen konkurrenzfähig
Das Folgende ist ein Vergleich der MMLU-5-Schuss-Genauigkeitsergebnisse von Qwen-7B
Alibaba Cloud hat einen KI-Assistenten Qwen-7B-Chat basierend auf dem Basismodell durch den Ausrichtungsmechanismus erstellt. Dabei handelt es sich um ein großes Sprachmodell des chinesischen und englischen Dialogs, das auf Transformer basiert und erfolgreich eine Ausrichtung auf die menschliche Kognition erreicht hat. Dieses Modell verwendet eine Vielzahl von Daten vor dem Training, darunter Online-Texte, Fachbücher, Codes usw., die ein breites Themenspektrum abdecken
Die Nullpunktgenauigkeit des Qwen-7B-Chat-Modells sowohl im C-Eval-Validierungssatz als auch im MMLU-Bewertungssatz übertrifft andere ähnliche Alignment-Modelle
Im Folgenden finden Sie einen Vergleich der Nullschuss-Genauigkeitsergebnisse des C-Eval-Testsatzes
Alibaba Cloud war das erste große Technologieunternehmen in China, das sich den Reihen der großen Open-Source-Modelle anschloss. Im Juli dieses Jahres veröffentlichte es gemeinsam mit Meta eine kommerzielle Version des Open-Source-KI-Modells Llama 2, das die Modelle von OpenAI und Google ersetzen kann . Darüber hinaus kündigten Zhipu AI und Tsinghua KEG Laboratory im Juli auch Chinas führendes Open-Source-Großmodell an
Der Vorteil von Open-Source-Modellen besteht darin, die Benutzerakzeptanz zu erhöhen und mehr Daten für die Verarbeitung künstlicher Intelligenz bereitzustellen. Je größer das Datenvolumen von LLM ist, desto leistungsfähiger ist seine Funktion. Darüber hinaus hilft das Open-Source-Modell Forschern und Entwicklern, Schwachstellen zu entdecken und zu beheben und so die Technologie und das Sicherheitsniveau zu verbessern
Auf dem Alibaba Cloud Summit im April 2023 kündigte Alibaba die Öffnung von Tongyi Qianwen für Unternehmen an, sodass Unternehmen die Fähigkeiten von Tongyi Qianwen nutzen können, um ihre eigenen großen Modelle zu trainieren
Zhou Jingren, Chief Technology Officer (CTO) der Alibaba Cloud Intelligence Group, sagte, dass Unternehmen in Zukunft die Tongyi Qianwen-Funktionen von Alibaba Cloud in vollem Umfang nutzen und ihre eigenen Branchenkenntnisse und Anwendungsszenarien kombinieren können, um maßgeschneiderte große Unternehmensmodelle zu trainieren. Beispielsweise kann jedes Unternehmen über einen eigenen intelligenten Kundenservice, einen intelligenten Einkaufsführer, einen intelligenten Sprachassistenten, einen Copywriting-Assistenten, einen KI-Designer, ein selbstfahrendes Modell und andere Funktionen verfügen
Zhang Yong, CEO der Alibaba Group und CEO der Alibaba Cloud Intelligence Group, sagte, dass alle Alibaba-Produkte in das große Tongyi Qianwen-Modell integriert werden
Alibaba Cloud hofft, mehr Unternehmen dabei zu helfen, große Modelle zu verwenden, um sich an die Anforderungen des KI-Zeitalters anzupassen, sodass jedes Unternehmen über sein eigenes exklusives großes Modell der Branchenfähigkeiten verfügen und dieses auf der Grundlage von Tongyi Qianwen rekonstruieren kann
Das obige ist der detaillierte Inhalt vonDer „Android-Moment' der inländischen großen KI-Modelle ist da! Alibaba Cloud Tongyi Qianwen ist kostenlos, Open Source und für die kommerzielle Nutzung verfügbar. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Laut Nachrichten dieser Website vom 5. August gab Alibaba Cloud bekannt, dass die Yunqi-Konferenz 2024 vom 19. bis 21. September in der Stadt Yunqi in Hangzhou stattfinden wird. Es wird ein dreitägiges Hauptforum, 400 Unterforen und parallele Themen geben. sowie knapp vierzehntausend Quadratmeter Ausstellungsfläche. Die Yunqi-Konferenz ist kostenlos und für die Öffentlichkeit zugänglich. Ab sofort kann die Öffentlichkeit kostenlose Tickets über die offizielle Website der Yunqi-Konferenz erwerben. Die Ticket-Website ist auf dieser Website angehängt. https://yunqi.aliyun.com/2024 /ticket-list Berichten zufolge entstand die Yunqi-Konferenz im Jahr 2009 und hieß ursprünglich „First China Website Development Forum“. Im Jahr 2015 entwickelte sie sich zur Alibaba Cloud Developer Conference , wurde sie offiziell in „Yunqi-Konferenz“ umbenannt und verlief weiterhin erfolgreich

Am 30. Mai kündigte Tencent ein umfassendes Upgrade seines Hunyuan-Modells an. Die auf dem Hunyuan-Modell basierende App „Tencent Yuanbao“ wurde offiziell eingeführt und kann in den App-Stores von Apple und Android heruntergeladen werden. Im Vergleich zur Hunyuan-Applet-Version in der vorherigen Testphase bietet Tencent Yuanbao Kernfunktionen wie KI-Suche, KI-Zusammenfassung und KI-Schreiben für Arbeitseffizienzszenarien. Yuanbaos Gameplay ist außerdem umfangreicher und bietet mehrere Funktionen für KI-Anwendungen , und neue Spielmethoden wie das Erstellen persönlicher Agenten werden hinzugefügt. „Tencent strebt nicht danach, der Erste zu sein, der große Modelle herstellt.“ Liu Yuhong, Vizepräsident von Tencent Cloud und Leiter des großen Modells von Tencent Hunyuan, sagte: „Im vergangenen Jahr haben wir die Fähigkeiten des großen Modells von Tencent Hunyuan weiter gefördert.“ . In die reichhaltige und umfangreiche polnische Technologie in Geschäftsszenarien eintauchen und gleichzeitig Einblicke in die tatsächlichen Bedürfnisse der Benutzer gewinnen

Tan Dai, Präsident von Volcano Engine, sagte, dass Unternehmen, die große Modelle gut implementieren wollen, vor drei zentralen Herausforderungen stehen: Modelleffekt, Inferenzkosten und Implementierungsschwierigkeiten: Sie müssen über eine gute Basisunterstützung für große Modelle verfügen, um komplexe Probleme zu lösen, und das müssen sie auch Dank der kostengünstigen Inferenzdienste können große Modelle weit verbreitet verwendet werden, und es werden mehr Tools, Plattformen und Anwendungen benötigt, um Unternehmen bei der Implementierung von Szenarien zu unterstützen. ——Tan Dai, Präsident von Huoshan Engine 01. Das große Sitzsackmodell feiert sein Debüt und wird häufig genutzt. Das Polieren des Modelleffekts ist die größte Herausforderung für die Implementierung von KI. Tan Dai wies darauf hin, dass ein gutes Modell nur durch ausgiebigen Gebrauch poliert werden kann. Derzeit verarbeitet das Doubao-Modell täglich 120 Milliarden Text-Tokens und generiert 30 Millionen Bilder. Um Unternehmen bei der Umsetzung groß angelegter Modellszenarien zu unterstützen, wird das von ByteDance unabhängig entwickelte Beanbao-Großmodell durch den Vulkan gestartet

1. Produktpositionierung von TensorRT-LLM TensorRT-LLM ist eine von NVIDIA entwickelte skalierbare Inferenzlösung für große Sprachmodelle (LLM). Es erstellt, kompiliert und führt Berechnungsdiagramme auf der Grundlage des TensorRT-Deep-Learning-Kompilierungsframeworks aus und stützt sich auf die effiziente Kernels-Implementierung in FastTransformer. Darüber hinaus nutzt es NCCL für die Kommunikation zwischen Geräten. Entwickler können Betreiber entsprechend der Technologieentwicklung und Nachfrageunterschieden an spezifische Anforderungen anpassen, beispielsweise durch die Entwicklung maßgeschneiderter GEMM auf Basis von Entermessern. TensorRT-LLM ist die offizielle Inferenzlösung von NVIDIA, die sich der Bereitstellung hoher Leistung und der kontinuierlichen Verbesserung ihrer Praktikabilität verschrieben hat. TensorRT-LL

Laut Nachrichten vom 4. April hat die Cyberspace Administration of China kürzlich eine Liste registrierter großer Modelle veröffentlicht, in der das „Jiutian Natural Language Interaction Large Model“ von China Mobile enthalten ist, was darauf hinweist, dass das große Jiutian AI-Modell von China Mobile offiziell generative künstliche Intelligenz bereitstellen kann Geheimdienste nach außen. China Mobile gab an, dass dies das erste groß angelegte Modell sei, das von einem zentralen Unternehmen entwickelt wurde und sowohl die nationale Doppelregistrierung „Generative Artificial Intelligence Service Registration“ als auch die „Domestic Deep Synthetic Service Algorithm Registration“ bestanden habe. Berichten zufolge zeichnet sich Jiutians großes Modell für die Interaktion mit natürlicher Sprache durch verbesserte Branchenfähigkeiten, Sicherheit und Glaubwürdigkeit aus und unterstützt die vollständige Lokalisierung. Es hat mehrere Parameterversionen wie 9 Milliarden, 13,9 Milliarden, 57 Milliarden und 100 Milliarden gebildet. und kann flexibel in der Cloud eingesetzt werden, Edge und End sind unterschiedliche Situationen

1. Einführung in den Hintergrund Lassen Sie uns zunächst die Entwicklungsgeschichte von Yunwen Technology vorstellen. Yunwen Technology Company ... 2023 ist die Zeit, in der große Modelle vorherrschen. Viele Unternehmen glauben, dass die Bedeutung von Diagrammen nach großen Modellen stark abgenommen hat und die zuvor untersuchten voreingestellten Informationssysteme nicht mehr wichtig sind. Mit der Förderung von RAG und der Verbreitung von Data Governance haben wir jedoch festgestellt, dass eine effizientere Datenverwaltung und qualitativ hochwertige Daten wichtige Voraussetzungen für die Verbesserung der Wirksamkeit privatisierter Großmodelle sind. Deshalb beginnen immer mehr Unternehmen, darauf zu achten zu wissenskonstruktionsbezogenen Inhalten. Dies fördert auch den Aufbau und die Verarbeitung von Wissen auf einer höheren Ebene, wo es viele Techniken und Methoden gibt, die erforscht werden können. Es ist ersichtlich, dass das Aufkommen einer neuen Technologie nicht alle alten Technologien besiegt, sondern auch neue und alte Technologien integrieren kann.

Wenn die Testfragen zu einfach sind, können sowohl Spitzenschüler als auch schlechte Schüler 90 Punkte erreichen, und der Abstand kann nicht vergrößert werden ... Mit der Veröffentlichung stärkerer Modelle wie Claude3, Llama3 und später sogar GPT-5 ist die Branche in Bewegung Dringender Bedarf an einem schwierigeren und differenzierteren Benchmark-Modell. LMSYS, die Organisation hinter der großen Modellarena, brachte den Benchmark der nächsten Generation, Arena-Hard, auf den Markt, der große Aufmerksamkeit erregte. Es gibt auch die neueste Referenz zur Stärke der beiden fein abgestimmten Versionen der Llama3-Anweisungen. Im Vergleich zu MTBench, das zuvor ähnliche Ergebnisse erzielte, stieg die Arena-Hard-Diskriminierung von 22,6 % auf 87,4 %, was auf den ersten Blick stärker und schwächer ist. Arena-Hard basiert auf menschlichen Echtzeitdaten aus der Arena und seine Übereinstimmungsrate mit menschlichen Vorlieben liegt bei bis zu 89,1 %.

Laut Nachrichten vom 13. Juni hat Xiaomis Assistent für künstliche Intelligenz „Xiao Ai“ laut Bytes öffentlichem Bericht „Volcano Engine“ eine Zusammenarbeit mit Volcano Engine erzielt. Die beiden Parteien werden ein intelligenteres interaktives KI-Erlebnis auf der Grundlage des großen Beanbao-Modells erzielen . Berichten zufolge kann das von ByteDance erstellte groß angelegte Beanbao-Modell bis zu 120 Milliarden Text-Tokens effizient verarbeiten und täglich 30 Millionen Inhalte generieren. Xiaomi nutzte das große Doubao-Modell, um die Lern- und Denkfähigkeiten seines eigenen Modells zu verbessern und einen neuen „Xiao Ai Classmate“ zu schaffen, der nicht nur die Benutzerbedürfnisse genauer erfasst, sondern auch eine schnellere Reaktionsgeschwindigkeit und umfassendere Inhaltsdienste bietet. Wenn ein Benutzer beispielsweise nach einem komplexen wissenschaftlichen Konzept fragt, &ldq
