Nach Meta in Übersee ist Alibaba zu einem weiteren Technologieriesen geworden, der den Trend der künstlichen Intelligenz (KI) im großen Modell „Android Moment“ vorantreibt
Laut Berichten von Beijing Business Daily wird Alibaba Cloud am Donnerstag, den 3. August, das allgemeine Open-Source-Frage- und Antwortmodell Qwen-7B und das Konversationsmodell Qwen-7B-Chat veröffentlichen. Beide Modelle verfügen über 7 Milliarden Parameter. Sie haben die erste offene „Model as a Service“-Plattform in China, die Magic Community, gestartet, die kostenlos genutzt werden kann, auch kommerzielle Nutzung ist erlaubt
Benutzer können Qwen-7B und Qwen-7B-Chat über Open-Source-Code quantifizieren und Modelle auf Grafikkarten für Endverbraucher bereitstellen und ausführen. Sie können das Modell direkt von der Moda-Community herunterladen oder über die Alibaba Cloud Lingji-Plattform auf Qwen-7B und Qwen-7B-Chat zugreifen und diese anrufen. Alibaba Cloud bietet Benutzern Dienste wie Modellschulung, Inferenz, Bereitstellung und Feinabstimmung
In der Magic Tower-Community gibt es einen Beitrag, der sich der Einführung in die Installationsmethode des Tongyi Qianwen-Modells, der Erfahrung beim Schaffen von Raum, den Best Practices der Modellbegründung und des Modelltrainings widmet und außerdem Screenshots des Modell-Links und der Download-Situation beifügt
Öffentlichen Informationen zufolge handelt es sich bei Qwen-7B um ein Basismodell, das nach Deduplizierung und Filterung mit mehr als 2,2 Billionen Token vorab trainiert wird. Es unterstützt mehrere Sprachen wie Chinesisch und Englisch und hat eine Kontextfensterlänge von 8 KB. Das Modell enthält hochwertige chinesische, englische, mehrsprachige, Code-, Mathematik- und andere Daten und deckt den gesamten Netzwerktext, Enzyklopädien, Bücher, Code, Mathematik und vertikale Felder in verschiedenen Bereichen ab
Den MMLU-Bewertungsergebnissen zufolge schnitt Qwen-7B in der englischen Bewertung gut ab, übertraf andere ähnliche Open-Source-Pre-Training-Modelle und war mit größeren Modellen konkurrenzfähig. In Bezug auf die chinesische Bewertung erreichte Qwen-7B die höchste Punktzahl im C-Eval-Validierungssatz und war selbst mit größeren Modellen konkurrenzfähig
Das Folgende ist ein Vergleich der MMLU-5-Schuss-Genauigkeitsergebnisse von Qwen-7B
Alibaba Cloud hat einen KI-Assistenten Qwen-7B-Chat basierend auf dem Basismodell durch den Ausrichtungsmechanismus erstellt. Dabei handelt es sich um ein großes Sprachmodell des chinesischen und englischen Dialogs, das auf Transformer basiert und erfolgreich eine Ausrichtung auf die menschliche Kognition erreicht hat. Dieses Modell verwendet eine Vielzahl von Daten vor dem Training, darunter Online-Texte, Fachbücher, Codes usw., die ein breites Themenspektrum abdecken
Die Nullpunktgenauigkeit des Qwen-7B-Chat-Modells sowohl im C-Eval-Validierungssatz als auch im MMLU-Bewertungssatz übertrifft andere ähnliche Alignment-Modelle
Im Folgenden finden Sie einen Vergleich der Nullschuss-Genauigkeitsergebnisse des C-Eval-Testsatzes
Alibaba Cloud war das erste große Technologieunternehmen in China, das sich den Reihen der großen Open-Source-Modelle anschloss. Im Juli dieses Jahres veröffentlichte es gemeinsam mit Meta eine kommerzielle Version des Open-Source-KI-Modells Llama 2, das die Modelle von OpenAI und Google ersetzen kann . Darüber hinaus kündigten Zhipu AI und Tsinghua KEG Laboratory im Juli auch Chinas führendes Open-Source-Großmodell an
Der Vorteil von Open-Source-Modellen besteht darin, die Benutzerakzeptanz zu erhöhen und mehr Daten für die Verarbeitung künstlicher Intelligenz bereitzustellen. Je größer das Datenvolumen von LLM ist, desto leistungsfähiger ist seine Funktion. Darüber hinaus hilft das Open-Source-Modell Forschern und Entwicklern, Schwachstellen zu entdecken und zu beheben und so die Technologie und das Sicherheitsniveau zu verbessern
Auf dem Alibaba Cloud Summit im April 2023 kündigte Alibaba die Öffnung von Tongyi Qianwen für Unternehmen an, sodass Unternehmen die Fähigkeiten von Tongyi Qianwen nutzen können, um ihre eigenen großen Modelle zu trainieren
Zhou Jingren, Chief Technology Officer (CTO) der Alibaba Cloud Intelligence Group, sagte, dass Unternehmen in Zukunft die Tongyi Qianwen-Funktionen von Alibaba Cloud in vollem Umfang nutzen und ihre eigenen Branchenkenntnisse und Anwendungsszenarien kombinieren können, um maßgeschneiderte große Unternehmensmodelle zu trainieren. Beispielsweise kann jedes Unternehmen über einen eigenen intelligenten Kundenservice, einen intelligenten Einkaufsführer, einen intelligenten Sprachassistenten, einen Copywriting-Assistenten, einen KI-Designer, ein selbstfahrendes Modell und andere Funktionen verfügen
Zhang Yong, CEO der Alibaba Group und CEO der Alibaba Cloud Intelligence Group, sagte, dass alle Alibaba-Produkte in das große Tongyi Qianwen-Modell integriert werden
Alibaba Cloud hofft, mehr Unternehmen dabei zu helfen, große Modelle zu verwenden, um sich an die Anforderungen des KI-Zeitalters anzupassen, sodass jedes Unternehmen über sein eigenes exklusives großes Modell der Branchenfähigkeiten verfügen und dieses auf der Grundlage von Tongyi Qianwen rekonstruieren kann
Das obige ist der detaillierte Inhalt vonDer „Android-Moment' der inländischen großen KI-Modelle ist da! Alibaba Cloud Tongyi Qianwen ist kostenlos, Open Source und für die kommerzielle Nutzung verfügbar. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!