Dieser chinesische Tech -Riese hat gerade einen KI -Chatbot gestartet

Dieser chinesische Tech -Riese hat gerade einen KI -Chatbot gestartet - und er ist besser als Deepseek

Susan Sarandon

Freigeben： 2025-02-07 06:01:12

Original

477 Leute haben es durchsucht

Bevor Deepseek die Überschrift auswirken konnte, hat ein weiteres chinesisches KI -Modell sie erhöht. Der chinesische E-Commerce-Riese Alibaba hat eine neue Version seiner Qwen-Familie von AI-Modellen angekündigt, und es gibt viel zu mögen-es ist besser als Deepseek und Chatgpt in einigen Schlüsselbereichen.

Was ist Qwen Max?

Qwen Max ist das neueste und mächtigste KI -Modell in Alibabas Qwen AI -Familie. Derzeit sind die folgenden QWEN-AI-Modelle verfügbar:

qwen2.5-plus
Qwen2.5-max
qwen2.5-VL-72B-Instruction
qwen2.5-14b-Instruct-1M
QVQ-72B-Preview
qwq-32b-preview
qwen2.5-coder-32b -Instruktur
Qwen2.5-Turbo
Qwen2.5-72B-Instruct

Alle obigen Modelle sind frei zu verwenden, sobald Sie ein erstellt haben, Konto per E -Mail, Google oder GitHub. Die KI-Modelle von Qwen sind ebenfalls Open-Source, was bedeutet, dass Sie sie auf GitHub oder Umarmung finden können. Sie können sie auch lokal auf Ihrem Gerät installieren (abhängig von den Spezifikationen), sodass Sie die AI-Offline ausführen können. MOE) Modell, unterstützt 29 Sprachen und ist auf über 20 Billionen Token ausgebildet. Es kann auch bis zu 128.000 Token in einem einzigen Gespräch verarbeiten, was bedeutet, dass ausführliche Dokumente über die KI kein Problem sein werden. Wenn Sie mit Daten arbeiten, kann QWEN strukturierte Formate wie Tabellen, CSVs und JSON -Dateien verarbeiten.

Dieser chinesische Tech -Riese hat gerade einen KI -Chatbot gestartet - und er ist besser als Deepseek

Wie die Namen vermuten lassen, sind einige QWEN -Modelle bei bestimmten Aufgaben besser. Beispielsweise zeichnet sich QWEN2.5-CODER-32B-ISTRUCT in Codierungsaufgaben aus, während QWQ-32B-Präview in der Lage ist, zu denken und zu argumentieren. Nicht alle Modelle können alles tun, aber die meisten Modelle können Texteingabeaufforderungen sowie Bild- und Videogenerierung verarbeiten.

Ein weiteres einzigartiges Merkmal ist die Fähigkeit, zwei Modelle miteinander zu kombinieren. Nach meiner Erfahrung können Sie etwas bessere Ergebnisse erzielen, wenn Sie zwei Versionen zu einer stärkeren Paarung kombinieren. Zum Beispiel hat mir das Kombinieren von QWEN2.5-max mit QWEN2.5-CODER-32B-Instruktur geholfen, Code mit weniger Eingabeaufforderungen und Problemen in der Ausgabe zu generieren. Das KI -Modell. Sie können Eingabeaufforderungen eingeben und mit Text arbeiten, aber es gibt auch Bild- und Videogenerierungsfunktionen und in mehreren Seitenverhältnissen. Es gibt eine Web -Search -Funktion, die noch gestartet wurde. So sehr, dass ich zunächst dachte, die Website funktionierte nicht richtig. Ich stellte fest, dass die erste Eingabeaufforderung, die Sie ein Gespräch senden, etwa 30 Sekunden dauern kann, um eine Antwort zu erzeugen. Danach werden die Antworten beschleunigt. Sie sind nicht erstklassig, wenn es um Qualität oder Realismus geht, aber wenn Sie in einer Prise ein schnelles Bild generieren müssen, werden sie dies tun. Sie können auch in den meisten generierten Medien eine angemessene Menge zufälliger Artefakte erwarten. Deepseek und Chatgpt. Ich habe Fehler erhalten, die von Zeit zu Zeit zu viele Anfragen in der Warteschlange in der Warteschlange hergestellt wurden.

Technisch gesehen ist Qwen besser als Deepseek auf der ganzen Linie. Das Modell von Alibaba fühlt sich natürlicher an, um mit und läuft etwas schneller. Wenn Sie jedoch die Ergebnisse der Benchmark-Ergebnisse ignorieren würden, fällt es Ihnen schwer, Unterschiede zwischen den beiden zu finden.

Qwens Hauptvorteil gegenüber Deepseek ist die bessere Ausrichtung auf die menschlichen Vorlieben, sodass es einfacher ist, kompliziertere Eingaben einzugeben und genaue Antworten ohne viel Feinabstimmung zu erhalten. Selbst einfache Einzeiler können eine detaillierte Reaktion mit vielen Informationen generieren. Deepseek kann zwar ein großartiges KI -Modell, aber ein paar Versuche und einige schnelle Engineering erfordern, bevor Sie Ihre gewünschten Ergebnisse erzielen. Hat eine leichte Kante, wenn es um sachliche Konsistenz geht. Deepseek kostet 0,25 USD pro Million Token, während Qwen 0,38 USD kostet. Trotzdem ist es immer noch deutlich billiger als die von GPT-4O bzw. Claude 3.5 angebotenen Tarife von 5 USD und 3 US-Dollar. Wenn es um Benchmarks geht.

qwen 2.5 max Dieser chinesische Tech -Riese hat gerade einen KI -Chatbot gestartet - und er ist besser als Deepseek

Deepseek v3 r1

Arena-Hard

89.4

85.5

Benchmark	Qwen 2.5 Max	DeepSeek V3 R1
Arena-Hard	89.4	85.5
MMLU-Pro	76.1	75.9
GPQA-Diamond	60.1	59.1
LiveCodeBench	38.7	37.6
LiveBench	62.2	60.5

mmlu-pro 76.1 75.9 gpqa- Diamant 60.1 59.1 LiveCodeBench 38.7 37.6 LiveBench LiveBench 🎜> 62.2 60.5

Die Benchmarks zeigen eindeutig das bessere Verständnis und die Ausrichtung von Qwen mit den menschlichen Werten. Abgesehen davon ist es in Bezug auf Wissen und Argumentation, allgemeines Wissen, Codierung und allgemeine Fähigkeit nur geringfügig besser als Deepseek. Es gibt jedoch Sicherheits- und Datenschutzbedenken, insbesondere wenn man bedenkt, dass Deepseek bereits seine erste Datenverletzung erlitten hat. Trotzdem sind die KI -Modelle von Qwen und Deepseek in Bezug auf die Leistung eindeutig besser als ihre westlichen Kollegen und haben die KI -Welt wirklich auf den Punkt gebracht.

Das obige ist der detaillierte Inhalt vonDieser chinesische Tech -Riese hat gerade einen KI -Chatbot gestartet - und er ist besser als Deepseek. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!