New Qwen2.5-Max übertrifft die Fähigkeiten von DeepSeek

1m, 6s

14:02, 31.01.2025

Nach den Veröffentlichungen von Qwen2.5 und Qwen2.5-VL ist nun eine neue Version von Qwen2.5-Max verfügbar. Die neue Version von Qwen zeigt in den folgenden Benchmarks eine überlegene Leistung gegenüber DeepSeek V3: GPQA-Diamond, Arena-Hard, LiveCodeBench und LiveBench.

Architektur und Modelleigenschaften

Die Max-Version ist ein groß angelegtes Projekt des Mixture-of-Experts-Modells. Die Einzigartigkeit dieses Modells liegt in der Schulung mit echtem Benutzerfeedback (RLHF), der Verwendung von Supervised Fine-Tuning und natürlich dem Training mit 20 Billionen Token.

Derzeit wurden die Daten der neuen Version noch nicht auf GitHub veröffentlicht. Der Zugriff ist vorerst nur über die API und Qwen Chat möglich. Die fehlenden Daten auf HuggingFace und GitHub könnten darauf hindeuten, dass das Unternehmen das Projekt eilig veröffentlicht hat oder gezielt die Nutzung seiner Cloud-Plattform fördern möchte.

Qwen hat Ergebnisse zur neuen Modellversion veröffentlicht. Laut der öffentlich zugänglichen Vergleichstabelle zwischen der neuen Qwen-Version, LLaMA3.1 und DeepSeek-V3 übertrifft die Max-Version ihre Konkurrenten in den meisten Kategorien. Im Vergleich zu Claude Sonnet und GPT unterliegt sie jedoch GPT.

Das Unternehmen hat ein erhebliches Budget in Trainingsdaten investiert, und die Überlegenheit gegenüber den Wettbewerbern ist vorhanden, aber relativ gering. Daher vermuten einige Experten, dass sich die Fähigkeiten von Sprachmodellen möglicherweise durch den Einsatz zusätzlicher Rechenleistung während des Testens erweitern lassen.

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Alle Produkte ansehen

wKVM-SSD 4096 HK

-21.5%

€

/mo

€ 40 /mo

Alle 12 Monate abgerechnet

CPU

2 Xeon Cores

RAM

4 GB

Space

100 GB SSD

Bandwidth

300 GB
wKVM-HDD HK 8192

-7.9%

€

/mo

€ 26.45 /mo

Alle 12 Monate abgerechnet

CPU

6 Xeon Cores

RAM

8 GB

Space

200 GB HDD

Bandwidth

300 Gb
10Ge-wKVM-SSD 8192

-6.3%

€

/mo

€ 111 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

8 GB

Space

100 GB SSD

Bandwidth

Unlimited
KVM-SSD 32768

-10%

€

/mo

€ 85 /mo

Alle 12 Monate abgerechnet

CPU

8 Xeon Cores

RAM

32 GB

Space

200 GB SSD

Bandwidth

Unlimited
DDoS Protected SSD-KVM 2048

-16.3%

€

/mo

€ 48 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

2 GB

Space

30 GB SSD

Bandwidth

40 Mbps
10Ge-wKVM-SSD 16384

-6.9%

€

/mo

€ 216 /mo

Alle 12 Monate abgerechnet

CPU

6 Xeon Cores

RAM

16 GB

Space

150 GB SSD

Bandwidth

Unlimited
wKVM-SSD 8192 HK

-21.4%

€

/mo

€ 67 /mo

Alle 12 Monate abgerechnet

CPU

6 Xeon Cores

RAM

8 GB

Space

100 GB SSD

Bandwidth

500 GB
KVM-SSD 512 HK

-13.1%

€

/mo

€ 7 /mo

Alle 12 Monate abgerechnet

CPU

2 Xeon Cores

RAM

512 MB

Space

10 GB SSD

Bandwidth

300 GB
Keitaro KVM 32768

€

/mo

OS

CentOS

CPU

8 Epyc Cores

RAM

32 GB

Space

200 GB NVMe

Software

Keitaro

Bandwidth

Unlimited
wKVM-SSD 4096

-7.2%

€

/mo

€ 21.5 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

4 GB

Space

100 GB SSD

Bandwidth

Unlimited

New Qwen2.5-Max übertrifft die Fähigkeiten von DeepSeek

Architektur und Modelleigenschaften

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Weitere Artikel zu diesem Thema