NVLM 1.0 von NVIDIA: Eine leistungsstarke Alternative zu GPT-4o mit beeindruckenden Ergebnissen

1m, 11s

14:48, 19.09.2024

NVIDIA hat eine neue Familie von multimodalen NVLM-Modellen (NVIDIA Vision Language Model) angekündigt, die hervorragende Ergebnisse bei einer Reihe von visuellen und sprachlichen Aufgaben liefern. Die Familie umfasst drei Hauptmodelle: NVLM-D (Decoder-only Model), NVLM-X (X-attention Model) und NVLM-H (Hybrid Modell), die jeweils in Konfigurationen mit 34 und 72 Milliarden Parametern erhältlich sind.

Eine der wichtigsten Eigenschaften der Modelle ist ihre Fähigkeit, visuelle Aufgaben effizient zu bewältigen. Im OCRBench-Test, der die Fähigkeit testet, Text aus Bildern zu erkennen, übertraf das NVLM-D-Modell das GPT-4o von OpenAI, ein wichtiger Durchbruch bei multimodalen Lösungen. Außerdem sind die Modelle in der Lage, Meme zu verstehen, menschliche Handschriften zu analysieren und Fragen zu beantworten, die eine genaue Analyse der Position von Objekten in Bildern erfordern.

NVLMs schneiden auch bei Mathematikaufgaben gut ab, wo sie die Modelle von Google übertreffen und nur drei Punkte hinter dem Spitzenreiter, dem Modell Claude 3.5 des Startups Anthropic, liegen.

Jedes der drei Modelle hat unterschiedliche Eigenschaften.

NVLM-D verwendet einen vortrainierten Encoder und ein mehrschichtiges Perzeptron, was es kostengünstig macht, aber mehr GPU-Ressourcen erfordert.
NVLM-X verwendet einen Cross-Attention-Mechanismus, der besser mit hochauflösenden Bildern umgehen kann.
NVLM-H kombiniert die Vorteile beider Modelle und schafft ein Gleichgewicht zwischen Effizienz und Genauigkeit.

NVIDIA baut seine Position im Bereich der künstlichen Intelligenz weiter aus, indem es Lösungen anbietet, die sowohl für die Forschung als auch für die Wirtschaft von Nutzen sein können.

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Alle Produkte ansehen

KVM-SSD 1024

-10%

€

/mo

€ 6 /mo

Alle 12 Monate abgerechnet

CPU

3 Xeon Cores

RAM

1 GB

Space

20 GB SSD

Bandwidth

Unlimited
KVM-SSD 2048 Metered

-29.4%

€

/mo

€ 17 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

2 GB

Space

30 GB SSD

Bandwidth

2 TB
KVM-NVMe 65536

-8.8%

€

/mo

€ 170 /mo

Alle 12 Monate abgerechnet

CPU

10 Epyc Cores

RAM

64 GB

Space

400 GB NVMe

Bandwidth

Unlimited
KVM-NVMe 16384

-10%

€

/mo

€ 55 /mo

Alle 12 Monate abgerechnet

CPU

6 Epyc Cores

RAM

16 GB

Space

150 GB NVMe

Bandwidth

Unlimited
wKVM-SSD 1024 HK

-20.2%

€

/mo

€ 19 /mo

Alle 12 Monate abgerechnet

CPU

1 Xeon Core

RAM

1 GB

Space

50 GB SSD

Bandwidth

300 GB
10Ge-wKVM-SSD 2048

-4.4%

€

/mo

€ 34 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

2 GB

Space

75 GB SSD

Bandwidth

Unlimited
KVM-NVMe 32768

-10.2%

€

/mo

€ 88 /mo

Alle 12 Monate abgerechnet

CPU

6 Epyc Cores

RAM

32 GB

Space

200 GB NVMe

Bandwidth

Unlimited
10Ge-KVM-SSD 4096

-9.1%

€

/mo

€ 55 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

4 GB

Space

50 GB SSD

Bandwidth

Unlimited
KVM-HDD 8192

-10%

€

/mo

€ 23 /mo

Alle 12 Monate abgerechnet

CPU

6 Xeon Cores

RAM

8 GB

Space

200 GB HDD

Bandwidth

Unlimited
KVM-HDD HK 2048

-10%

€

/mo

€ 6.42 /mo

Alle 12 Monate abgerechnet

CPU

4 Xeon Cores

RAM

2 GB

Space

60 GB HDD

Bandwidth

300 Gb

NVLM 1.0 von NVIDIA: Eine leistungsstarke Alternative zu GPT-4o mit beeindruckenden Ergebnissen

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Weitere Artikel zu diesem Thema