GPT-4.5: Ein neuer Meilenstein in der Entwicklung von Sprachmodellen

watch 1m, 30s
views 2

18:33, 28.02.2025

Das neue Sprachmodell GPT-4.5 wurde veröffentlicht und ist natürlicher als die vorherigen Versionen, allerdings auch teurer.

Derzeit ist GPT-4.5 als "Research Preview" für Entwickler und Pro-Nutzer verfügbar. In der nächsten Woche soll der Zugang für Team- und Plus-Nutzer freigeschaltet werden.

Ein wesentlicher Unterschied zwischen GPT-4.5 und den Modellen o3-mini und o1 besteht darin, dass die neue Version dank eines veränderten Ansatzes beim "ungesteuerten Lernen" deutlich schneller reagiert. Da das Modell nicht mehr vor der Antwort nachdenkt, wurde die Produktivität erheblich gesteigert.

GPT-4.5 ist auch unter dem Namen Orion bekannt und gilt als das bisher größte trainierte Modell. OpenAI betont, dass die neue Version keine "Grenzversion" sei – möglicherweise in Verbindung mit der Entwicklung eines weiteren Modells, o3.

Der Preis für GPT-4.5 liegt deutlich über den Kosten von GPT-4o und 1: $75 pro Million Eingabetoken und $150 pro Million Ausgabetoken. Wie die Vorgängerversionen bietet auch diese Version einen Kontextumfang von 128.000 Token.

Laut OpenAI sollen die beiden Hauptansätze – Denken und Lernen – in Zukunft als ergänzende Methoden genutzt werden. GPT-4.5 hat bereits durch sein vorheriges Training deutlich an Intelligenz gewonnen. Es besteht zudem eine hohe Wahrscheinlichkeit, dass GPT-5 beide Fähigkeiten kombinieren kann.

Benchmarking-Ergebnisse

In Leistungstests zeigt GPT-4.5 sehr gute Ergebnisse und erreicht 62,5 % in Simple QA. Zum Vergleich: Grok 3 erreichte 43,6 %, ebenso GPT-4o. Die Halluzinationsrate wurde auf ein Rekordtief von 37,1 % gesenkt. Zudem dominiert GPT-4.5 in Tests zur menschlichen Bewertung bei Alltagsfragen, kreativem Denken und Fachwissen.

In STEM-Tests variieren die Ergebnisse zwischen den Modellen. So erreicht GPT-4.5 beispielsweise im AIME '24-Test 36,7 %, während o3-mini 87,3 % und GPT-4o 9,3 % erzielen. Im SWE-Bench Verified-Test schneidet GPT-4.5 mit 38,8 % ab, während o3-mini 61,0 % und GPT-4o 30,7 % erreichen.

Vergleicht man alle Benchmarks, bleiben die Werte stabil, und es gibt keinen so großen Leistungssprung wie in Simple QA.

Teilen

War dieser Artikel für Sie hilfreich?

VPS beliebte Angebote

Weitere Artikel zu diesem Thema

cookie

Cookies und Datenschutz akzeptieren?

Wir verwenden Cookies, um sicherzustellen, dass wir Ihnen die beste Erfahrung auf unserer Website bieten. Wenn Sie fortfahren, ohne Ihre Einstellungen zu ändern, gehen wir davon aus, dass Sie mit dem Empfang aller Cookies auf der HostZealot-Website einverstanden sind.