Nvidias Überhitzungsproblem bei Blackwell-Prozessoren wurde aufgedeckt
15:41, 20.11.2024
Kunden sind nach Tests der neuen Blackwell B200-Prozessoren mit unangenehmen Konsequenzen konfrontiert worden. Das Problem liegt in der Überhitzung der Server. Derzeit besteht ein echtes Risiko, dass Kunden ihre Rechenzentren nicht betreiben können.
Was ist die tatsächliche Ursache der Überhitzung?
Es besteht eine hohe Wahrscheinlichkeit, dass das Kühlsystem aufgrund der Verwendung von Server-Racks mit 72 Chips nicht ordnungsgemäß funktioniert.
Laut Nvidia hat das Unternehmen seine Partner bereits mehrfach aufgefordert, eine Änderung des Rack-Designs zu unterstützen. Zudem hat Nvidia erklärt, dass solche Änderungen nicht unerwartet seien und durchaus vorhersehbar waren. Änderungen im Design könnten jedoch zu Verzögerungen bei der Lieferung der Beschleuniger führen.
Diese Chips wurden im März dieses Jahres vorgestellt und werden hauptsächlich für KI-Aufgaben verwendet. Der Blackwell B200 verfügt über 208 Milliarden Transistoren, und ein Paar dieser Chips wird den Kern des GB200 bilden. Das Unternehmen hat außerdem das GB200 NVL72-Server-Rack mit 72 Grafikbeschleunigern herausgebracht.
Was den Preis betrifft, so wird der Blackwell B200 deutlich günstiger sein als der H100 und in einer Preisspanne von 30.000 bis 40.000 US-Dollar bewertet.