NVIDIA NVFP4: KI-Training 1,73-mal schneller auf Blackwell

Veröffentlicht am: 09.06.2026 um 05:15 Uhr | Redaktion boerse-global.de

NVIDIA stellt Quantisierungstechnik NVFP4 vor, die KI-Training auf Blackwell-Systemen um 73% beschleunigt. Neue Vera-Rubin-Plattform geht in Serie.

NVIDIA präsentiert NVFP4: KI-Training wird drastisch beschleunigt — A close-up of a glowing NVIDIA Blackwell GPU chip with intricate circuitry, symbolizing advanced AI processing. Illustration mit AI erstellt übermittelt durch boerse-global.de

Der Chipkonzern NVIDIA hat gleich mehrere technische Durchbrüche präsentiert, die das Training Künstlicher Intelligenz grundlegend verändern könnten. Neue Quantisierungstechniken versprechen drastische Geschwindigkeitssteigerungen – und das ohne Einbußen bei der Genauigkeit.

Am heutigen Dienstag veröffentlichte der US-Konzern ein technisches Verfahren namens NVFP4, das auf 4-Bit-Gleitkommazahlen basiert. Das Besondere: Auf NVIDIAs Blackwell-Systemen lässt sich das KI-Training damit bis zu 1,73-mal schneller durchführen als mit dem bisherigen FP8-Standard. Die Genauigkeit der Modelle bleibt laut Unternehmensangaben erhalten.

Während NVIDIA die technische Basis für immer komplexere Systeme schafft, stellt die EU bereits die rechtlichen Weichen für deren Einsatz. Wie Unternehmen die neuen Anforderungen der KI-Verordnung rechtssicher umsetzen, erklärt dieser kostenlose Leitfaden zu Risikoklassen und Fristen. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt

Fünf Tricks für mehr Tempo

Das neue NVFP4-Training wurde speziell für die Frameworks JAX und MaxText entwickelt. Fünf Kernmethoden sorgen dafür, dass die Präzision auch bei niedrigeren Bitraten erhalten bleibt:

16-Element-Micro-Block-Skalierung
E4M3-Block-Skalenfaktoren
Random-Hadamard-Transformation
2D-FP8-Skalierung für Gewichtsblöcke
Stochastisches Runden

Die Benchmarks sprechen eine deutliche Sprache: Beim Llama-3.1-405B-Modell auf GB300-Hardware steigt der Durchsatz auf 3633 TFLOPs pro Sekunde – im Vergleich zu 2103 TFLOPs unter FP8. Die Quantisierung betrifft dabei nur bestimmte Schichten, während die Aufmerksamkeitsmechanismen in höherer Präzision arbeiten, um die Modellqualität zu sichern.

Vera Rubin: Die nächste Generation ist da

Parallel zu den Software-Neuerungen gab NVIDIA bekannt, dass die Vera-Rubin-Plattform in die Serienproduktion geht. Optimiert für sogenannte „agentische KI“ – also Systeme, die eigenständig handeln können – besteht ein Standard-Rubin-NVL72-Pod aus fünf Racks mit Vera-CPUs, BlueField-4-DPUs mit 800-Gigabit-Netzwerk und Spectrum-6-Ethernet.

Die Kosten für ein solches Supercomputing-Rack: rund 9,1 Millionen Euro. Jedes Rack enthält 16 GPUs mit je 48 GB HBM4-Speicher – insgesamt 768 GB pro Einheit. Die Rechenleistung liegt bei 100 PetaFLOPS pro Rack. Entscheidend für die Rubin-Architektur bleibt die Zusammenarbeit mit SK hynix bei der nächsten Speichergeneration, die auch in den Produktlinien RTX Spark und Jetson Thor zum Einsatz kommt.

Milliarden-Investitionen in Asien: KI-Fabriken für die Zukunft

NVIDIA treibt sein „AI Factory“-Modell massiv voran. Gleich drei Großprojekte in Asien wurden heute bekannt gegeben:

LG Group: Gemeinsam mit dem südkoreanischen Konzern entstehen KI-Fabriken für Robotik und autonomes Fahren. LG Electronics setzt dabei auf NVIDIAs Isaac-Sim- und Cosmos-Plattformen für seine CLOiD-Haushaltsroboter. LG Energy Solution entwickelt parallel 800-Volt-Gleichstromlösungen für die benötigte Infrastruktur.

SK Telecom: Der Telekommunikationsriese und NVIDIA planen eine Full-Stack-KI-Cloud in Südkorea. Ab 2027 soll eine Gigawatt-KI-Fabrik ans Netz gehen – ausgestattet mit Blackwell-GPUs und der DSX-Plattform für maximale Effizienz.

NAVER: Die südkoreanische Internetplattform tritt der Nemotron-Allianz bei und baut ihre souveräne KI-Infrastruktur aus. Los geht es mit einer 55-Megawatt-Anlage im GAK-Sejong-Rechenzentrum, später soll auf 1 GW hochskaliert werden. Die Infrastruktur wird ein „Seoul World Model“ auf Basis von NVIDIA Cosmos und eine verfeinerte Version des HyperCLOVA-X-Modells unterstützen.

Mit der rasanten Entwicklung leistungsstarker KI-Infrastrukturen steigen auch die Anforderungen an die betriebliche Compliance und Sicherheit. Dieser praxisnahe Report klärt auf, welche neuen Pflichten und Risikoklassen Unternehmen beim Einsatz moderner KI-Systeme jetzt unbedingt beachten müssen. Welche KI-Systeme gelten als Hochrisiko – und was müssen Unternehmen jetzt konkret tun?

Neue Modelle und Supercomputer für den Schreibtisch

Auch im Software-Bereich legt NVIDIA nach. Die Nemotron-3-Serie wurde veröffentlicht: Das Nemotron-3-Ultra-Modell mit 550 Milliarden Parametern (Mixture-of-Experts) senkt die Inferenzkosten für komplexe Aufgaben um 30 Prozent. Noch einen drauf setzt das Nemotron-3-Super mit 1,2 Billionen Gesamtparametern (120 Milliarden aktiv) und einer hybriden Mamba-MoE-Architektur.

Für Entwickler vor Ort gibt es die DGX Station für Windows – einen Schreibtisch-Supercomputer mit 72-Kern-Grace-CPU und 20 Petaflops FP4-Leistung. Das System kann Modelle mit bis zu einer Billion Parametern lokal ausführen und verfügt über 748 GB kohärenten Speicher. Partner wie ASUS, Dell und MSI sollen ab dem vierten Quartal 2026 ausliefern. Der Preis: rund 85.000 Euro.

Disclaimer zu unseren Artikeln: Keine Anlageberatung, keine Kauf- oder Verkaufsempfehlung. Angaben zu Kursen, Unternehmen und Märkten ohne Gewähr; Änderungen jederzeit möglich. Börsengeschäfte können zu hohen Verlusten führen. Unsere Beiträge werden ganz oder teilweise automatisiert mit Unterstützung von AI erstellt und geprüft.

de | wissenschaft | 69504719 |