NVIDIA Nemotron 3 Ultra: Fünffach höherer Durchsatz bei KI-Agenten
04.06.2026 - 19:39:33 | boerse-global.de
NVIDIA stellt mit Nemotron 3 Ultra ein KI-Modell für komplexe Unternehmensaufgaben vor.
Der US-Chipkonzern hat am Mittwoch auf der Computex 2026 in Taipeh sein neuestes Flaggschiff-Modell präsentiert. Nemotron 3 Ultra setzt auf eine Mixture-of-Experts-Architektur mit rund 550 Milliarden Parametern – von denen bei jeder Aufgabe jedoch nur 55 Milliarden aktiv sind. Das Besondere: Das Modell ist speziell für langlebige KI-Agenten und komplexe Workflows in Unternehmen optimiert.
Während NVIDIA die technische Basis für komplexe KI-Agenten liefert, müssen Unternehmen auch die rechtlichen Rahmenbedingungen im Blick behalten. Dieser kostenlose Leitfaden bietet einen kompakten Überblick über alle Anforderungen, Pflichten und Fristen der EU-KI-Verordnung. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt
Fünffach höherer Durchsatz
Die technischen Neuerungen sind beachtlich. Dank einer hybriden Mamba-Transformer-Architektur und der neuen NVFP4-Präzision erreicht Nemotron 3 Ultra einen fünfmal höheren Inferenzdurchsatz als bisherige Standards. Gleichzeitig sinken die Betriebskosten um bis zu 30 Prozent.
Für das Training griff NVIDIA auf mehr als zehn verschiedene Lehrermodelle zurück. Insgesamt flossen 212 Milliarden Token neuer Daten in die Entwicklung – darunter umfangreiche Datensätze aus GitHub, Wikipedia und juristischen Dokumenten. Hinzu kamen zehn Millionen neue überwachte Feinabstimmungsbeispiele und eine Million Verstärkungslernaufgaben in 15 verschiedenen Umgebungen.
Starke Leistung bei Benchmarks
Die Ergebnisse können sich sehen lassen. Beim SWEBench Verified-Benchmark erzielte das Modell zwischen 65 und 70,4 Prozent. Weitere interne Werte: 91 Prozent bei PinchBench, 82 Prozent bei IFBench und eine Erfolgsquote von 95 Prozent beim Ruler-Benchmark bei einem Kontextfenster von einer Million Token.
Breite Partnerunterstützung
Mehrere Softwarepartner haben bereits am Mittwoch ihre Unterstützung für das neue Modell angekündigt. Eigen AI bietet Inferenz-Unterstützung für die gesamte Nemotron-3-Familie, optimiert für Blackwell-GPUs. Aible integriert Nemotron 3 Ultra in seine AibleClaw-Plattform und nutzt es als Lehrermodell für kleinere Varianten. Microsoft bestätigte, dass Nemotron 3 Ultra ab Juni 2026 auf Microsoft Foundry verfügbar sein wird.
Die rasante Entwicklung bei Modellen wie Nemotron 3 Ultra stellt Unternehmen vor neue Herausforderungen bei der IT-Sicherheit und Compliance. Erfahren Sie in diesem kostenlosen Report, welche rechtlichen Pflichten und Cyberrisiken Unternehmer im Zeitalter von KI jetzt kennen müssen. Neue KI-Gesetze, neue Cyberrisiken: Was kommt wirklich auf Ihr Unternehmen zu?
Neue Ära für KI-Agenten
NVIDIA geht jedoch noch einen Schritt weiter. Bereits am Dienstag stellte das Unternehmen mit NemoClaw ein offenes Framework vor, das Industrieunternehmen wie Siemens, Cadence, Dassault Systèmes und Synopsys den bau autonomer KI-Ingenieure ermöglicht. Diese Agenten sollen komplexe Aufgaben wie RTL-Verifikation und 3D-Simulationen erledigen – und das in Stunden statt Wochen.
In der Fertigung setzt Foxconn bereits ein Multi-Agenten-System namens MoMClaw ein, das auf DGX-Station-GB300-Hardware läuft. Cooler Master und Spingence berichten von einer Fehlererkennungsrate von 99,6 Prozent und um 60 Prozent verkürzten Entwicklungszyklen.
Drei neue Modelle für Physical AI
Parallel dazu präsentierte NVIDIA Research auf der CVPR 2026 drei weitere Modelle für Physical AI:
- GraspGen-X: Ein Basismodell für robotisches Greifen, trainiert auf zwei Milliarden simulierten Interaktionen.
- LCDrive: Ein Modell für autonomes Fahren, das den Token-Verbrauch um rund 50 Prozent senkt.
- NitroGen: Ein Modell für verkörperte Agenten, trainiert auf 40.000 Stunden Spielzeit aus über 1.000 Titeln – mit einer Leistungssteigerung von bis zu 52 Prozent in virtuellen Umgebungen.
NVIDIA bestätigte zudem, dass die Vera-Rubin-Architektur nun in voller Produktion ist und die Spectrum-X-Photonik-Netzwerkkomponenten ausgeliefert werden.
So schätzen die Börsenprofis Aktien ein!
Für. Immer. Kostenlos.
