OpenAI senkt Betriebskosten um über 50%: Software-Trick spart Milliarden
01.07.2026 - 01:05:26 | boerse-global.de
Der Durchbruch gelang dem Unternehmen im Juni 2026 durch reine Software-Optimierungen – ohne neue Hardware. Das spart Milliarden.
Effizienz-Sprung bei ChatGPT
Die Optimierung betrifft vor allem den Gastzugang zu ChatGPT, dem Vorzeige-Chatbot des Unternehmens. Statt Tausender Nvidia-Grafikprozessoren benötigt OpenAI für diesen Traffic nun nur noch einige hundert Einheiten. Möglich macht das eine verbesserte Server-Auslastung.
Branchenkenner vermuten hinter dem Erfolg Techniken wie Quantisierung, KV-Caching und effizienteres Batching. Diese Methoden pressen mehr Leistung aus der vorhandenen Hardware – ohne auf die nächste Chip-Generation warten zu müssen.
Der Zeitpunkt könnte kaum besser sein. OpenAI meldete für das erste Quartal eine Bruttomarge von 39 Prozent und peilt bis Jahresende 52 Prozent an. Bei jährlichen Milliardenausgaben für den Betrieb der Modelle bedeutet die Halbierung der Kosten einen gewaltigen Schritt in Richtung Profitabilität.
Während OpenAI die Effizienz seiner Modelle im Hintergrund optimiert, können auch Privatanwender ChatGPT deutlich effektiver nutzen. Wie Sie die KI ohne Vorkenntnisse als praktischen Helfer für Ihre tägliche Organisation einsetzen, zeigt dieser kostenlose Ratgeber. Urlaub planen, Sprachen lernen, Zeit sparen: So erledigt ChatGPT Ihre Alltagsaufgaben in Sekunden
Wettlauf um effizientere KI
OpenAI ist nicht allein auf diesem Feld. Der chinesische Konkurrent DeepSeek veröffentlichte kürzlich eine Open-Source-Methode, die die Rechengeschwindigkeit um 60 bis 85 Prozent steigert.
Eigenes Terrain bebaute OpenAI im Juni 2026 mit dem Start von GPT-5.6 Sol. Das Modell erscheint in drei Varianten: Sol, Terra und Luna. Die Spitzenversion Sol Ultra erreichte im Benchmark Terminal-Bench 2.1 beachtliche 91,9 Prozent.
Eigener Chip als nächster Schritt
Trotz der Software-Erfolge auf Nvidia-Hardware setzt OpenAI weiter auf Diversifizierung. Am 25. Juni 2026 präsentierte das Unternehmen den "Jalapeño"-Chip – ein gemeinsam mit Broadcom entwickelter Prozessor. Ziel: die Inferenzkosten im Vergleich zu Standard-KI-GPUs um 30 bis 50 Prozent zu senken. Die ersten Rack-Deployments sind für Ende 2026 geplant.
Viele Menschen nutzen KI-Modelle wie ChatGPT bereits regelmäßig, kennen aber nur einen Bruchteil der Möglichkeiten. Dieser neue Gratis-Report enthüllt die praktischsten Tricks und Befehle, mit denen Sie im Alltag sofort Zeit sparen können. Diese einfachen ChatGPT-Befehle kennen die wenigsten – jetzt kostenlos herunterladen
Nvidia verliert Terrain
Die Entwicklungen spiegeln einen grundlegenden Wandel im KI-Chip-Markt wider. Nvidias Marktanteil fiel von 87 Prozent (2022) auf 75 Prozent (2026). Konkurrenten wie Anthropic setzen zunehmend auf Alternativen: Googles TPUs fürs Training, Amazons Trainium für die Inferenz. Nvidia-GPUs landen dort nur noch auf Platz drei.
Ein weiterer Rückschlag für Nvidia: Am 30. Juni 2026 wurde bekannt, dass der Konzern seinen ursprünglichen Vier-Chip-Beschleuniger Rubin Ultra gestrichen hat. Stattdessen kommt eine Zwei-Chip-Version.
Broadcom profitiert derweil massiv. Der KI-Halbleiterumsatz des Unternehmens erreichte annualisiert 8,4 Milliarden Euro – ein Plus von 106 Prozent. Haupttreiber: kundenspezifische Chips, wie die Partnerschaft mit OpenAI.
