GPU-Preise brechen ein: Nvidia H100 kostet nur noch ein Viertel
27.05.2026 - 11:20:38 | boerse-global.deNach Jahren der Knappheit zeichnet sich nun ein deutliches Überangebot an Rechenleistung ab – mit weitreichenden Folgen für die Branche.
Marktsättigung trifft ältere Hardware hart
Der Sekundärmarkt für Hochleistungsrechner erlebt eine kräftige Preiskorrektur. Für die Nvidia H100, die auf dem Höhepunkt der Knappheit 2023 noch fast acht Dollar pro Stunde kostete, verlangen spezialisierte Anbieter inzwischen nur noch zwischen 1,49 und 1,99 Dollar pro GPU-Stunde. Selbst die aktuellere H200 ist im Preis gefallen: Sie wird derzeit für etwa drei bis vier Dollar pro GPU-Stunde vermietet.
Während die Hardware-Preise fallen, verschärfen sich die regulatorischen Anforderungen für den Einsatz von Künstlicher Intelligenz in Unternehmen massiv. Dieser kostenlose Umsetzungsleitfaden bietet einen kompakten Überblick über alle neuen Pflichten und Fristen der EU-KI-Verordnung. EU AI Act in 5 Schritten verstehen: Jetzt kostenlosen Ratgeber sichern
Besonders hart trifft es die sogenannten "Neo-Cloud"-Anbieter wie CoreWeave und Lambda Labs. Sie spürten den Preisdruck zuerst. Große Hyperscaler wie Amazon Web Services (AWS) mussten ebenfalls nachziehen – ihre Preise liegen aber immer noch drei- bis sechsmal höher als die der unabhängigen Anbieter.
Der Grund für das Überangebot ist ein klassischer Peitscheneffekt in der Lieferkette. Rechenzentren, die in den Jahren 2024 und 2025 geplant wurden, gehen nun gleichzeitig ans Netz. Dazu kommt die Einführung der Blackwell B200-Serie, die drei- bis viermal effizienter arbeitet als ihre Vorgänger.
Gigantische Investitionen trotz fallender Preise
Die Investitionen in die globale Infrastruktur bleiben enorm. Laut BloombergNEF steuern die 14 größten Rechenzentrumsbetreiber 2026 auf Investitionsausgaben von rund 750 Milliarden Euro zu. Über 23 Gigawatt Kapazität sind derzeit im Bau.
Doch Marktforscher warnen: Die Kombination aus sinkenden Mieteinnahmen und hohen Schuldenlasten könnte bei sekundären Anbietern zu einem Investitionsstopp führen, falls die Margen weiter schrumpfen.
Kundenspezifische Chips brechen Nvidias Monopol
Während Nvidia weiterhin dominant ist, verändert ein Trend die Preislandschaft grundlegend: Immer mehr große Technologiekonzerne setzen auf eigene Spezialchips (ASICs). TrendForce zufolge werden die Auslieferungen kundenspezifischer KI-Chips 2026 um 44,6 Prozent wachsen – deutlich stärker als die 16,1 Prozent bei Standard-GPUs. Bis Jahresende könnten ASIC-basierte KI-Server fast 28 Prozent aller Serverlieferungen ausmachen.
Der wirtschaftliche Anreiz ist gewaltig: ASICs bieten bei sogenannten Inferenzaufgaben Kostenvorteile von 40 bis 65 Prozent. Ein Paradebeispiel ist das Bild-KI-Unternehmen Midjourney, das seine monatlichen Rechenkosten von umgerechnet etwa zwei Millionen Euro auf rund 650.000 Euro senkte – durch den Wechsel zu Googles Tensor Processing Units (TPUs).
Neue Technologien und Gesetze verändern die IT-Landschaft für Unternehmen in rasantem Tempo und bringen neue Sicherheitsrisiken mit sich. Erfahren Sie in diesem kostenlosen Report, welche rechtlichen Pflichten und Cyber-Bedrohungen Unternehmer jetzt unbedingt kennen müssen. Gratis-E-Book: Cyber-Risiken und neue Gesetze im Überblick
Die Spezialisten für kundenspezifische Chips melden Rekordzahlen. Broadcom erzielte im ersten Quartal 2026 einen KI-Halbleiterumsatz von rund 7,8 Milliarden Euro – ein Plus von 106 Prozent im Jahresvergleich. Marvell verbuchte für 2025 etwa 1,4 Milliarden Euro Umsatz mit KI-ASICs, und MediaTek erwartet für das vierte Quartal 2026 allein rund 1,9 Milliarden Euro. Der Chef von Alchip prognostiziert, dass der globale ASIC-Umsatz von umgerechnet 12 Milliarden Euro im Jahr 2024 auf über 140 Milliarden Euro bis 2030 steigen könnte.
Nächste Hardware-Generation: Mehr Leistung, höhere Kosten
Die Branche blickt gespannt auf die GTC Taipei am 1. Juni. Im Fokus steht Nvidias Vera-Rubin-Plattform mit HBM4-Speicher. Sie soll pro GPU die 3,5-fache Trainingsleistung und die fünffache Inferenzleistung im Vergleich zur Blackwell-Generation bieten.
Doch die Leistungssteigerung hat ihren Preis. Eine Analyse von Morgan Stanley zeigt, dass ein Vera-Rubin-NVL72-Rack mit Materialkosten von umgerechnet rund 7,3 Millionen Euro zu Buche schlägt – 95 Prozent mehr als die GB200-Systeme.
Bemerkenswert: Die GPU ist nicht mehr der alleinige Kostentreiber. Der Speicher macht inzwischen 26 Prozent der Systemkosten aus, während der Wert von Leiterplatten und Verbindungstechnik im Jahresvergleich gestiegen ist. Auch Kühlung und Stromversorgung beanspruchen einen wachsenden Anteil.
Die Nachfrage der ganz Großen bleibt dennoch ungebrochen. AWS hat ab 2026 den Einsatz von über einer Million Nvidia-GPUs zugesagt, Meta soll Millionen Chips der Blackwell- und Rubin-Architektur gesichert haben. Nvidia-Chef Jensen Huang reiste am 23. Mai nach Taipeh, um mit TSMC die Ausweitung der CoWoS-Packaging-Kapazitäten von rund 80.000 auf bis zu 140.000 Wafer pro Monat bis Ende 2026 zu koordinieren.
Finanzielle Schieflage und Governance-Probleme
Die rasante Marktveränderung hinterlässt ein gespaltenes Bild. Applied Digital sicherte sich einen 15-Jahres-Vertrag über umgerechnet sieben Milliarden Euro – das gesamte Vertragsbasiseinkommen steigt damit auf rund 29 Milliarden Euro. Doch einige der am schnellsten wachsenden KI-Infrastrukturfirmen ächzen unter Schulden. CoreWeave meldete für das erste Quartal 2026 zwar einen Umsatz von 1,9 Milliarden Euro (Vorjahr: 914 Millionen), aber einen Nettoverlust von 689 Millionen Euro – verursacht durch 499 Millionen Euro Zinsaufwendungen.
Auch die Unternehmensführung gerät unter Druck. Vor seinem erwarteten Börsengang legte SpaceX eine GPU-Leasingvereinbarung über umgerechnet 18,6 Milliarden Euro mit Valor Equity offen. Die Wirtschaftsprüfer von PwC sehen darin wirtschaftlich eher einen Kredit und identifizierten rund 8,4 Milliarden Euro Schulden, die in der SpaceX-Bilanz auftauchen müssen.
In der Software-Ebene verschärft DeepSeek den Preiskampf. Das chinesische Unternehmen kündigte deutliche Senkungen seiner API-Preise an. Durch spezielle Architekturen reduziert DeepSeek den Rechenaufwand für Inferenz auf 27 Prozent früherer Generationen – und kann so zu einem Bruchteil der Konkurrenzpreise anbieten.
Ausblick: GPU-Futures als neue Anlageklasse
Während Rechenleistung zunehmend zur Massenware wird, bereiten sich die Finanzmärkte auf die nächste Reifephase vor. Die Intercontinental Exchange (ICE) und die CME Group planen offenbar die Einführung von GPU-Futures. BlackRock-Führungskräfte sprechen bereits von der Geburt einer neuen Anlageklasse. Diese Finanzinstrumente sollen Transparenz in einen Markt bringen, der traditionell von wenigen Hyperscalern dominiert wird.
Die Prognosen für den Rest des Jahrzehnts bleiben ambitioniert. Nvidia-Finanzchefin Colette Kress erwartet, dass die Investitionsausgaben der Hyperscaler bis 2027 die Billionen-Euro-Marke überschreiten und bis 2030 auf vier Billionen Euro steigen könnten. Der Markt bewegt sich in eine Ära, in der nicht mehr rohe Rechenleistung zählt, sondern die Kosten pro Token. Die Frage ist: Werden die massiven Infrastrukturprojekte oder die Effizienzgewinne kundenspezifischer Chips die langfristige Preisstabilität bestimmen?
So schätzen die Börsenprofis Aktien ein!
Für. Immer. Kostenlos.
