KI-Chips, Speicher

KI-Chips: Speicher wird zum neuen Flaschenhals der Industrie

26.05.2026 - 09:28:23 | boerse-global.de

HBM-Speicher wird zum limitierenden Faktor für KI-Chips. Preise explodieren, Produktion ist bis 2026 ausverkauft.

KI-Chips: Speicher wird zum neuen Flaschenhals der Industrie - Foto: über boerse-global.de
KI-Chips: Speicher wird zum neuen Flaschenhals der Industrie - Foto: über boerse-global.de

Während Nvidia-Chef Jensen Huang und AMD-CEO Lisa Su diese Woche in Taiwan um Produktionskapazitäten ringen, verschiebt sich der Flaschenhals für KI-Chips vom Gehäuse zum Speicher.

Vom Verpackungs- zum Speicherproblem

Lange Zeit galt die sogenannte CoWoS-Verpackungstechnologie als größte Hürde für die KI-Chip-Produktion. Doch das hat sich geändert. AMD-Chefin Lisa Su identifizierte am vergangenen Freitag High-Bandwidth Memory (HBM) als neuen limitierenden Faktor. Der Grund: Die hochspezialisierten Speicherchips der neuesten Generation HBM3E und des kommenden HBM4-Standards sind extrem aufwendig in der Herstellung.

Anzeige

Während die Hardware-Industrie mit Produktionsengpässen kämpft, stellt die EU bereits die rechtlichen Weichen für den Einsatz dieser Technologien. Welche neuen Pflichten und Risikoklassen Unternehmen beim Einsatz von KI-Systemen nun beachten müssen, erklärt dieser praxisnahe Leitfaden zum EU AI Act. Kostenlosen Umsetzungsleitfaden zur KI-Verordnung sichern

Die Zahlen sprechen eine deutliche Sprache: Pro Gigabyte verbraucht HBM3E etwa dreimal so viel Wafer-Kapazität wie herkömmlicher DDR5-Speicher. Die Folge sind explodierende Preise. Im ersten Quartal 2026 stiegen die DRAM-Preise um 90 bis 95 Prozent im Vergleich zum Vorquartal. Analysten erwarten für das laufende Quartal einen weiteren Anstieg um 58 bis 63 Prozent. Die Marktforscher von Gartner rechnen damit, dass die kombinierten Kosten für DRAM und SSDs bis Ende 2026 um 130 Prozent über dem Niveau von 2025 liegen werden.

AMD reagierte bereits: Am 21. Mai sicherte das Unternehmen der taiwanesischen KI-Lieferkette mehr als zehn Milliarden Euro zu. Zudem schloss AMD eine Vereinbarung mit Samsung über die Lieferung von HBM4-Speicher. Auch Micron meldet Fortschritte – die Produktion von HBM4 läuft eigenen Angaben zufolge doppelt so schnell an wie bei der Vorgängergeneration. Dennoch: Die gesamte HBM-Produktion für 2026 ist bereits ausverkauft, neue Fabriken werden frühestens Ende 2027 in Betrieb gehen.

Nvidia treibt den Zyklus an

Mit einem geschätzten Marktanteil von 78 Prozent dominiert Nvidia den KI-Accelerator-Markt. Doch das Unternehmen ruht sich nicht aus. Bei seinem Besuch in Taiwan am 23. Mai traf Jensen Huang TSMC-Chef C.C. Wei, um die Produktion für die kommende Vera-Rubin-Plattform zu sichern.

Dieses System, das für das dritte Quartal 2026 erwartet wird, verspricht einen gewaltigen Leistungssprung. Mit sechs Chips – darunter der Vera-Prozessor und der Rubin-Grafikchip – soll es die 3,5-fache Trainingsleistung und die 5-fache Inferenzleistung der aktuellen Blackwell-Generation bieten. TSMC will seine CoWoS-Kapazität von derzeit 35.000 Wafern pro Monat auf bis zu 140.000 Wafer bis Ende 2026 ausbauen. Nvidia hat sich bereits mehr als die Hälfte dieser Kapazität bis 2027 gesichert.

Die Dringlichkeit erklärt Huang mit dem Aufkommen der „agentischen KI“ – Systeme, die eigenständig denken und handeln können. Anders als frühere Modelle benötigen sie nicht nur Training, sondern vor allem kontinuierliche Rechenleistung. Nvidias jüngste Quartalszahlen unterstreichen den Trend: Der Umsatz erreichte 81,6 Milliarden Euro – ein Plus von 85 Prozent im Jahresvergleich. Allein das Rechenzentrumsgeschäft trug 75,2 Milliarden Euro bei.

Neue Spieler, neue Ansätze

Während Nvidia und AMD auf klassische GPU-Skalierung setzen, gehen andere Hersteller radikal neue Wege. Cerebras Systems meldete am 24. Mai, dass sein wafergroßer CS-3-Chip 981 Tokens pro Sekunde bei einem Modell mit einer Billion Parametern erreicht. Mit 850.000 Kernen auf einem einzigen 7-Nanometer-Wafer will das Unternehmen die Kommunikationsverzögerungen umgehen, die Multi-GPU-Cluster ausbremsen – und kommt auf eine fast siebenmal höhere Geschwindigkeit als herkömmlicher GPU-Clouds.

In China füllen einheimische Hersteller die Lücke, die US-Exportbeschränkungen gerissen haben. Nvidias Marktanteil für KI-Beschleuniger in China fiel von rund 95 Prozent auf nahe null. Hauptprofiteur ist Huawei: Dessen Ascend 950PR ging im März 2026 in Massenproduktion, der Umsatz mit KI-Chips soll in diesem Jahr zwölf Milliarden Euro erreichen.

Anzeige

Die rasante Entwicklung bei KI-Systemen wie der agentischen KI führt auch zu neuen Sicherheitsrisiken für Unternehmen. Dieser kostenlose Report klärt auf, wie Sie Ihr Unternehmen proaktiv absichern und gleichzeitig die neuen rechtlichen Pflichten im Bereich Cyber-Security erfüllen. Gratis-E-Book: Cyber-Security Bedrohungen abwenden

Auf der ISCAS-Konferenz am 25. Mai präsentierte Huawei zudem sein „Tau-Skalierungsgesetz“. Statt auf immer kleinere Transistoren setzt der Konzern auf „Zeitskalierung“ über mehrere Systemebenen hinweg – und verspricht damit eine chipdichte, die 1,4-Nanometer-Technologie bis 2031 entsprechen soll. Dass die Nachfrage in China enorm ist, zeigt der chinesische Hersteller Lisuan Tech: Mehr als 30.000 Einheiten seiner LX 7G100 Gaming-GPU verkaufte das Unternehmen innerhalb von 48 Stunden nach dem Start am 25. Mai – obwohl die Leistung nur mit älteren westlichen Mittelklassekarten vergleichbar ist.

Wirtschaftliche Sprengkraft

Der KI-Boom spaltet den Technologiemarkt. Während Hyperscaler wie Microsoft, Amazon und Meta hunderte Milliarden Euro in KI-Rechenleistung investieren, schrumpft das PC-Geschäft. Marktforscher warnen: Steigende Speicherkosten könnten das Segment unter 500 Euro bis 2028 vollständig verschwinden lassen. Für 2026 wird ein Rückgang der PC-Auslieferungen um 10,4 Prozent erwartet.

Auch die GPU-Miete wird teurer: Nvidia-Finanzchefin Colette Kress berichtete von einem Anstieg der H100-Mietpreise um 20 Prozent in diesem Jahr. Ein am 26. Mai veröffentlichter Datensatz zu 13.566 GPUs zeigt die langfristige Entwicklung: Während die Spitzenleistung in den letzten 19 Jahren um das 400-fache wuchs, stieg die thermische Verlustleistung (TDP) von 155 Watt im Jahr 2006 auf 1.400 Watt bei den neuesten Rechenzentrums-Beschleunigern. Die enorme Hitzeentwicklung verschärft Engpässe bei Netzwerk- und Kühlinfrastruktur.

Ausblick: Wird die KI-Revolution am Speicher scheitern?

Der unmittelbare Fokus der Branche liegt nun auf der Computex 2026 in Taipeh, wo weitere Details zur 2-Nanometer-Fertigung erwartet werden. AMD hat bereits den ersten 2-Nanometer-Hochleistungsprozessor, den EPYC Venice, bei TSMC in Serie produziert.

Nvidia prognostiziert für das zweite Quartal des Geschäftsjahres 2027 einen Umsatz von rund 91 Milliarden Euro – ein Zeichen, dass die Nachfrage nach KI-Hardware noch nicht ihren Höhepunkt erreicht hat. Doch die Marktkonzentration bleibt ein Problem: Die furchtbarsten KI-Chip-Designer verbrauchten 2025 mehr als 90 Prozent der globalen CoWoS- und HBM-Versorgung.

Ob die Branche den Sprung in die Ära der agentischen KI schafft, hängt entscheidend davon ab, ob Speicherhersteller wie SK Hynix, Samsung und Micron die HBM-Lücke schließen können. Ohne eine deutliche Ausweitung der Wafer-Kapazität für Speicher droht der nächste KI-Boom an der Hardware zu scheitern – noch bevor er richtig begonnen hat.

So schätzen die Börsenprofis Aktien ein!

<b>So schätzen die Börsenprofis Aktien ein!</b>
Seit 2005 liefert der Börsenbrief trading-notes verlässliche Anlage-Empfehlungen – dreimal pro Woche, direkt ins Postfach. 100% kostenlos. 100% Expertenwissen. Trage einfach deine E-Mail Adresse ein und verpasse ab heute keine Top-Chance mehr. Jetzt abonnieren.
Für. Immer. Kostenlos.
de | wissenschaft | 69419678 |