Amazon, EC2

Amazon EC2 G7: NVIDIA-GPUs mit 4,6× höherer KI-Leistung

26.06.2026 - 02:42:59 | boerse-global.de

Amazon und NVIDIA lancieren EC2 G7 Instances mit Blackwell-GPUs und integrieren cuVS für schnellere Vektorsuche in der Cloud.

NVIDIA und AWS: Neue KI-Instanzen mit Blackwell-GPUs
Amazon - Moderne Rechenzentrums-Gasse mit blau-grün leuchtenden Server-Racks, Symbol für KI, Cloud-Computing und Hightech-Integration. 26.06.2026 - Bild: über boerse-global.de

Mit speziellen Hardware-Instanzen und optimierten Software-Tools wollen die Unternehmen die Produktion Künstlicher Intelligenz revolutionieren.

Neue Blackwell-GPUs für Amazon Cloud

Am 24. Juni 2026 stellten die Partner die Amazon EC2 G7 Instances vor. Diese basieren auf NVIDIAs RTX PRO 4500 Blackwell-GPUs und sind speziell für KI-Inferenz und grafikintensive Aufgaben konzipiert. Die Leistungsdaten sind beeindruckend: Im Vergleich zur Vorgängergeneration G6 erreichen die neuen Instanzen eine 4,6-mal höhere KI-Inferenzleistung und eine 2,1-mal schnellere Grafikperformance.

Die G7-Instanzen unterstützen Konfigurationen mit bis zu acht GPUs und 256 GB GPU-Speicher. Zur technischen Ausstattung gehören 700 Gbps Elastic Fabric Adapter (EFA)-Netzwerk und 7,6 TB lokaler NVMe-Speicher. Seit dem 18. Juni 2026 sind die Instanzen in den AWS-Regionen US East (Ohio) und US West (Oregon) verfügbar. Bare-Metal-Optionen sollen später folgen.

Schnellere Vektorsuche für KI-Anwendungen

Ein zentraler Bestandteil der erweiterten Partnerschaft ist die Integration der NVIDIA-Bibliothek cuVS als Standard für die Vektor-Indexierung in Amazon OpenSearch Serverless. Diese Software-Integration soll die Entwicklung von Vektordatenbanken im Milliarden-Maßstab vereinfachen – eine Grundvoraussetzung für Retrieval-Augmented Generation (RAG) in KI-Anwendungen.

Branchenexperten zufolge ermöglicht dieser Schritt eine zehnmal schnellere Indexierung bei etwa einem Viertel der Kosten herkömmlicher CPU-basierter Verfahren. Unternehmen können damit große Vektordatenbanken in weniger als einer Stunde aufbauen. Die Integration ist Teil einer umfassenden Strategie, KI-Infrastrukturen zu vereinfachen und die Energieeffizienz zu verbessern.

Anzeige

Die neuen G7-Instances liefern 4,6× mehr KI-Inferenzleistung – doch welche Konfiguration passt zu Ihrem Workload? Der Leitfaden zeigt Schritt für Schritt, wie Sie die optimale Instanz wählen, cuVS für Vektorsuche integrieren und die Kosten im Vergleich zur G6 berechnen. Jetzt kostenlosen Leitfaden anfordern

Einheitliche KI-Steuerung und nächste Trainingsgeneration

Auf der GTC 2026 präsentierten die Partner zudem eine einheitliche KI-Steuerungsebene. Sie integriert die NVIDIA AI Enterprise-Softwaresuite – darunter NIM, NeMo und RAPIDS – mit AWS-Diensten. Diese Umgebung bietet einheitliches Cluster-Provisioning, Sicherheit und Observability über alle Cloud-Ressourcen hinweg.

Ebenfalls neu: die EC2 P8 Instances mit NVIDIAs Vera Rubin GPUs. Sie bieten eine 2,5-fache Trainingsdurchsatzrate im Vergleich zur Vorgängergeneration P7 und eine GPU-zu-GPU-Bandbreite von 1,8 TB/s. Ergänzend kündigte AWS neue G6g-Instances an, die NVIDIA L4 GPUs mit AWS Graviton4-Prozessoren kombinieren.

Strategische Positionierung und Marktausblick

Anzeige

Vektordatenbanken in Milliarden-Größe in unter einer Stunde aufbauen – mit cuVS in OpenSearch Serverless. Der Praxis-Leitfaden erklärt, wie Sie die zehnmal schnellere Indexierung nutzen und Kosten um 75 % senken. Leitfaden zur Vektorsuche jetzt sichern

AWS hat offiziell den NVIDIA Exemplar Cloud-Status für die Verarbeitung von GB300-Trainingsworkloads erhalten. Im Rahmen seiner langfristigen Infrastrukturstrategie plant AWS, im Laufe des Jahres 2026 mehr als eine Million NVIDIA-GPUs weltweit einzusetzen.

Die Entwicklungen kommen zu einem Zeitpunkt, an dem NVIDIAs Marktkapitalisierung am 23. Juni 2026 rund 4,88 Billionen Euro erreichte. Die vertiefte Zusammenarbeit zielt darauf ab, KI-Produktion effizienter zu gestalten – insbesondere durch besseres Wärmemanagement und die Bewältigung von Skalierungskomplexitäten in Hochleistungsrechenumgebungen.

de | wissenschaft | 69628630 |