Gemini 3.5 Flash: Google senkt KI-Kosten um bis zu 75 Prozent

Veröffentlicht: 30.05.2026 um 04:40 Uhr, Redaktion boerse-global.de

Google präsentiert mit Gemini 3.5 Flash ein KI-Modell, das Unternehmenskosten senken soll. Der Konzern investiert massiv in die Zukunft.

Gemini 3.5 Flash: Google senkt KI-Kosten um bis zu 75 Prozent Illustration mit AI erstellt übermittelt durch boerse-global.de

Beim Entwickler-Event Google I/O 2026 präsentierte der Konzern am Donnerstag den Gemini 3.5 Flash als Antwort auf ein drängendes Problem: Immer mehr Unternehmen sprengen ihre KI-Budgets bereits im Mai eines Jahres.

Strategischer Wandel: Vom Rechenriesen zum Kostenoptimierer

Der Launch markiert einen grundlegenden Kurswechsel. Statt nur auf rohe Rechenleistung zu setzen, rückt Google die Gesamtbetriebskosten für Geschäftskunden in den Fokus. CEO Sundar Pichai spricht vom Beginn der „agentischen Gemini-Ära" – einer Zeit, in der KI-Systeme dauerhaft komplexe Arbeitsabläufe eigenständig managen.

Anzeige: Wer die explodierenden KI-Infrastrukturkosten in den Griff bekommen will, findet in diesem Report die entscheidenden Hebel – vom Kostenvergleichsrechner bis zur konkreten Checkliste für die Modell-Migration. Jetzt kostenlosen Report anfordern

Googles Strategie: ein abgestufter Ansatz. Großkunden in der Cloud könnten demnach jährlich über eine Milliarde Euro sparen, wenn sie rund 80 Prozent ihrer KI-Aufgaben auf eine Mischung aus Gemini 3.5 Flash und anderen effizienten Modellen verlagern. Branchenanalysten von William Blair sehen Google mit einem Kostenvorteil von 50 bis 75 Prozent gegenüber der Konkurrenz – maßgeblich dank eigener Tensor-Processing-Units (TPUs) und integrierter Rechenzentren.

Die Preise für das neue Modell: 1,50 Euro pro Million Input-Tokens, 0,15 Euro für gecachte Tokens und 9,00 Euro pro Million Output-Tokens. Das ist zwar das Dreifache der Vorgängergeneration, doch das Modell bewältigt deutlich komplexere Aufgaben.

Technische Spitzenwerte und globale Integration

Gemini 3.5 Flash ist ab sofort das Standardmodell für die Gemini-App und den KI-Modus in der Google-Suche weltweit. Bei technischen Tests erzielte das Modell Spitzenwerte: 47,1 Prozent im APEX-Agents-AA-Benchmark und 84 Prozent im MMMU-Pro. Zwar liegt es in spezifischen Programmier- und Wissenskategorien hinter der absoluten Spitze zurück, punktet aber mit Geschwindigkeit und niedriger Latenz.

Die Dimensionen von Googles KI-Operationen sind gewaltig: 3,2 Billiarden Tokens pro Monat – ein Anstieg um das Siebenfache gegenüber dem Vorjahr. 8,5 Millionen Entwickler arbeiten inzwischen mit Gemini-Modellen, die Gemini-App selbst zählt 900 Millionen monatlich aktive Nutzer.

Dauerhafte KI-Agenten: Der nächste Schritt

Mit Gemini Spark präsentierte Google einen persönlichen KI-Agenten, derzeit in der Beta-Phase für AI-Ultra-Abonnenten in den USA. Der entscheidende Unterschied zu herkömmlichen Chatbots: Spark läuft permanent auf cloudbasierten virtuellen Maschinen und arbeitet selbst dann weiter, wenn das lokale Gerät ausgeschaltet ist.

Der Agent automatisiert Routineaufgaben in Google Workspace – von der Terminplanung über die E-Mail-Suche bis zur Dateiorganisation in Drive und Docs. Bis zu 15 Aufgaben gleichzeitig kann das System bewältigen. Ein Trend, den auch die Konkurrenz bestätigt: Erst kürzlich erklärte der Präsident von OpenAI, dass eigenständige Modelle nicht mehr das Hauptprodukt seien – die Zukunft gehöre integrierten Agenten-Diensten.

Anzeige: Ihr KI-Budget ist bereits im Mai ausgeschöpft? Dann brauchen Sie jetzt eine strukturierte Kostenoptimierung. Dieser Report zeigt, wie Sie mit Gemini 3.5 Flash Ihre Gesamtbetriebskosten um bis zu 75% senken – Schritt für Schritt. Kostenoptimierungs-Report jetzt sichern

Milliarden-Investitionen in die KI-Zukunft

Um diesen Wandel zu stemmen, erhöht Google seine Investitionen massiv. Für 2026 sind Kapitalausgaben zwischen 180 und 190 Milliarden Euro geplant – fast sechsmal so viel wie 2022. Das Geld fließt in globale KI-Infrastruktur und die Produktion eigener Chips.

Neben Gemini 3.5 Flash zeigte Google auch Gemini Omni, ein Modell, das Inhalte in Text, Bild, Audio und Video verarbeiten und bearbeiten kann. Die multimodale Funktion wird schrittweise für höherwertige Abonnenten freigeschaltet und in Plattformen wie YouTube Shorts integriert.

Disclaimer zu unseren Artikeln: Keine Anlageberatung, keine Kauf oder Verkaufsempfehlung. Angaben zu Kursen, Unternehmen und Märkten ohne Gewähr; Änderungen jederzeit möglich. Börsengeschäfte können zu hohen Verlusten führen. Unsere Beiträge werden ganz oder teilweise automatisiert mit Unterstützung von AI erstellt und geprüft.

de | wissenschaft | 69446013 |