Gemini 3.5 Flash: Google spart 45% Tokens, ist viermal schneller
27.05.2026 - 12:30:41 | boerse-global.deGoogle hat auf massive Kritik von Entwicklern reagiert und eine abgespeckte Version seines KI-Modells Gemini 3.5 Flash veröffentlicht. Die „Low"-Variante soll die hohen Token-Verbräuche eindämmen, die nach der jüngsten Entwicklerkonferenz für Frust gesorgt hatten.
Der Suchmaschinenriese reagiert damit auf wachsenden Unmut in der Entwickler-Community. Nutzer der Antigravity-Plattform hatten zuletzt immer wieder über „Quota Exceeded"-Fehlermeldungen geklagt – die strengen Nutzungelimits ließen oft nur wenige Anfragen zu, bevor das Kontingent erschöpft war.
Während Tech-Giganten wie Google ihre KI-Infrastruktur massiv ausbauen, fragen sich viele Anleger, wie sie am besten von dieser Revolution profitieren können. Dieser kostenlose Report analysiert die drei vielversprechendsten KI-Aktien, die aktuell als Grundsäulen des Marktes gelten. Exklusive Empfehlung der 3 Top-KI-Aktien jetzt kostenlos sichern
Weniger Tokens, gleiche Leistung
Das Problem war hausgemacht: Mit der Einführung der leistungsstärkeren Modelle Gemini 3.0 und 3.1 Pro im Frühjahr verbrauchten selbst einfache Anfragen Unmengen an Tokens. Varun Mohan von Google DeepMind räumte ein, dass das bisherige Standardmodell für banale Aufgaben oft überdimensioniert war.
Die neue „Low"-Stufe produziert rund 45 Prozent weniger Tokens als die bisherige Standardversion, die nun in „Medium" umbenannt wurde. Entscheidend: Trotz der Reduzierung bleiben Kernfunktionen wie System-Prompts und Kontextkompression erhalten. In ersten Tests soll die „Low"-Version bei speziellen Softwareentwicklungs-Aufgaben sogar besser abgeschnitten haben als der ältere Gemini 3 Flash, der jetzt die „High"-Stufe bildet.
Um den Umstieg zu erleichtern, hat Google die Token-Kontingente für alle Abonnement-Pläne der Antigravity-Umgebung zurückgesetzt. Erst kürzlich hatte der Konzern die Limits verneunfacht, um der hohen Nachfrage nach KI-gestützten Codierungstools gerecht zu werden.
Preiskampf mit OpenAI und Anthropic
Mit Gemini 3.5 Flash positioniert sich Google im direkten Wettbewerb mit Claude Opus 4.7 und GPT-5.5. Benchmark-Daten vom Mai 2026 zeigen eine klare Strategie: Das Flash-Modell soll als schnelle, kosteneffiziente Alternative zu den Spitzenmodellen dienen.
Die technischen Werte können sich sehen lassen: Gemini 3.5 Flash erreichte 83,6 Prozent im MCP-Atlas und 57,9 Prozent im Finance-Agent-v2-Benchmark. GPT-5.5 punktet zwar bei langen Kontexten (94,8 Prozent im MRCR-v2), doch Google setzt auf Geschwindigkeit – das Flash-Modell sei viermal schneller als die Konkurrenz.
Das Preisgefüge spricht eine deutliche Sprache:
| Modell | Input (pro Mio. Tokens) | Output (pro Mio. Tokens) |
|---|---|---|
| Gemini 3.5 Flash | 1,40 Euro | 8,40 Euro |
| Claude Opus 4.7 | 4,70 Euro | 23,40 Euro |
| GPT-5.5 | k.A. | 28,00 Euro |
Auch bei den Verbraucher-Abos gibt es Bewegung: Der Ultra-Plan fiel von 230 auf 93 Euro monatlich und bietet nun das Fünffache der Limits des 19-Euro-Pro-Plans. Alphabet vermeldete für das erste Quartal 2026 rund 350 Millionen zahlende Abonnenten.
Die größte Suchmaschinen-Revolution seit 25 Jahren
Hinter den Kulissen treibt Google eine grundlegende Neuerfindung der Suche voran. Am 19. Mai kündigte das Unternehmen die erste grundlegende Überarbeitung des Suchfelds seit einem Vierteljahrhundert an. Künftig sind deutlich längere Anfragen sowie der direkte Upload von Videos, Bildern und Dateien möglich.
Sogenannte „Information Agents" sollen personalisierte Ergebnisse liefern – etwa bei der Wohnungssuche oder Preisbeobachtung. Der Rollout beginnt im Sommer, zunächst für AI-Pro- und Ultra-Abonnenten.
Die tiefe Integration von KI in die Kernsuche kommt allerdings in einem gesellschaftlich angespannten Moment. Eine aktuelle Umfrage der New York Times und des Siena College ergab, dass 35 Prozent der Befragten die Entwicklung Künstlicher Intelligenz als überwiegend negativ für die Gesellschaft bewerten – nur 16 Prozent sehen sie positiv.
Der rasante technologische Fortschritt macht KI-Tools mittlerweile auch für den privaten Gebrauch unverzichtbar. Wie Sie Anwendungen wie ChatGPT ohne Vorkenntnisse für Ihre Reiseplanung oder Organisation nutzen, erfahren Sie in diesem praktischen Ratgeber. Kostenlosen PDF-Report mit fertigen ChatGPT-Prompts herunterladen
Vom Modellanbieter zum Infrastruktur-Giganten
Alphabets Strategie zeichnet sich immer deutlicher ab: Der Konzern will nicht länger nur KI-Modelle verkaufen, sondern zur zentralen Infrastruktur-Plattform werden. Die hauseigenen Tensor Processing Units (TPUs) werden bereits an externe Partner wie Meta und Anthropic ausgeliefert. Ein 4,7 Milliarden Euro schweres Joint Venture mit Blackstone soll die Rechenzentrums-Kapazitäten weiter ausbauen.
Die Branche erlebt derzeit gewaltige Kapitalverschiebungen: Anthropic sicherte sich ein 42 Milliarden Euro schweres Compute-Abkommen mit SpaceX, OpenAI bereitet angeblich einen Börsengang für September 2026 vor. Alphabets Aktie notiert bei rund 358 Euro und verzeichnete seit Jahresbeginn einen Zuwachs von über 21 Prozent.
Besonders beeindruckend: Ein Projekt, bei dem 93 KI-Agenten gemeinsam ein komplettes Betriebssystem in nur zwölf Stunden schrieben – Gesamtkosten: unter 1.000 Euro. Diese Fähigkeit fließt in Antigravity 2.0 ein, das Google nicht mehr als klassische Entwicklungsumgebung, sondern als „Agenten-Orchestrierungs-Plattform" vermarktet.
Ausblick
Während die Veröffentlichung von Gemini 3.5 Pro für Juni erwartet wird, liegt der Fokus zunächst auf der Stabilisierung des Flash-Modells. Die Einführung der „Low"-Stufe ist ein taktisches Eingeständnis: Rohe Rechenpower allein reicht nicht – sie muss mit effizientem Ressourcenmanagement einhergehen.
Marktforscher prognostizieren dem „agentic Commerce"-Markt – in dem KI-Agenten eigenständig Transaktionen durchführen und Recherchen übernehmen – ein Wachstum von rund 5,3 Milliarden Euro (2025) auf über 60 Milliarden Euro bis 2033. Google positioniert sich mit aggressiven Preisen und rasanter Iteration für einen bedeutenden Anteil an diesem Zukunftsmarkt. Weitere Modell-Updates werden noch vor Ende des zweiten Quartals erwartet.
So schätzen die Börsenprofis Aktien ein!
Für. Immer. Kostenlos.
