Gemini 3.5 Flash: Google unterbietet Claude um 70% bei Kosten

29.05.2026 - 14:25:27 | boerse-global.de

Google stellt mit Gemini 3.5 Flash ein schnelleres und günstigeres KI-Modell vor, das explodierende Token-Kosten senken soll.

Fletcher Building: A$53,8 Mio. für Melbourne-Grundstück - Foto: über boerse-global.de

Der Suchmaschinenriese reagiert auf explodierende Kosten für Künstliche Intelligenz in der Wirtschaft.

Viele Unternehmen überschreiten bereits ihre Jahresbudgets für KI-Token – ein Problem, das Google nun mit seinem neuen Modell Gemini 3.5 Flash adressieren will. Vorgestellt wurde der Dienst Anfang Mai auf der Entwicklerkonferenz Google I/O. Die Strategie: nicht länger nur auf reine Modellgröße setzen, sondern auf Geschwindigkeit und Kosteneffizienz.

Günstiger und schneller als die Konkurrenz

Anzeige: Wer die 70% Kosteneinsparung von Gemini 3.5 Flash realistisch bewerten will, braucht einen klaren Vergleich: Wo Flash glänzt und wo Opus unverzichtbar bleibt – inklusive Halluzinations-Risiko. Jetzt kostenlosen KI-Kosten-Report anfordern

Gemini 3.5 Flash soll nach Angaben des Konzerns viermal schneller sein als andere führende KI-Systeme. Die Preisgestaltung unterstreicht den Kurs: 1,50 Euro pro Million Tokens für Eingaben, 9,00 Euro für Ausgaben. Zum Vergleich: Das Konkurrenzmodell Claude Opus 4.8 von Anthropic kostet 5,00 Euro für Eingaben und 25,00 Euro für Ausgaben pro Million Tokens – ein deutlicher Unterschied.

Die Entwicklung hin zu kleineren, schnelleren Modellen ist kein Zufall. Googles Führungsspitze erkennt, dass das reine Modell nicht mehr das alleinige Produkt ist. Vielmehr verschiebt sich der Fokus auf Infrastruktur und Inferenz-Effizienz. Interne Daten des Konzerns zeigen, dass der hauseigene Programmier-KI-Assistent Antigravity 2.0 seinen Token-Verbrauch wöchentlich verdoppelt. Der Bedarf an günstiger Massenverarbeitung wächst rasant.

Leistungsvergleich: Stärken und Schwächen

In technischen Tests zeigt Gemini 3.5 Flash klare Stärken bei spezifischen Aufgaben. Beim sogenannten Tool-Use-Benchmark liegt das Google-Modell mit 83,6 Prozent knapp vor Claude Opus 4.8 mit 82,2 Prozent. Auch bei Finanz-Aufgaben schneidet Flash besser ab – hier erreicht es 57,9 Prozent Genauigkeit.

Doch in puncto Zuverlässigkeit und komplexen Software-Entwicklungsaufgaben hat Anthropic die Nase vorn. Beim SWE-bench Pro erzielt Opus 4.8 stolze 69,2 Prozent, Gemini 3.5 Flash kommt nur auf 55,1 Prozent. Zudem soll das neue Anthropic-Modell viermal seltener Programmierfehler übersehen als sein Vorgänger.

Die aktuelle Empfehlung von Branchenexperten: Flash für schnelle, parallele Aufgaben in großem Volumen nutzen, Opus 4.8 dagegen für die Steuerung und Orchestrierung komplexer Workflows.

Zweifel an der Zuverlässigkeit

Trotz der Geschwindigkeits- und Kostenvorteile gibt es Bedenken. Google hat bei der Vorstellung von Gemini 3.5 Flash keine konkreten Zahlen zu Halluzinationen oder sogenanntem Sycophancy-Verhalten genannt – also der Neigung von KI, Nutzern auch dann zuzustimmen, wenn diese falsch liegen.

Anzeige: CTOs, die bereits Budgets für KI-Token überschreiten, müssen jetzt auf kosteneffiziente Modelle setzen – aber nicht blind. Der Report zeigt, wie Sie Flash für Massenverarbeitung nutzen, ohne in die 61%-Halluzinationsfalle zu tappen. Kostenoptimierungs-Report jetzt sichern

Während das interne Modell Gemini 3 Pro bei Faktenchecks auf 68,8 Prozent Genauigkeit kommt und bei suchbasierten Fakten auf 83,8 Prozent, schätzen externe Forscher die Halluzinationsrate von Gemini 3.5 Flash auf alarmierende 61 Prozent.

Peinliche Pannen gab es zuletzt auch bei Googles AI Overview-Funktion. Nutzer berichteten von Fehlern, bei denen die KI behauptete, das Wort „Google“ enthalte zwei „P“ und „Gemini“ zwei „M“. In anderen Fällen behandelte das System das Wort „disregard“ als Systembefehl und produzierte Rechtschreibfehler bei prominenten Persönlichkeiten.

Google räumt ein, dass das Zählen von Buchstaben und der Umgang mit sprachlichen Nuancen bekannte Schwächen großer Sprachmodelle seien. Das Unternehmen kündigte an, im Juni 2026 umfassende Sicherheitsbewertungen für die 3.5er-Serie zu veröffentlichen.

So schätzen die Börsenprofis Aktien ein!

Seit 2005 liefert der Börsenbrief trading-notes verlässliche Anlage-Empfehlungen – dreimal pro Woche, direkt ins Postfach. 100% kostenlos. 100% Expertenwissen. Trage einfach deine E-Mail Adresse ein und verpasse ab heute keine Top-Chance mehr. Jetzt abonnieren.
Für. Immer. Kostenlos.

de | wissenschaft | 69441486 |