Gemini 3.5 Flash: Google-KI steuert eigenständig Computer
28.06.2026 - 20:27:03 | boerse-global.de
Google rüstet sein KI-Modell Gemini 3.5 Flash auf: Es kann künftig eigenständig Computer bedienen, Webseiten navigieren und Programme steuern. Die neue Funktion markiert einen Sprung in der Automatisierung – bringt aber auch Sicherheitsrisiken mit sich.
Die Erweiterung erlaubt es der KI, grafische Benutzeroberflächen (GUIs) zu interpretieren und selbstständig Aktionen auszuführen – vom Klicken von Buttons über das Ausfüllen von Formularen bis hin zur Navigation durch komplexe Anwendungen. Entwickelt wurde das System für den Einsatz in Webbrowsern, mobilen Umgebungen und Desktop-Programmen.
Deutlicher Leistungssprung in Benchmarks
Die neue Computer-Steuerung funktioniert, indem Gemini 3.5 Flash Bildschirmaufnahmen analysiert und daraus Handlungen ableitet. In Tests auf der Benchmark-Plattform OSWorld Verified erreichte das Modell eine Trefferquote von 78,4 Prozent – ein deutlicher Sprung gegenüber den bisherigen 65,1 Prozent. Zum Vergleich: Vision-basierte Web-Agenten kommen auf rund 59 Prozent, strukturorientierte Modelle lediglich auf etwa 40 Prozent.
Verfügbar ist die Funktion über die Gemini API und die Enterprise Agent Platform. Entwickler können damit Agenten bauen, die Arbeitsabläufe über verschiedene Plattformen hinweg automatisieren. Parallel dazu führte Google am 27. Juni in Chrome 149 die Funktion „Select from screen“ ein: Nutzer können Text oder Bilder auf Webseiten markieren und direkt an Gemini zur Verarbeitung senden.
Sicherheitsvorkehrungen – und neue Risiken
Wer die neuen Fähigkeiten von Gemini 3.5 Flash für sein Unternehmen nutzen will, muss die Sicherheitsrisiken verstehen – von indirekter Prompt-Injection bis zu Kapazitätsengpässen. Dieser Report liefert eine konkrete Checkliste und Schutzmaßnahmen. Jetzt kostenlosen Sicherheits-Report anfordern
Die Möglichkeit, dass eine KI eigenständig Software steuert, birgt erhebliche Risiken. Google hat daher mehrere Sicherheitsebenen eingezogen. Vor sensiblen Aktionen muss der Nutzer explizit zustimmen. Zudem verfügt das System über einen automatischen Stopp-Mechanismus, der bei erkannten Prompt-Injection-Versuchen greift. Das Modell durchlief ein spezielles Training, um schädliche Anweisungen besser zu identifizieren.
Dennoch bleibt die Sicherheitslage angespannt. Erst am heutigen Sonntag wurden Berichte über eine Schwachstelle im Gemini-Sprachassistenten bekannt. Demnach könnten Angreifer speziell formatierte Benachrichtigungen nutzen, um die Logik der KI zu manipulieren. Branchenbeobachter weisen zudem auf das ungelöste Problem der indirekten Prompt-Injection hin: Ein KI-Agent kann auf schädliche Anweisungen stoßen, die auf einer von ihm besuchten Webseite versteckt sind.
Nachfrage übersteigt Kapazitäten
IT-Entscheider, die bereits KI-Agenten im Einsatz haben, brauchen jetzt einen Prompt-Injection-Schutz – bevor Angreifer schädliche Anweisungen über Webseiten einschleusen. Der Report zeigt Schritt für Schritt, wie Sie Ihre Systeme absichern. Prompt-Injection-Schutz jetzt sichern
Die Erweiterung der Gemini-Fähigkeiten fällt in eine Phase enormer Nachfrage nach Googles KI-Modellen. Wie aus Berichten vom 28. Juni hervorgeht, hatte Google bereits um März 2026 die Zugriffe für einige Großkunden – darunter Meta – eingeschränkt. Grund waren unzureichende Rechenkapazitäten, da Google eigene Projekte priorisierte. Betroffene Organisationen wiesen ihre Mitarbeiter an, die Token-Effizienz zu verbessern, um mit den reduzierten Kontingenten auszukommen.
Parallel testet Google eine neue Methode zur Lebenderkennung für sein reCAPTCHA-System. Seit dem 27. Juni ist bekannt, dass das Unternehmen ein Verfahren evaluiert, bei dem ein kurzes Video der Hand des Nutzers aufgenommen wird. Daraus werden 21 Hand-Landmark-Koordinaten extrahiert – zur Überprüfung der menschlichen Anwesenheit, ohne die Identität zu speichern. Das Verfahren bleibt vorerst optional.
