AI Control Roadmap: Google DeepMind behandelt KI wie Insider-Bedrohungen

Veröffentlicht am: 20.06.2026 um 21:36 Uhr | Redaktion boerse-global.de

Google DeepMind behandelt autonome KI-Systeme künftig wie interne Bedrohungen mit einem mehrschichtigen Verteidigungskonzept.

Google DeepMind: Neue Sicherheitsstrategie für KI-Agenten — A glowing, complex neural network with a subtle human eye overlay, representing AI control and security in a dark, high-tech setting. Illustration mit AI erstellt übermittelt durch boerse-global.de

Der Suchmaschinenriese will autonome KI-Systeme künftig wie interne Bedrohungen behandeln.

Google DeepMind hat am heutigen Samstag einen neuen Sicherheitsrahmen für fortschrittliche KI-Agenten vorgestellt. Die „AI Control Roadmap" behandelt autonome Systeme als potenzielle Insider-Bedrohungen und setzt auf ein mehrschichtiges Verteidigungskonzept. Statt herkömmlicher externer Sicherheitsmodelle setzt der Konzern auf eine tief gestaffelte interne Überwachung.

Die neuen Sicherheitsrahmen für KI-Systeme zeigen, wie komplex die rechtlichen und operativen Anforderungen für Unternehmen werden. Dieser kostenlose Umsetzungsleitfaden hilft Ihnen, die Pflichten der EU-KI-Verordnung und wichtige Risikoklassen besser zu verstehen. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt

Drei Risikokategorien im Fokus

Das Framework identifiziert drei Hauptrisiken bei agentischer KI: Kontrollverlust, Arbeitssabotage und direkte Schädigung. Dagegen soll ein abgestuftes Verteidigungssystem helfen, das aus strengen Evaluierungen, permanenter Überwachung und funktionalen Notausschaltern besteht. Vertrauenswürdige KI-Supervisoren beobachten und analysieren dabei in Echtzeit die Aktionen anderer KI-Agenten.

Das Sicherheitsmodell greift auf etablierte Prinzipien der Cybersicherheit zurück – darunter Zero Trust, Least Privilege und Verhaltensüberwachung. Durch die Anwendung des MITRE ATT&CK-Frameworks auf KI-Operationen will der Konzern eine strukturierte Methode schaffen, um fehlgeleitetes Verhalten zu erkennen, bevor es zu Systemausfällen kommt. Die DeepMind-Forscher um Rohin Shah betonen, dass mehrere Verteidigungsschichten für den verantwortungsvollen Einsatz autonomer Agenten unerlässlich sind.

Erkenntnisse aus einer Million Programmieraufgaben

Bei der Entwicklung der Roadmap analysierte Google DeepMind rund eine Million Programmieraufgaben eines internen Prototyps. Die Auswertung ergab: Die meisten Probleme entstanden durch funktionale Fehlinterpretationen oder Missverständnisse von Anweisungen – nicht durch böswillige Absicht. Dennoch bleibt das Framework darauf ausgerichtet, gezielte Sabotage durch fortgeschrittene Modelle zu verhindern.

Die beschriebenen Sicherheitsprotokolle werden bereits intern eingesetzt. Für Gemini Spark wurde ein Live-Monitor entwickelt, der agentische Abläufe überwacht. Zeitgleich läuft der breitere Rollout weiterer KI-Funktionen – darunter die US-Veröffentlichung von Project Genie 3 am heutigen Samstag. Dieses experimentelle Weltmodell erlaubt es AI-Ultra-Abonnenten, interaktive 3D-Umgebungen aus Text- oder Bildvorlagen zu generieren, mit 60-sekündigen Erkundungsfenstern in 720p-Auflösung.

Während Großkonzerne eigene Sicherheitsprotokolle entwickeln, stehen viele Unternehmen vor der Herausforderung, neue KI-Gesetze und Cyberrisiken rechtzeitig zu bewerten. Erfahren Sie in diesem kostenlosen Report, welche rechtlichen Pflichten und Bedrohungen Sie jetzt kennen müssen. Neue KI-Gesetze, neue Cyberrisiken: Was kommt wirklich auf Ihr Unternehmen zu?

Personalwechsel und Branchenentwicklung

Der Veröffentlichung der Roadmap gingen bedeutende Personalveränderungen voraus. Am gestrigen Freitag gab Nobelpreisträger John Jumper, der leitende Entwickler des Proteinfaltungsmodells AlphaFold, seinen Weggang von Google DeepMind zu Anthropic bekannt. Sein Abgang erfolgte kurz nachdem Noam Shazeer, Mitautor grundlegender Transformer-Forschung, Google in Richtung OpenAI verlassen hatte.

Der branchenweite Fokus auf KI-Kontrolle hat sich verschärft, während Wettbewerber ähnliche Bedenken äußern. Erst Anfang des Monats warnte Anthropic vor der Möglichkeit, dass KI-Systeme eine rekursive Selbstverbesserung erreichen könnten, und forderte globale Entwicklungspausen oder Bremsmechanismen. Während Google DeepMind auf interne Verteidigungsprotokolle setzt, bereitet sich Anthropic auf ein wissenschaftliches Event am 30. Juni 2026 vor – Berichten zufolge hat das Unternehmen zudem einen vertraulichen Börsengang mit einer Bewertung von rund 965 Milliarden US-Dollar beantragt.

Project Astra, das im Frühjahr letzten Jahres vorgestellt wurde, zeigt ebenfalls die wachsende Autonomie dieser Systeme. Der proaktive Assistent kann inzwischen Aufgaben wie die Bedienung von Android-Smartphones oder die Verwaltung digitaler Kommunikation ohne explizite Benutzeranfragen ausführen – ein weiterer Grund für die Kontrollmaßnahmen der neuen Roadmap.

Disclaimer...

de | wissenschaft | 69592929 |