KI-Agenten: Microsoft, Apple, Google rüsten Browser auf

03.07.2026 - 05:48:38 | boerse-global.de

Microsoft, Apple, Google und Alibaba veröffentlichen zeitgleich Updates für KI-Agenten, die eigenständig im Web navigieren können.

KI-Update: Tech-Riesen rüsten Software für autonome Assistenten auf — KI-Agenten - Stilisierte KI-Hirn interagiert mit Browser auf Monitor, umgeben von holografischem Code und Datenströmen. 03.07.2026 - Bild: über boerse-global.de

Große Technologiekonzerne rüsten ihre Software für autonome KI-Assistenten auf – mit weitreichenden Folgen für Entwickler und Unternehmen.

Die erste Juliwoche 2026 markiert einen Wendepunkt in der Entwicklung Künstlicher Intelligenz: Microsoft, Apple, Google und der chinesische Konzern Alibaba haben zeitgleich Updates veröffentlicht, die KI-Agenten befähigen, eigenständig durch Webseiten zu navigieren und mit ihnen zu interagieren. Die neuen Werkzeuge zielen darauf ab, Programmierern und Anwendern gleichermaßen die Arbeit zu erleichtern.

Microsoft und Apple öffnen die Browser-Schleusen

Microsoft machte den Anfang: Am 1. Juli 2026 veröffentlichte der Konzern Visual Studio Code in der Version 1.127. Die Browser-Tools für KI-Agenten sind nun standardmäßig aktiviert. Das bedeutet: Agenten können Webseiten öffnen, Inhalte lesen, Screenshots erstellen und mit Buttons oder Eingabefeldern interagieren. Ein neues „Agents"-Fenster erlaubt die Verwaltung mehrerer Sitzungen per Drag-and-Drop.

Sicherheit steht dabei im Fokus: Microsoft führte seitenbezogene Berechtigungen ein. Agenten benötigen eine explizite Genehmigung, um auf Kamera, Mikrofon, Standortdaten oder angeschlossene Hardware wie USB- und Bluetooth-Geräte zuzugreifen.

Parallel dazu zog Apple nach. Der Safari MCP-Server (Model Context Protocol) in Safari Technology Preview 247 erlaubt KI-Code-Agenten wie Claude oder Gemini, direkt auf ein Safari-Fenster zuzugreifen. Insgesamt 17 spezifische Werkzeuge stehen bereit: Agenten können das Document Object Model (DOM) inspizieren, Konsolen-Logs einsehen, Netzwerkanfragen überwachen und JavaScript ausführen. Entscheidend für Datenschützer: Die Agenten arbeiten in einem isolierten Automatisierungsfenster – alle Daten verbleiben auf dem lokalen Rechner, kein Cloud-Abgleich.

Alibaba und Google setzen auf offene Standards

Alibaba veröffentlichte am 2. Juli 2026 „Page Agent", eine quelloffene JavaScript-Bibliothek. Sie nutzt eine Technik namens „DOM-Dehydration": Eine Live-Webseite wird in ein kompaktes Textformat („FlatDomTree") komprimiert, das KI-Modelle lesen und per natürlicher Sprache steuern können. Die Bibliothek eignet sich besonders für Assistenzsysteme und automatisierte Formularausfüllungen.

Während KI-Agenten die Web-Interaktion revolutionieren, stellt die neue EU-Gesetzgebung Unternehmen vor komplexe Herausforderungen. Dieser kostenlose Download verschafft Ihnen den Überblick über Fristen, Pflichten und Risikoklassen, den Ihre Rechts- und IT-Abteilung jetzt dringend braucht. EU AI Act in 5 Schritten verstehen

Google erweiterte ebenfalls am 1. Juli sein Angebot: Die Genkit Agents API ist jetzt als Vorschauversion verfügbar. Das Framework für Full-Stack-KI-Anwendungen unterstützt Streaming, Nachrichtenverlauf und „Human-in-the-Loop"-Funktionen – der Mensch kann also jederzeit eingreifen. Bereits Anfang des Jahres hatte Google Cloud seine Gemini-Enterprise-Suite um „langlebige Agenten" und einen speziellen „Agent Designer" für wiederverwendbare Fähigkeiten erweitert.

Massenoperationen und Unternehmenszugang

Für komplexe Aufgaben auf Unternehmensebene gab es am 2. Juli 2026 ein bedeutendes Update: Claude Code Dynamic Workflows ist jetzt allgemein verfügbar. Das System orchestriert bis zu 1.000 parallele Unteragenten für anspruchsvolle Projekte. In einem aktuellen Fall gelang die Portierung von 960.000 Codezeilen in nur sechs Tagen. Die Steuerung erfolgt extern über JavaScript – jeder Unteragent erhält einen sauberen Kontext und eine zusätzliche Prüfschicht zur Fehlererkennung.

Auch Amazon Web Services (AWS) zog nach. Am 1. Juli 2026 standardisierte AWS mit dem AG-UI-Protokoll für Amazon Bedrock AgentCore die dynamischen Ereignisse zwischen Agenten-Backends und Frontends. Zudem ist der KI-Agentenzugriff für Amazon WorkSpaces jetzt allgemein verfügbar – Agenten können auf Desktop-Anwendungen zugreifen. Unternehmen erhalten Echtzeit-Kontrollen: Sie können den Zugriff auf „nur anzeigen" beschränken oder ganz deaktivieren. Sämtliche Aktivitäten werden per Screenshots und Prüfprotokollen überwacht.

Mit der zunehmenden Integration von KI-Systemen in den Unternehmensalltag wachsen auch die rechtlichen Anforderungen an die Dokumentation und Sicherheit. Erfahren Sie in diesem kostenlosen Report, welche KI-Systeme als Hochrisiko gelten und was Unternehmen jetzt konkret tun müssen. Kostenlosen Umsetzungsleitfaden zum EU AI Act anfordern

Vom Automatisieren zum Können: Der Trend zum „Skill Engineering"

Branchenexperten sehen einen grundlegenden Wandel: Weg von der totalen Automatisierung, hin zum „Skill Engineering". Paul Bakaus von Impeccable plädierte am 2. Juli 2026 für einen Workflow, bei dem KI-Agenten die ersten 80 Prozent einer Aufgabe übernehmen – etwa das erste Design oder die grundlegende Programmierung –, während der Mensch die letzten 20 Prozent verantwortet. Der Ansatz: Code-Agenten erhalten eine spezifische Design-Vokabular, statt auf einmalige Generierung zu setzen.

Diese Philosophie spiegelt sich in neuen Entwickler-Tutorials wider. Ein Leitfaden vom 1. Juli 2026 zeigt, wie minimale Agenten mit Playwright und der Gemini-API gebaut werden – und wie Web-Tools über spezielle Browser-Test-Flags zugänglich gemacht werden. Die Botschaft ist klar: Die Zukunft gehört nicht der Vollautomatisierung, sondern der intelligenten Zusammenarbeit zwischen Mensch und Maschine.

de | wissenschaft | 69678141 |