KI-Riesen, Sicherheitstests

KI-Riesen einigen sich auf Sicherheitstests mit US-Behörden

06.05.2026 - 15:44:06 | boerse-global.de

OpenAI reduziert Halluzinationen um über 50 Prozent, während Anthropic spezialisierte Finanz-Agenten vorstellt. KI-Entwickler akzeptieren freiwillige Vorabprüfungen durch das US-Handelsministerium.

KI-Riesen einigen sich auf Sicherheitstests mit US-Behörden - Foto: über boerse-global.de
KI-Riesen einigen sich auf Sicherheitstests mit US-Behörden - Foto: über boerse-global.de

Google, Microsoft, OpenAI und Anthropic lassen ihre Modelle vor der Veröffentlichung prüfen – und kämpfen gleichzeitig gegen Halluzinationen.

Die weltweit führenden KI-Entwickler haben sich auf neue Sicherheitsprotokolle geeinigt. In einer Reihe von Vereinbarungen, die am 5. Mai 2026 finalisiert wurden, gewähren Google, Microsoft und xAI – neben OpenAI und Anthropic – dem US-Handelsministerium Zugang zu ihren Modellen, bevor diese öffentlich eingesetzt werden. Die Evaluierungen durch das Center for AI Safety and Innovation (CAISI) sollen nationale Sicherheitsrisiken und unerwartetes Verhalten identifizieren.

Der Schritt markiert eine Abkehr vom bisher lockeren Umgang mit KI-Regulierung. Auslöser waren offenbar die Fähigkeiten von Anthropics Modell „Mythos", das Bedenken hinsichtlich möglicher Hacking-Anwendungen auslöste. Obwohl die aktuellen Vereinbarungen freiwillig sind, deuten Berichte darauf hin, dass das Weiße Haus eine präsidiale Anordnung zur Einführung eines verbindlichen Prüfverfahrens für Spitzenmodelle erwägt. CAISI hat bereits mehr als 40 Bewertungen durchgeführt, darunter eine Prüfung des chinesischen Modells DeepSeek, das in mehreren Bereichen unterdurchschnittlich abschnitt.

Anzeige

Während Entwickler an der Zuverlässigkeit neuer Modelle arbeiten, bleibt die praktische Anwendung für viele Nutzer oft ein Rätsel. Dieser kostenlose Ratgeber zeigt mit sofort nutzbaren Prompts, wie Sie ChatGPT effektiv in Ihren Alltag integrieren und Zeit sparen. ChatGPT als Alltagshelfer – jetzt gratis PDF-Report sichern

OpenAI macht Schluss mit Halluzinationen

OpenAI hat das Problem der sogenannten Halluzinationen – plausible, aber falsche Informationen – mit dem Start von GPT-5.5 Instant am 5. Mai 2026 angegangen. Das Modell ersetzt GPT-5.3 als Standardversion für ChatGPT und konzentriert sich auf Zuverlässigkeit in den Bereichen Finanzen, Recht und Gesundheitswesen.

Die internen Testergebnisse sind vielversprechend: GPT-5.5 Instant erreichte eine Reduzierung der Halluzinationen um 52,5 Prozent bei medizinischen, rechtlichen und finanziellen Anfragen. Bei von Nutzern gemeldeten Ungenauigkeiten sank die Fehlerquote um 37,3 Prozent. Auch die Benchmark-Werte verbesserten sich: Der HealthBench-Score stieg von 49,6 auf 51,4, der HealthBench Professional Score von 32,9 auf 38,4.

Das neue Modell kommuniziert zudem prägnanter – die Wortanzahl sank um rund 30 Prozent, und es werden weniger Emojis verwendet. Eine Personalisierungsfunktion erlaubt es dem Modell, Kontext aus früheren Chats, hochgeladenen Dateien und verknüpften Gmail-Konten zu nutzen. Eine neue Funktion namens „Memory Sources" zeigt Nutzern genau an, welche Dokumente oder Interaktionen für eine Antwort verwendet wurden. Das Vorgängermodell GPT-5.3 bleibt für drei Monate als Option verfügbar.

Anthropic setzt auf spezialisierte Finanz-Agenten

Während OpenAI die allgemeine Modellzuverlässigkeit verbesserte, konzentrierte sich Anthropic auf die Automatisierung spezifischer Arbeitsabläufe. Anfang Mai stellte das Unternehmen zehn KI-Agenten-Vorlagen für Banken, Versicherungen und Finanzdienstleistungen vor. Diese Agenten erledigen komplexe Aufgaben wie die Erstellung von Pitchbooks, KYC-Überprüfungen und Monatsabschlüsse.

Die Agenten basieren auf Anthropics Modell Claude Opus 4.7, das mit 64,37 Prozent den Finance Agent Benchmark anführt. Sie sind in Microsoft-365-Anwendungen wie Excel, PowerPoint und Word integriert und können entweder als „Co-Piloten" den Menschen unterstützen oder als autonome Hintergrundprozesse arbeiten, die vor Abschluss einer Aufgabe die menschliche Freigabe benötigen.

Ein entscheidender Bestandteil ist die Anbindung verifizierter Datenquellen. Anthropic hat Datenverbindungen zu Anbietern wie Dun & Bradstreet, Morningstar und PitchBook eingerichtet. Die Integration mit Dun & Bradstreet ermöglicht es Unternehmen, Identitätsprüfungen und Risikobewertungen in Minuten statt Tagen durchzuführen. Anthropics annualisierter Umsatz soll 2026 bei über 30 Milliarden Euro liegen – ein deutlicher Anstieg gegenüber neun Milliarden Euro im Vorjahr.

Microsoft zieht sich aus KI-Experimenten zurück

Die neue Verantwortung zeigt sich auch in strategischen Rückzügen. Am 5. Mai 2026 gab Xbox-CEO Asha Sharma bekannt, dass Microsoft seinen Copilot auf Konsolen und Mobilgeräten einstellt. Die Entscheidung spiegelt eine neue Führungsrichtung wider, die sich auf das Kernspielerlebnis konzentriert und allgemeine Chatbots zurückstellt.

Parallel dazu hat Meta neue KI-Systeme zur sozialen Verantwortung eingeführt. Am 6. Mai 2026 startete das Unternehmen ein Tool auf Facebook und Instagram, das Nutzer unter 13 Jahren identifiziert. Statt Gesichtserkennung analysiert das System visuelle Hinweise wie Größe und Knochenstruktur in Fotos und Videos. Der Schritt folgt auf eine zivilrechtliche Strafe von 375 Millionen US-Dollar durch eine Jury in New Mexico wegen Verstößen gegen den Kinderschutz.

Google testet derweil „Remy", einen persönlichen Assistenten für Gemini, der Recherche und Nachrichten über Workspace, GitHub und Spotify hinweg verwalten soll. Zudem bereitet Google ein neues Abonnement namens „Neon" oder „AI Ultra Lite" vor, das höhere Nutzungslimits für agentenbasierte Tools bieten soll – voraussichtlich zwischen 50 und 150 Euro pro Monat.

Markt in Bewegung: Traditionelle Software unter Druck

Die rasche Hinwendung zu spezialisierten, rechenschaftspflichtigen KI-Systemen hat messbare Auswirkungen auf den Softwaremarkt. Da KI-Agenten zunehmend Aufgaben übernehmen, die traditionell von Unternehmenssoftware erledigt wurden, geraten etablierte Unternehmen unter Druck. Seit Frühlingsbeginn sind die Aktienkurse von Firmen wie ServiceNow und Salesforce deutlich gefallen, einige Branchenvertreter verzeichneten Einbußen von bis zu 52 Prozent.

Analysten sprechen von einer „Validierungsphase", in der die Neuheit generativer KI durch die Notwendigkeit von Prüfpfaden und Fakten-Garantien ersetzt wird. Die Bereitschaft der großen Labore, staatliche Tests zu akzeptieren, deutet auf einen kollektiven Versuch hin, strengere gesetzliche Auflagen zu vermeiden und gleichzeitig das Vertrauen von Unternehmenskunden zu gewinnen.

Anzeige

Die rasanten Umbrüche im Softwaremarkt zeigen, dass Künstliche Intelligenz der entscheidende Megatrend unserer Zeit ist. Ein neuer Gratis-Report enthüllt jetzt, welche 10 Big-Data-Aktien das größte Potenzial haben, Ihr Depot nachhaltig zu revolutionieren. Top 10 KI-Aktien: Jetzt kostenlosen Insider-Report herunterladen

Die Bewertungen der KI-Führungskräfte bleiben hoch: OpenAI wird mit rund 852 Milliarden Euro bewertet, Anthropic mit 380 Milliarden Euro. Beide Unternehmen prüfen angeblich Joint Ventures mit großen Investmentbanken zur Entwicklung branchenspezifischer KI-Infrastruktur.

Ausblick: Der Mensch bleibt im Mittelpunkt

Der Fokus wird in den kommenden Monaten auf „Human-in-the-Loop"-Systemen liegen. Sowohl Anthropics neue Finanz-Agenten als auch OpenAIs aktualisierte Sicherheitsfunktionen betonen, dass KI zwar riesige Datenmengen verarbeiten kann, die endgültige Entscheidungsbefugnis aber beim Menschen bleiben muss.

Die Ergebnisse der CAISI-Vorabprüfungen werden maßgeblich bestimmen, wie schnell noch leistungsfähigere Modelle auf den Markt kommen. Und mit einem möglichen Börsengang von Anthropic bereits im Oktober 2026 wird die Fähigkeit des Unternehmens, die langfristige Zuverlässigkeit seiner Finanz-Agenten zu beweisen, für potenzielle Investoren entscheidend sein. Die Branche scheint entschlossen, einen Weg einzuschlagen, bei dem Genauigkeit und Rechenschaftspflicht die wichtigsten Erfolgsindikatoren sind.

So schätzen die Börsenprofis Aktien ein!

<b>So schätzen die Börsenprofis Aktien ein!</b>
Seit 2005 liefert der Börsenbrief trading-notes verlässliche Anlage-Empfehlungen – dreimal pro Woche, direkt ins Postfach. 100% kostenlos. 100% Expertenwissen. Trage einfach deine E-Mail Adresse ein und verpasse ab heute keine Top-Chance mehr. Jetzt abonnieren.
Für. Immer. Kostenlos.
de | wissenschaft | 69285400 |