KI-Sicherheit, Anthropic

KI-Sicherheit: Anthropic blockiert 99% aller Jailbreak-Versuche

02.07.2026 - 15:31:29 | boerse-global.de

Anthropic darf seine KI-Modelle Fable 5 und Mythos 5 weltweit vertreiben, nachdem das Unternehmen strenge Sicherheitsauflagen der US-Regierung akzeptiert hat.

Anthropic erhält Exportfreigabe nach Sicherheitspakt mit US-Regierung
KI-Sicherheit - Glühendes, komplexes neuronales Netz mit Datenströmen, das KI und ihre Regulierungsrahmen darstellt. 02.07.2026 - Bild: über boerse-global.de

Die US-Regierung einigt sich mit führenden KI-Entwicklern auf freiwillige Sicherheitsstandards für die Veröffentlichung neuer Modelle. Im Gegenzug werden die Exportbeschränkungen für Anthropics Spitzenmodelle aufgehoben.

Freigabe nach Sicherheitsauflagen

Das Handelsministerium zog am 30. Juni die Exportkontrollen für Anthropics Flaggschiff-Modelle Fable 5 und Mythos 5 zurück. Seit dem 1. Juli stellt das Unternehmen den weltweiten Zugang wieder her. Handelsminister Lutnick bestätigte die Einigung und betonte, dass Anthropic umfassende Sicherheits- und Überwachungsprotokolle akzeptiert habe.

Die Beschränkungen waren Anfang Juni nach einem Bericht über mögliche Sicherheitslücken und sogenannte Jailbreak-Risiken verhängt worden. Zwar hatte die Regierung zuvor bereits eine teilweise Freigabe für rund 100 Organisationen gewährt – die neue Vereinbarung ermöglicht nun die breite Rückkehr auf den Markt.

Hightech-Sicherheit mit 99-Prozent-Hürde

Im Zuge der Einigung führte Anthropic einen neuen Sicherheitsklassifizierer ein. Das System soll mehr als 99 Prozent aller Jailbreak-Versuche blockieren – also Eingaben, die darauf abzielen, die Schutzmechanismen des Modells zu umgehen. Interne Tests deuten sogar auf eine Blockierungsrate von bis zu 99,9 Prozent hin.

Weitere Auflagen: Anthropic gewährt der Regierung Vorabzugriff auf künftige Modelle und richtet ein System zur schnellen Meldung bösartiger Aktivitäten ein. Für Fable 5 gilt zudem eine schrittweise weltweite Einführung mit wöchentlichen Nutzungslimits von 50 Prozent bis zum 7. Juli.

Anzeige

Während die USA auf freiwillige Standards setzen, schafft die EU mit dem AI Act bereits verbindliche Regeln für KI-Systeme und deren Risikoklassen. Dieser kostenlose Umsetzungsleitfaden bietet Unternehmen einen kompakten Überblick über alle neuen Anforderungen, Pflichten und Fristen. EU AI Act in 5 Schritten verstehen

Branchenweite Sicherheitsinitiativen

Die Einigung mit Anthropic fällt in eine Phase intensiver regulatorischer Aktivitäten. Die US-Regierung hat unter einer aktuellen Executive Order ein freiwilliges 30-tägiges Prüfverfahren für neue Modelle eingeführt. Ähnliche Vorsichtsmaßnahmen ergriff bereits OpenAI, das die Veröffentlichung seines GPT-5.6-Modells aus Sicherheitserwägungen einschränkte.

Bis zum 1. August sollen Bundesbehörden wie die NSA, das Finanzministerium und die Cybersicherheitsbehörde CISA einen klassifizierten Sicherheits-Benchmark vorlegen. Das Rahmenwerk soll Jailbreak-Schweregrade in mehreren Dimensionen kategorisieren und dürfte die Entwicklung der freiwilligen Veröffentlichungsstandards maßgeblich beeinflussen.

Anzeige

Die rasanten Entwicklungen im Bereich der KI bringen nicht nur neue Chancen, sondern auch komplexe rechtliche Pflichten für europäische Unternehmen mit sich. Erfahren Sie in diesem kostenlosen Report, welche KI-Systeme als Hochrisiko gelten und wie Sie die Compliance in Ihrem Betrieb sicherstellen. Kostenlosen Leitfaden zur KI-Verordnung sichern

Hohe Regierungsvertreter, darunter CIA-Direktor Ratcliffe, unterstreichen die strategische Sensibilität der Technologie. Sie vergleichen die Kontrolle sogenannter Frontier-KI mit dem Management nuklearer Fähigkeiten – ein Hinweis auf die Dimension, die KI-Sicherheit inzwischen erreicht hat.

de | wissenschaft | 69673511 |