Mythos-Modell 16. Juni: Anthropic stoppt Red-Teaming nach Leak

Veröffentlicht am: 08.06.2026 um 10:15 Uhr | Redaktion boerse-global.de

Semantische Fehler bei Claude Sonnet 4.5 und ein außer Kontrolle geratenes Auditing-Tool erschüttern das Vertrauen in KI-Dienste.

Claude Sonnet 4.5: Schwerer Vorfall im Orchestrierungssystem — Abstract digital illustration showing a network of circuits and data streams with broken red lines, symbolizing AI system failures and errors. Illustration mit AI erstellt übermittelt durch boerse-global.de

5 hat internationale Diskussionen über die Zuverlässigkeit von KI-Diensten ausgelöst. Die Ingenieure Sarat Mahavratayajula und Vijay Sagar Gullapalli veröffentlichten am heutigen Montag einen detaillierten Post-Mortem-Bericht, der die Ursachen des Zusammenbruchs analysiert.

Warum so viele Deutsche ChatGPT und andere KI-Tools nutzen – aber kaum einer weiß, wie man sie richtig anwendet. Ein kostenloser Ratgeber zeigt, wie Sie die KI im Griff behalten und sofort für Ihren Alltag nutzen können. Kostenlosen KI-Ratgeber jetzt herunterladen

Semantische Fehler statt Syntax-Probleme

Das Kernproblem: Claude Sonnet 4.5 produzierte zwar technisch korrekten JSON-Code, ignorierte aber die eigentliche Bedeutung der Felder. Statt erwarteter Daten fügte das Modell plötzlich Verständnisfragen direkt in Beschreibungsfelder ein – ein klassischer Fall von semantischem Versagen bei formal korrekter Syntax.

Die Folge: Synchronische Architekturen erwiesen sich als verwundbar. Branchenexperten empfehlen nun den Umstieg auf asynchrone Workflows mit permanenten Status-Checkpoints und Wiederherstellungsstrategien. „Event History Replay“ oder Snapshots für jeden Schritt könnten künftige Instabilitäten abfedern.

Kettenreaktion durch Auditing-Tool

Parallel dazu eskalierte ein Vorfall mit dem Überwachungstool „claude-spotter“. Die Software, die mit Claude Haiku 4.5 andere Modelle auf verpasste Tool-Aufrufe prüft, geriet außer Kontrolle: Eine automatische Aktivierung führte zu rekursiven Aufrufen, die 74 laufende Daemons erzeugten.

Der Entwickler zog die betroffene Version umgehend zurück und stellte auf manuelle Installation um. Weitere Pannen: Geister-Tools aus früheren Projekten tauchten auf, und Kompatibilitätsprobleme mit Windows-Kommandozeilen erschwerten die Fehlerbehebung.

Anthropic meldet Entwarnung – mit Einschränkungen

Trotz der Turbulenzen meldet Anthropic den Gesamtstatus seiner Systeme als betriebsbereit. Erhöhte Fehlerraten beim Claude Opus 4.7-Modell seien inzwischen behoben. Die Erfolgsquote von Claude Code bei der Lösung komplexer Softwareprobleme liege bei über 75 Prozent, bei Routineaufgaben sogar bei 90 Prozent.

Die rasante Entwicklung von KI-Systemen stellt nicht nur Techniker, sondern auch Unternehmen vor neue rechtliche Herausforderungen. Dieser kostenlose Umsetzungsleitfaden zum EU AI Act erklärt Ihnen kompakt alle neuen Fristen, Pflichten und Risikoklassen. Gratis E-Book zur KI-Verordnung sichern

Doch Schatten liegen auf der Zukunft: Das Unternehmen hat die Sicherheitstests (Red-Teaming) für das kommende Modell „Mythos“ (Codenamen Oceanus) gestoppt. Grund ist ein interner Leak der API. Mythos, das für den 16. Juni erwartet wird, hat bereits eine 27 Jahre alte Zero-Day-Sicherheitslücke in OpenBSD identifiziert. Das Modell soll 52 Tokens pro Sekunde verarbeiten, die Kosten liegen bei geschätzt 80 Euro pro Million Ausgabe-Tokens.

Alternativen im Blick: Deutlich schneller und günstiger

Während Entwickler mit den Stabilitätsproblemen kämpfen, zeigen Vergleichstests klare Vorteile von Alternativen. Ein Wechsel von Claude Sonnet 4.6 zu Gemini 2.5 Flash brachte 1,7-fach schnellere Antworten und senkte die Kosten um rund 80 Prozent. Voraussetzung: korrekte Konfiguration, insbesondere angepasste Denk-Budget-Einstellungen, die zuvor die integrierte Suchfunktion blockiert hatten.

Disclaimer zu unseren Artikeln: Keine Anlageberatung, keine Kauf- oder Verkaufsempfehlung. Angaben zu Kursen, Unternehmen und Märkten ohne Gewähr; Änderungen jederzeit möglich. Börsengeschäfte können zu hohen Verlusten führen. Unsere Beiträge werden ganz oder teilweise automatisiert mit Unterstützung von AI erstellt und geprüft.

de | wissenschaft | 69498901 |