Mythos-Modell 16. Juni: Anthropic stoppt Red-Teaming nach Leak
08.06.2026 - 10:15:54 | boerse-global.de
5 hat internationale Diskussionen über die Zuverlässigkeit von KI-Diensten ausgelöst. Die Ingenieure Sarat Mahavratayajula und Vijay Sagar Gullapalli veröffentlichten am heutigen Montag einen detaillierten Post-Mortem-Bericht, der die Ursachen des Zusammenbruchs analysiert.
Warum so viele Deutsche ChatGPT und andere KI-Tools nutzen – aber kaum einer weiß, wie man sie richtig anwendet. Ein kostenloser Ratgeber zeigt, wie Sie die KI im Griff behalten und sofort für Ihren Alltag nutzen können. Kostenlosen KI-Ratgeber jetzt herunterladen
Semantische Fehler statt Syntax-Probleme
Das Kernproblem: Claude Sonnet 4.5 produzierte zwar technisch korrekten JSON-Code, ignorierte aber die eigentliche Bedeutung der Felder. Statt erwarteter Daten fügte das Modell plötzlich Verständnisfragen direkt in Beschreibungsfelder ein – ein klassischer Fall von semantischem Versagen bei formal korrekter Syntax.
Die Folge: Synchronische Architekturen erwiesen sich als verwundbar. Branchenexperten empfehlen nun den Umstieg auf asynchrone Workflows mit permanenten Status-Checkpoints und Wiederherstellungsstrategien. „Event History Replay“ oder Snapshots für jeden Schritt könnten künftige Instabilitäten abfedern.
Kettenreaktion durch Auditing-Tool
Parallel dazu eskalierte ein Vorfall mit dem Überwachungstool „claude-spotter“. Die Software, die mit Claude Haiku 4.5 andere Modelle auf verpasste Tool-Aufrufe prüft, geriet außer Kontrolle: Eine automatische Aktivierung führte zu rekursiven Aufrufen, die 74 laufende Daemons erzeugten.
Der Entwickler zog die betroffene Version umgehend zurück und stellte auf manuelle Installation um. Weitere Pannen: Geister-Tools aus früheren Projekten tauchten auf, und Kompatibilitätsprobleme mit Windows-Kommandozeilen erschwerten die Fehlerbehebung.
Anthropic meldet Entwarnung – mit Einschränkungen
Trotz der Turbulenzen meldet Anthropic den Gesamtstatus seiner Systeme als betriebsbereit. Erhöhte Fehlerraten beim Claude Opus 4.7-Modell seien inzwischen behoben. Die Erfolgsquote von Claude Code bei der Lösung komplexer Softwareprobleme liege bei über 75 Prozent, bei Routineaufgaben sogar bei 90 Prozent.
Die rasante Entwicklung von KI-Systemen stellt nicht nur Techniker, sondern auch Unternehmen vor neue rechtliche Herausforderungen. Dieser kostenlose Umsetzungsleitfaden zum EU AI Act erklärt Ihnen kompakt alle neuen Fristen, Pflichten und Risikoklassen. Gratis E-Book zur KI-Verordnung sichern
Doch Schatten liegen auf der Zukunft: Das Unternehmen hat die Sicherheitstests (Red-Teaming) für das kommende Modell „Mythos“ (Codenamen Oceanus) gestoppt. Grund ist ein interner Leak der API. Mythos, das für den 16. Juni erwartet wird, hat bereits eine 27 Jahre alte Zero-Day-Sicherheitslücke in OpenBSD identifiziert. Das Modell soll 52 Tokens pro Sekunde verarbeiten, die Kosten liegen bei geschätzt 80 Euro pro Million Ausgabe-Tokens.
Alternativen im Blick: Deutlich schneller und günstiger
Während Entwickler mit den Stabilitätsproblemen kämpfen, zeigen Vergleichstests klare Vorteile von Alternativen. Ein Wechsel von Claude Sonnet 4.6 zu Gemini 2.5 Flash brachte 1,7-fach schnellere Antworten und senkte die Kosten um rund 80 Prozent. Voraussetzung: korrekte Konfiguration, insbesondere angepasste Denk-Budget-Einstellungen, die zuvor die integrierte Suchfunktion blockiert hatten.
So schätzen die Börsenprofis Aktien ein!
Für. Immer. Kostenlos.
