Claude Fable 5: Anthropic knackt 80,3 Prozent bei Code-Tests
10.06.2026 - 12:56:43 | boerse-global.de
Während OpenAI mit ersten Tests seines kommenden Modells GPT-5.6 beginnt, hat Konkurrent Anthropic gleich zwei neue Hochleistungsmodelle auf den Markt gebracht. Die Entwicklungen versprechen einen Quantensprung – besonders bei komplexen Programmieraufgaben und autonomen Systemen.
Warum so viele Deutsche ChatGPT nutzen – aber kaum einer weiß, wie man es richtig anwendet: Ein kostenloser Ratgeber zeigt, wie Sie die KI sofort für Ihren Alltag nutzen können – ganz ohne Vorkenntnisse. Kostenlosen PDF-Report mit fertigen Anleitungen jetzt gratis herunterladen
GPT-5.6: OpenAI testet zwei Varianten
Seit vergangener Woche erprobt OpenAI zwei verschiedene Versionen seines nächsten KI-Modells. Die internen Codename „kepler" und „kindle" stehen dabei für unterschiedliche Entwicklungslinien. Nach Informationen aus dem Testerkreis hat sich das Unternehmen nun auf „kindle-alpha" als Favoriten für die finale Version festgelegt.
Der Fokus des Updates liegt auf der Verbesserung von Frontend-Entwicklung, visuellem Verständnis und komplexen Programmieraufgaben. Die ersten Rückmeldungen aus der Test-Community fallen jedoch gemischt aus. Einige Nutzer berichten, dass die „kindle"-Version in bestimmten Bereichen hinter dem „kepler"-Zwischenstand zurückgefallen sei.
Während der Testphase wurde das Modell kurzzeitig aus öffentlichen Testumgebungen entfernt. Zeitgleich tauchte ein neues, unbekanntes Modell mit dem Codenamen „Levi" auf – Beobachter spekulieren, dass es von Meta stammen könnte. Trotz der Anpassungen zeigen Benchmark-Daten, dass GPT-5.6 in spezifischen Programmiertests die High-End-Modelle von Anthropic übertroffen hat. Die öffentliche Veröffentlichung wird für Ende Juni erwartet.
Anthropic kontert mit Claude Fable 5 und Mythos 5
Am 9. Juni 2026 hat Anthropic offiziell zwei neue Modelle seiner „Mythos-Klasse" vorgestellt. Während Claude Fable 5 der breiten Öffentlichkeit zugänglich ist, bleibt Claude Mythos 5 vertrauenswürdigen Partnern und ausgewählten Organisationen vorbehalten – darunter auch der US-Regierung im Rahmen des Programms „Project Glasswing".
Die neuen Modelle übertreffen die Vorgängerversion Opus 4.8 deutlich. In standardisierten Softwareentwicklungstests erreichte Fable 5 beeindruckende 80,3 Prozent im SWE-Bench Pro – ein klarer Vorsprung gegenüber GPT 5.5 (58,6 Prozent) und Gemini 3.1 Pro (54,2 Prozent). Im SWE-bench Verified knackte Fable 5 sogar die 95-Prozent-Marke.
Die praktische Relevanz dieser Fortschritte unterstrich der Zahlungsdienstleister Stripe: Das Unternehmen nutzte die neue Architektur, um eine 50 Millionen Zeilen umfassende Ruby-Codebasis an einem einzigen Tag zu migrieren. Mythos 5 zeigte zudem in der wissenschaftlichen Forschung sein Potenzial: Bei der Medikamentenentwicklung beschleunigte das Modell Prozesse um das Zehnfache und identifizierte erfolgreich vielversprechende Kandidaten für neun von 14 Proteinzielen.
Urlaub planen, Sprachen lernen oder Zeit sparen – so wie Profis komplexe Codes migrieren, können auch Sie KI für Ihre täglichen Aufgaben nutzen. Dieser kostenlose PDF-Report enthüllt die praktischsten Tricks und fertige Prompts für Einsteiger. ChatGPT-Alltagshelfer kostenlos sichern
Sicherheitskonzept mit abgestuften Zugängen
Anthropic setzt bei seiner Mythos-Klasse auf ein mehrstufiges Sicherheitsmodell. Claude Fable 5 verfügt über strenge Filter für Anfragen aus den Bereichen Cybersicherheit, Biologie, Chemie und Modelldestillation. Lösen Nutzeranfragen diese Schutzmechanismen aus, wird die Aufgabe automatisch an das ältere Opus 4.8-Modell weitergeleitet. Nach internen Daten geschieht dies in weniger als fünf Prozent aller Sitzungen, wobei die Fehleralarmrate bei etwa fünf Prozent liegt.
Claude Mythos 5 hingegen ist für offensive Sicherheitsforschung und fortgeschrittene Anwendungen konzipiert – ohne die öffentlichen Filter. Das Sicherheitsunternehmen XBOW testete eine Vorschauversion und stellte fest, dass die Fehlererkennungsrate um 42 Prozent im Vergleich zu Vorgängermodellen sank. Besonders bei Quellcode-Analysen und Reverse Engineering zeigte sich das Modell effektiv, blieb jedoch konservativ bei der Validierung von Exploits.
Beide Modelle kosten zehn Dollar pro Million Input-Tokens und 50 Dollar pro Million Output-Tokens. Bis zum 22. Juni 2026 bleiben sie für Nutzer der Pro-, Team- und Enterprise-Tarife kostenlos. Der aggressive Markteintritt erfolgt zu einem Zeitpunkt, an dem Anthropic nach vertraulichen Börsengangsunterlagen mit 965 Milliarden Dollar bewertet wird.
Weitere Player drängen auf den Markt
Die gleichzeitigen Fortschritte von OpenAI und Anthropic bleiben nicht unbeantwortet. Google hat Gemini 3.5 Pro für Ende Juni angekündigt – mit einem Kontextfenster von zwei Millionen Tokens und speziellen „Deep Think"-Fähigkeiten.
Unabhängige Forscher beobachten zudem einen Trend zu autonomerem Verhalten der neuen Modelle. Ethan Mollick berichtete von einem Test, bei dem ein Mythos-Klasse-Modell 9,5 Stunden lang völlig eigenständig arbeitete, um ein komplexes Projekt zu entwerfen. Die KI startete dabei selbstständig Unter-Agenten, sammelte reale Verkehrsdaten, schrieb Code und überprüfte ihre eigenen Ergebnisse – bis eine funktionsfähige Statistiksoftware entstand.
