KI-CEOs im Test: Claude schlägt GPT mit 47 Millionen Euro

28.06.2026 - 14:38:17 | boerse-global.de

Nur drei von vielen KI-Systemen erzielten in einer simulierten Unternehmensführung Gewinn. Ein einfaches Regelwerk übertraf die meisten Hightech-Modelle.

Princeton-Studie: KI-Modelle scheitern als Startup-CEOs — KI-CEOs - Holografische Schnittstelle mit Finanzdiagrammen und KI-Netzwerkmustern in einem modernen Büro, symbolisiert die Rolle der KI im Geschäftsmanagement. 28.06.2026 - Bild: über boerse-global.de

Eine neue Studie der Princeton-Universität zeigt: Selbst die besten KI-Modelle taugen nicht als Unternehmensführer. In einem simulierten 500-Tage-Startup-Experiment scheiterten die meisten kläglich.

Die Forscher testeten führende KI-Systeme im sogenannten CEO-Bench. Dabei mussten die Modelle ein fiktives Startup namens NovaMind managen – mit einem Startkapital von einer Million Euro. Das ernüchternde Ergebnis: Nur drei KI-Agenten beendeten die Simulation mit mehr Geld, als sie zu Beginn hatten.

Die Gewinner und die Überraschung

Anthropics Claude Fable 5 schnitt mit Abstand am besten ab. Der KI-CEO steigerte den Unternehmenswert auf stolze 47,15 Millionen Euro. Dahinter folgten Claude Opus 4.8 mit 27,8 Millionen und OpenAIs GPT-5.5 mit 21,3 Millionen Euro.

Doch die eigentliche Überraschung: Ein einfaches, regelbasiertes System schlug die meisten Hightech-Modelle. Es erreichte immerhin 15,76 Millionen Euro. Das zeigt: Selbst die fortschrittlichsten Sprachmodelle haben Probleme mit komplexen, langfristigen Geschäftsentscheidungen.

Autonome KI auf dem Vormarsch

Die Princeton-Studie kommt zu einer Zeit, in der KI-Systeme zunehmend eigenständig agieren. Branchenbeobachter berichten, dass diese Systeme Kosten, Zeit und Personalbedarf für Prototypen drastisch reduzieren. Die Zeitspanne für die Erledigung komplexer Aufgaben durch KI-Agenten verdoppelt sich demnach etwa alle sieben Monate.

Während die Forschung die Grenzen autonomer Systeme testet, schafft die Politik bereits verbindliche Fakten für den Unternehmenseinsatz. Dieser kostenlose Umsetzungsleitfaden gibt Ihnen den nötigen Überblick über Fristen, Pflichten und Risikoklassen der neuen EU-KI-Verordnung. EU AI Act in 5 Schritten verstehen

Im Bereich Softwareentwicklung wurden neue Meilensteine erreicht. Der Ende Juni veröffentlichte MirrorCode-Benchmark dokumentierte den bislang größten autonomen Codierungs-Erfolg: Claude Opus 4.7 implementierte ein Projekt mit rund 60.000 Zeilen Code erfolgreich neu. Die Erfolgsquote lag bei 56 Prozent, während GPT-5.5 und Gemini 3.1 Pro auf 44 beziehungsweise 32 Prozent kamen.

Geopolitische Spannungen und neue Player

Der Wettbewerb um die besten KI-Modelle wird zunehmend von Regierungspolitik und Handelsbeschränkungen bestimmt. Mitte Juni verhängten die USA ein Exportverbot für Anthropics Modelle Mythos und Fable 5. Das hat internationale Konkurrenten auf den Plan gerufen.

In China brachte die Firma 360 mit Tulongfeng ein auf Cybersicherheit spezialisiertes Modell auf den Markt. Japans Sakana AI launchte mit Fugu einen sogenannten Orchestrator. OpenAI wiederum beschränkt den Zugang zu seiner neuesten GPT-5.6-Serie – die Modelle Sol, Terra und Luna sind nur für US-regierungsautorisierte Partner verfügbar.

Der rasante Aufstieg spezialisierter KI-Systeme stellt Unternehmen nicht nur vor technologische, sondern auch vor neue rechtliche Fragen. Erfahren Sie in diesem kostenlosen Report, welche KI-Systeme künftig als Hochrisiko gelten und was Verantwortliche jetzt konkret tun müssen. Kostenlosen Umsetzungsleitfaden zum EU AI Act sichern

Milliardenmarkt und neue Hardware

Die KI-Wirtschaft boomt trotz aller Hürden. Der Umsatz im Bereich generative KI erreichte in den letzten zwölf Monaten 110 Millionen Euro, die annualisierte Rate liegt bei 175 Milliarden Euro. Allein Anthropic meldete für Mai 2026 eine Umsatzrate von 47 Milliarden Euro.

OpenAI arbeitet unterdessen an eigener Hardware: Der hauseigene KI-Chip Jalapeño entstand in neunmonatiger Zusammenarbeit mit Broadcom. Und in Neu-Delhi diskutierte Premierminister Modi kürzlich mit 16 DeepTech- und KI-Startups über Datengovernance und den Ausbau lokaler KI-Lösungen für Landwirtschaft und Bildung.

de | wissenschaft | 69647285 |