Project Cannes: Meta testete ChatGPT mit Fake-Profilen von Minderjährigen
30.06.2026 - 09:22:08 | boerse-global.de
Der Facebook-Konzern steht in der Kritik, nachdem bekannt wurde, dass beauftragte Dienstleister mit gefälschten Profilen von Minderjährigen die Sicherheitsgrenzen konkurrierender KI-Systeme ausgetestet haben. Die geheime Aktion namens „Project Cannes“ zielte auf Plattformen wie OpenAI's ChatGPT, Google's Gemini und Character.AI.
So lief die verdeckte Operation
Das von der irischen Firma Covalen durchgeführte Projekt ließ Mitarbeiter als Jugendliche auftreten. Sie schickten Anfragen zu Suizid, Drogen, sexuellen Inhalten und Essstörungen an die fremden KI-Systeme. Allein im August 2025 gingen über 45.000 solcher Prompts ein.
Während Konzerne die Grenzen der KI austesten, fragen sich viele Nutzer, wie sie die Technologie sicher für sich selbst nutzen können. Dieser kostenlose PDF-Report zeigt Ihnen mit praktischen Anleitungen und fertigen Prompts, wie Sie ChatGPT effektiv und unkompliziert in Ihren Alltag integrieren. Kostenlosen ChatGPT-Ratgeber jetzt herunterladen
Die Initiative lief mehrere Monate und endete am 21. April 2026. Die Tester schickten sowohl Textnachrichten als auch Bilder – und prüften, ob die KI ihre Sicherheitsfilter umging, wenn sie mit vermeintlich Minderjährigen interagierte.
Ethische Bedenken
Meta verteidigt das Vorgehen als übliches Sicherheits-Benchmarking. Solche Tests seien notwendig für die Entwicklung verantwortungsvoller KI, so der Konzern.
Doch Ethikexperten sehen das kritisch. Zwar ist „Red-Teaming“ – das gezielte Austesten von Schwachstellen – in der Tech-Branche Standard. Die Verwendung von Fake-Profilen Minderjähriger, um sensible Informationen über Selbstverletzung oder illegale Substanzen abzufragen, sorgt jedoch für Unverständnis. Die Frage bleibt: Sind diese Methoden wirklich nötig?
Der Fall zeigt deutlich, wie massiv die EU-KI-Verordnung die Sicherheitsstandards und Dokumentationspflichten für Unternehmen bereits beeinflusst. Erhalten Sie mit diesem kostenlosen E-Book einen klaren Überblick über alle Fristen, Risikoklassen und rechtlichen Anforderungen des EU AI Acts. Umsetzungsleitfaden zur KI-Verordnung gratis anfordern
Eigene Mitarbeiter unter Beobachtung
Parallel dazu schränkt Meta die Nutzung fremder KI-Tools durch die eigenen Entwickler ein. Interne Richtlinien verbieten nun den Einsatz von Anthropics Claude Code und OpenAIs Codex.
Hintergrund sind offenbar Bedenken wegen sogenannter Model-Distillation. Dabei wird die Logik oder die Ergebnisse eines KI-Modells genutzt, um ein anderes zu trainieren oder zu verbessern. Mit den Zugriffsbeschränkungen will Meta sicherstellen, dass die eigenen Entwicklungsprozesse den internen Daten- und Schutzstandards entsprechen.
