KI-Modelle: Microsoft senkt Copilot-Kosten um 60 bis 80 Prozent
21.06.2026 - 22:18:42 | boerse-global.de
Große Anbieter suchen nach Wegen, Kosten zu senken und Handelsbeschränkungen zu umgehen. Die Entwicklung hin zu offenen Modellen und flexiblen Architekturen gewinnt rasant an Fahrt.
Warum so viele Deutsche ChatGPT nutzen – aber kaum einer weiß, wie man es richtig anwendet: Ein kostenloser Ratgeber zeigt, wie Sie die KI sofort für Ihren Alltag nutzen können – ganz ohne Vorkenntnisse. Kostenlosen KI-Ratgeber jetzt herunterladen
Microsoft plant drastische Kostensenkung mit DeepSeek
Der Softwarekonzern Microsoft arbeitet daran, eine angepasste Version des DeepSeek-Modells in seine Copilot-Plattform zu integrieren. Das Ziel: die Betriebskosten massiv zu senken. Durch den Betrieb auf der eigenen Azure-Infrastruktur ließen sich die Ausgaben im Vergleich zum Standarddienst um 60 bis 80 Prozent reduzieren.
Auch andere Modelle wie Llama 3 und Mistral Large stehen auf dem Prüfstand. Das neue Modell soll noch im Juni zu nutzungsbasierten Preisen angeboten werden. Ein entscheidender Vorteil für Unternehmen: Die Daten bleiben in den bestehenden Sicherheitszonen von Microsoft.
OpenRouter reagiert auf Exportkontrollen
Die US-Exportbeschränkungen vom 12. Juni zwangen Anbieter wie Anthropic, ihre Modelle Fable 5 und Mythos 5 vom Markt zu nehmen. OpenRouter zog nur einen Tag später nach und launchte die Fusion API.
Das Prinzip: Mehrere Modelle arbeiten parallel an einer Anfrage, ein zweites Modell – etwa Claude Opus 4.8 – fasst die Ergebnisse zusammen. Erste Tests zeigen: Eine günstige Kombination aus Gemini 3 Flash, Kimi K2.6 und DeepSeek V4 Pro erreicht fast die Qualität des gesperrten Fable 5 – bei halben Kosten. Die Spitzenkombination aus Fable 5 und GPT-5.5 erzielte im DRACO-Benchmark 69 Prozent und übertraf damit das Einzelmodell.
Offene Modelle holen auf
Zwei chinesische Anbieter sorgen für Aufsehen. Z.ai veröffentlichte Mitte Juni GLM-5.2 mit 360 Milliarden Parametern. Das Modell brilliert besonders bei Programmieraufgaben und erreichte im SWE-Bench Verified Test 76,4 Prozent. Vercel-CEO Guillermo Rauch zeigte sich „echt beeindruckt" – sein Unternehmen integrierte das Modell bereits am 16. Juni in den eigenen KI-Gateway. GLM-5.2 steht unter der MIT-Lizenz und bietet ein Kontextfenster von einer Million Tokens.
Moonshot AI konterte am 12. Juni mit Kimi K2.7 Code. Das Modell nutzt eine Mixture-of-Experts-Architektur und positioniert sich als kostengünstige Alternative zu Opus 4.8. Der Preis: 0,95 Euro pro Million Input-Tokens. Das Shanghai Innovation Institute legt noch einen drauf und stellt sein Nex-N2-Pro-Modell bis zum 23. Juni kostenlos zur Verfügung.
Die Open-Source-Bewegung gewinnt an Fahrt
Entwickler setzen zunehmend auf quelloffene Werkzeuge. OpenCode, ein terminalbasiertes Programmierwerkzeug, hat auf GitHub 160.000 Sterne erreicht und wird von rund 7,5 Millionen aktiven Entwicklern genutzt. Der Vorteil gegenüber Diensten wie Cursor oder GitHub Copilot: keine monatlichen Abogebühren, nur die Kosten für die API-Nutzung.
Genervt von Windows-Fehlermeldungen und Zwangs-Updates? Das kostenlose Linux-Startpaket zeigt Schritt für Schritt, wie Sie Ubuntu parallel zu Windows installieren – ohne Risiko und ohne Datenverlust. Linux Startpaket mit Ubuntu-Vollversion gratis sichern
Einige Entwickler gehen noch weiter und ersetzen Cloud-Dienste durch eigene Hardware. Fallstudien zeigen: Mit einem Mac Mini oder Ubuntu-System lassen sich GitHub Copilot und Cloud-Speicher ersetzen. Die monatlichen Stromkosten sinken auf etwa acht Euro. Der Preis: höhere Eigenverantwortung für Backups und langsamere KI-Antwortzeiten.
