GitHub Copilot: Microsoft führt Token-Abrechnung ab Juni ein
04.06.2026 - 10:59:53 | boerse-global.deAuf der Entwicklerkonferenz Build 2026 präsentierte das Unternehmen sieben eigene Modelle und stellt die Abrechnung für Entwickler auf den Kopf.
Token-Zählung wird zum Kostenfaktor
Seit dem 1. Juni 2026 gilt für GitHub Copilot ein neues Abrechnungsmodell. Während einfache Code-Vervollständigungen weiterhin im Abo enthalten sind, werden komplexere Aufgaben jetzt nach verbrauchten Tokens abgerechnet. Die Kostenunterschiede sind enorm: Analysten berichten von Preissprüngen um das 24-Fache für ein und dieselbe Aufgabe – je nachdem, ob Microsofts eigene oder externe Modelle wie GPT-5.5 zum Einsatz kommen.
Anzeige: Wer die neuen Token-Kosten von GitHub Copilot im Griff behalten will, findet in diesem kostenlosen Report die wichtigsten Hebel – von der Modellauswahl bis zur Budgetkontrolle. Jetzt kostenlosen Strategie-Report anfordern
Besonders pikant: Entwickler, die Anthropics Claude Sonnet 4.6 über Copilot nutzen, zahlen fast das Dreifache im Vergleich zum leistungsstärkeren Opus 4.7. Grund dafür ist ein technisches Detail – Microsoft deaktiviert bei „Bring Your Own Key"-Modellen das sogenannte Prompt Caching, was den Token-Verbrauch in die Höhe treibt.
Unternehmen laufen Kosten davon
Die steigenden Ausgaben für KI-Entwicklungstools setzen Großkonzerne massiv unter Druck. Uber hatte sein gesamtes KI-Jahresbudget bereits nach vier Monaten aufgebraucht – 26 Millionen Dollar im ersten Quartal 2026. Der Fahrdienstvermittler reagierte mit einem monatlichen Limit von 1.500 Dollar pro Mitarbeiter für Tools wie Claude Code und Cursor.
Die Skepsis in den Chefetagen wächst. Viele Unternehmen zweifeln, ob sich die hohen Ausgaben durch messbare Produktivitätsgewinne rechtfertigen lassen. Microsoft hat darauf reagiert und eine neue Kennzahl eingeführt: „Intelligence Per Dollar" soll Unternehmen helfen, die Effizienz ihres Token-Einsatzes zu bewerten – statt nur auf rohe Leistung zu schauen.
Sieben eigene Modelle als Antwort
Mit der Vorstellung der MAI-Modellfamilie schlägt Microsoft einen neuen Kurs ein. Die sieben Modelle sollen die Abhängigkeit von OpenAI und Anthropic reduzieren – ein strategischer Schwenk, der nach der Kündigung des Exklusivvertrags mit OpenAI Ende April 2026 folgt.
Die wichtigsten Neuzugänge:
- MAI-Thinking-1: Ein Reasoning-Modell mit 35 Milliarden aktiven Parametern, das mit Spitzenmodellen der Konkurrenz mithalten soll
- MAI-Code-1-Flash: Ein spezialisiertes Codier-Modell mit 256.000 Tokens Kontextfenster, optimiert auf die neue Effizienz-Kennzahl
- MAI-Image-2.5 und MAI-Voice-2: Multimedia-Modelle für die Integration in bestehende Office-Anwendungen
Anzeige: Entwicklungsleiter, die bereits erste Kostenausschläge bei KI-Tools sehen, brauchen jetzt einen klaren Fahrplan zur Token-Optimierung – bevor das Budget wie bei Uber nach vier Monaten erschöpft ist. Dieser Report liefert konkrete Vergleichstabellen und Sparstrategien. Token-Optimierungs-Fahrplan jetzt sichern
Laut Microsoft hat sich der Abstand zur Konkurrenz in den letzten sechs Monaten deutlich verringert. Durch spezielle Trainingsmethoden wie „Zero Distillation" und „Frontier Tuning" wollen die Redmonder Unternehmenskunden eine maßgeschneiderte Modellanpassung bieten – und das angeblich zehnmal günstiger als mit externen Spitzenmodellen.
Das Ende der subventionierten KI
Die Botschaft aus Redmond ist klar: Die Ära der subventionierten KI-Entwicklung geht zu Ende. Während Firmen wie Salesforce und Uber mit Millionenrechnungen für Token-Verbrauch kämpfen, positioniert Microsoft seine MAI-Reihe als kosteneffiziente Alternative. Interne Benchmarks zeigen: Der MAI-Code-1-Flash erzielt im SWE-Bench Pro Spitzenwerte – und verbraucht dabei nur ein Drittel der Tokens, die Konkurrenzmodelle wie Claude Haiku 4.5 benötigen.
So schätzen die Börsenprofis Aktien ein!
Für. Immer. Kostenlos.
