Gemma, Googles

Gemma 4 12B: Googles multimodale KI läuft auf 16-GB-Notebooks

04.06.2026 - 11:30:28 | boerse-global.de

Google DeepMind veröffentlicht mit Gemma 4 12B ein multimodales KI-Modell, das lokal auf handelsüblichen Notebooks läuft und mit großen Modellen mithält.

Gemma 4 12B: Googles multimodale KI läuft auf 16-GB-Notebooks - Bild: über boerse-global.de
Gemma 4 12B: Googles multimodale KI läuft auf 16-GB-Notebooks - Bild: über boerse-global.de

Multimodale KI für den Hausgebrauch: Googles neues Open-Source-Modell läuft auf handelsüblichen Notebooks.

Google DeepMind hat am Mittwoch mit Gemma 4 12B Unified ein KI-Modell veröffentlicht, das Bilder, Texte, Audio und Video verarbeitet – und das auf Geräten mit nur 16 Gigabyte Arbeitsspeicher. Das unter der Apache-2.0-Lizenz veröffentlichte Modell markiert einen Wendepunkt: Komplexe KI-Anwendungen sind nicht länger an leistungsstarke Cloud-Server gebunden.

Anzeige

Während neue Modelle wie Gemma 4 die lokale Nutzung von KI revolutionieren, fragen sich viele Privatanwender noch, wie sie die Technologie im Alltag konkret einsetzen können. Dieser kostenlose PDF-Report zeigt Ihnen mit fertigen Anleitungen und Prompts, wie Sie KI-Tools sofort für Ihre persönliche Organisation nutzen. Urlaub planen, Sprachen lernen, Zeit sparen: So erledigt ChatGPT Ihre Alltagsaufgaben in Sekunden

Schlanke Architektur für maximale Effizienz

Das Herzstück des Modells sind knapp 12 Milliarden Parameter. Entscheidend für den geringen Ressourcenbedarf ist der Verzicht auf klassische Encoder-Module. Statt eines 550 Millionen Parameter schweren Bild-Encoders setzt Google auf ein Embedding-Modul mit nur 35 Millionen Parametern. Auch der Audio-Encoder fiel weg – Audiosignale werden direkt per linearer Projektion von 16-kHz-Wellen in Tokens umgewandelt.

Das ermöglicht native Sprachaufgaben wie automatische Spracherkennung und Sprecherdiarisation. Ein spezieller „Drafter" für Multi-Token-Vorhersage beschleunigt die Inferenz zusätzlich.

Die Hardware-Anforderungen variieren je nach Komprimierungsstufe:
- BF16-Version: 26,7 GB Speicher
- SFP8-Version: 13,4 GB Speicher
- Q4_0-Version: lediglich 6,7 GB Speicher

Damit läuft die KI selbst auf Standard-Notebooks mit 16 GB RAM flüssig – ideal für datenschutzkritische Anwendungen oder lokale KI-Assistenten.

Leistung auf Niveau größerer Modelle

Trotz der kompakten Bauweise liefert Gemma 4 12B Ergebnisse, die mit dem deutlich größeren 26B-Modell mithalten – bei weniger als halbem Speicherbedarf. Die Benchmarks sprechen eine klare Sprache:

  • MMLU Pro: 77,2 Prozent
  • GPQA Diamond: 78,8 Prozent
  • AIME 2026: 77,5 Prozent

Der Kontextfenster umfasst 256.000 Tokens, das Modell beherrscht über 140 Sprachen. Bei Audio- und Videoeingaben gibt es derzeit Beschränkungen: 30 Sekunden für Audio, 60 Sekunden für Video. In der Google-eigenen Edge-App „Eloquent" führte der Einsatz zu einer Qualitätssteigerung von über 60 Prozent.

Anzeige

Die rasante Entwicklung leistungsfähiger KI-Modelle für den Heimgebrauch macht deutlich, wie tiefgreifend diese Technik unseren Alltag verändern wird. Ein neuer Gratis-Report enthüllt die praktischsten Tricks für Einsteiger, damit Sie diese digitalen Helfer ohne Vorwissen sofort effektiv bedienen können. Diese einfachen ChatGPT-Befehle kennen die wenigsten – dabei erleichtern sie den Alltag enorm

Datenschutz als Trumpf

Entwickler und Unternehmen können die KI lokal betreiben – ohne Daten in die Cloud senden zu müssen. Das Modell unterstützt native Funktionsaufrufe, sodass sich autonome Software-Agenten für Code-Reviews oder Dokumentenanalyse erstellen lassen.

Gemma 4 12B ist kompatibel mit gängigen Frameworks wie vLLM, MLX und llama.cpp und steht über Kaggle und Hugging Face zum Download bereit. Die gesamte Gemma-Familie – mit Modellen zwischen 2 und 31 Milliarden Parametern – hat inzwischen die Marke von 150 Millionen Downloads geknackt.

So schätzen die Börsenprofis Aktien ein!

<b>So schätzen die Börsenprofis Aktien ein!</b>
Seit 2005 liefert der Börsenbrief trading-notes verlässliche Anlage-Empfehlungen – dreimal pro Woche, direkt ins Postfach. 100% kostenlos. 100% Expertenwissen. Trage einfach deine E-Mail Adresse ein und verpasse ab heute keine Top-Chance mehr. Jetzt abonnieren.
Für. Immer. Kostenlos.
de | wissenschaft | 69481912 |