Gemini, Live

Gemini 3.5 Live Translate: Google übersetzt Sprache mit Originalstimme

09.06.2026 - 20:44:27 | boerse-global.de

Google stellt Gemini 3.5 Live Translate vor, das Sprache in Echtzeit übersetzt und dabei Tonfall sowie Betonung des Sprechers bewahrt.

Google Gemini 3.5: Echtzeit-Übersetzung mit originaler Stimmlage
Gemini - A hand holding a smartphone displaying a live translation interface, with blurred diverse people in the background. 09.06.2026 - Bild: über boerse-global.de

Der Suchmaschinenriese revolutioniert die Sprachbarriere: Gemini 3.5 Live Translate übersetzt Gespräche in Sekundenschnelle und bewahrt dabei Stimmlage und Betonung.

Google hat am heutigen Dienstag, dem 9. Juni 2026, sein neues KI-Übersetzungsmodell Gemini 3.5 Live Translate vorgestellt. Die Technologie übersetzt Sprache in Sprache nahezu in Echtzeit und beherrscht mehr als 70 Sprachen. Das Besondere: Die originale Intonation, Tonhöhe und Sprechgeschwindigkeit des Sprechers bleiben erhalten.

Das Modell basiert auf der Gemini-3-Pro-Architektur und verarbeitet Audio-Input mit einem Kontextfenster von 128.000 Tokens. Die Ausgabe erfolgt sowohl als Audio als auch als Text mit bis zu 64.000 Tokens. Die Verzögerung beträgt laut technischen Unterlagen nur wenige Sekunden.

Anzeige

Ob Echtzeit-Übersetzung auf Reisen oder die Organisation des Alltags – moderne KI-Tools verändern grundlegend, wie wir Technik nutzen. Dieser kostenlose Ratgeber zeigt Ihnen, wie Sie die Möglichkeiten von Chat-Modellen auch ohne Vorkenntnisse für Ihre persönlichen Aufgaben einsetzen. Urlaub planen, Sprachen lernen, Zeit sparen: So erledigt ChatGPT Ihre Alltagsaufgaben in Sekunden

Integration in den Google-Kosmos

Die Übersetzungsfunktion wird sofort in mehrere Google-Dienste integriert. Die Google Translate App für Android und iOS erhält das Update als erstes. Android-Nutzer profitieren zudem von einem speziellen „Listening Mode", der übersetzte Audios direkt über das Headset abspielt.

Für Unternehmen kommt die Technologie über Google Meet. Die Videokonferenz-Plattform unterstützt künftig über 2.000 Sprachkombinationen. Eine private Vorschau für Workspace-Kunden startet noch im Juni 2026, der breite Rollout folgt im Laufe des Jahres. Entwickler erhalten über die Gemini Live API und Google AI Studio Zugriff auf das Modell.

Technische Grenzen und Sicherheitsvorkehrungen

Das System überwindet klassische Hürden der Sprachübersetzung – etwa den natürlichen Gesprächsfluss. Allerdings räumen die Entwickler Einschränkungen ein: Gelegentlich treten Inkonsistenzen bei der Stimm-Synthese auf, und starke Akzente oder schnelle Sprachwechsel bereiten dem Modell noch Schwierigkeiten.

Ein wichtiges Sicherheitsmerkmal: Alle von Gemini 3.5 Live Translate generierten Audios erhalten eine SynthID-Wasserzeichen. Diese digitale Kennzeichnung macht KI-generierte Sprache von menschlicher Stimme unterscheidbar – ein entscheidender Schritt gegen Missbrauch und Desinformation.

Partnerschaft mit Grab und Branchenkontext

Eine erste große kommerzielle Anwendung zeichnet sich im Ride-Hailing-Sektor ab. Der südostasiatische Fahrdienst- und Lieferplattform Grab testet die Technologie bereits. Ziel ist die Verbesserung der Kommunikation zwischen Fahrern und Reisenden – ein Bereich, in dem monatlich über zehn Millionen Sprachanrufe stattfinden.

Die Ankündigung folgt auf eine Woche voller KI-Neuigkeiten. Erst gestern, am 8. Juni, verkündete Apple auf seiner Entwicklerkonferenz, dass der Sprachassistent Siri auf Basis von Google-Gemini-Modellen neu aufgebaut wird. Die Integration kommt mit iOS 27 und soll Nutzern erweiterte Konversationsfähigkeiten bieten.

So schätzen die Börsenprofis Aktien ein!

<b>So schätzen die Börsenprofis Aktien ein!</b>
Seit 2005 liefert der Börsenbrief trading-notes verlässliche Anlage-Empfehlungen – dreimal pro Woche, direkt ins Postfach. 100% kostenlos. 100% Expertenwissen. Trage einfach deine E-Mail Adresse ein und verpasse ab heute keine Top-Chance mehr. Jetzt abonnieren.
Für. Immer. Kostenlos.
de | wissenschaft | 69510161 |