ChatGPTs neue Stimme: Wann wird KI zu menschlich?
Für den Advanced Voice Mode wurde nicht nur die Auswahl der verfügbaren Stimmen noch einmal erhöht und deren Aussprache optimiert. Die KI soll sogar in der Lage sein, adäquat auf die emotionale Befindlichkeit der User:innen zu reagieren. An passenden Stellen fügt der Chatbot sogar kurze Atempausen oder auch längere, simulierte Denkpausen in seine Antworten ein.
Was die neue Version von älteren Sprachausgaben unterscheidet, ist nicht nur die natürlichere Aussprache. In Tests, die das Team des KI-Podcasts durchführte, zeigte sich: Die KI atmet zwischen den Sätzen, lacht bei lustigen Bemerkungen und passt ihre Stimmlage der Situation an. „Es gab Momente, wo ich einfach nur dasaß und dachte – okay, da ist irgendwie jetzt eine Präsenz im Raum“, beschreibt Podcast-Host Marie Kilg ihre Erfahrung.
Technisch basiert das System auf einem sogenannten multimodalen Ansatz. Anders als frühere Sprachausgaben, die Text erst in gesprochene Sprache umwandeln mussten, wurde ChatGPTs neues Voice-Feature direkt mit Audiodaten trainiert. Das ermöglicht eine deutlich natürlichere Kommunikation.
Doch bei aller beeindruckenden Natürlichkeit – ein echtes Gespräch kann die KI nicht simulieren. Sie unterbricht ihr Gegenüber nicht, kann keine tiefergehenden Diskussionen führen und verfügt über kein Verständnis für die aktuelle Situation. Was menschlich erscheint, ist letztlich das Ergebnis gezielter Design-Entscheidungen der Entwickler.
Im Juli 2024 war das Feature zunächst nur in den USA für Beta-Tester:innen verfügbar und wurde dann im September für Premium-Abonnent:innen eingeführt.
Erst vor Kurzem hatte OpenAI den verbesserten Sprachmodus dann auch in der EU ausgerollt. Allerdings nur für Kund:innen, die über einen Plus- oder Team-Account verfügen.
Manchmal kann das Fahren in unbekannten Gegenden mit mehreren Fahrspuren, Kreuzungen und Ausfahrten verwirrend sein. Damit ihr solche Situationen besser vorhersehen könnt, zeigt euch unsere verbesserte Navigation jetzt Fahrspuren, Zebrastreifen und Verkehrsschilder deutlich auf der Karte an. Und weil niemand gerne in letzter Minute feststellt, dass er eigentlich die Spur wechseln muss, zeigen wir euch auch genau, auf welcher Spur ihr euch befinden solltet. Folgt während der Navigation einfach der blauen Linie in den Fahrspurmarkierungen.
Diese Funktionen werden in den USA ab dieser Woche auf Android und iOS eingeführt. In den kommenden Monaten werdet ihr dort auch in der Google Suche ähnliche Nutzererfahrungen erleben können – einschließlich KI-gestützter Zusammenfassung von Bewertungen und der Möglichkeit, detaillierte Fragen zu Orten zu stellen.