Voice ist im Kommen
Miteinander reden ist die älteste und wirkungsvollste Kommunikationsform. KI macht es möglich, dass Voice auch für Unternehmen an Bedeutung gewinnen wird.
ChatGPT redet richtig
OpenAI hat begonnen, den Advanced Voice Mode von ChatGPT, eine hyper-realistische Sprachantwortfunktion, für eine ausgewählte Gruppe von ChatGPT Plus Nutzern einzuführen. Dieser neue Modus, bekannt als GPT-4o, beeindruckte bereits bei einer Demo im Mai mit seiner Ähnlichkeit zu menschlichen Stimmen. Die erste Alpha-Version steht nun zur Verfügung, wobei die vollständige Einführung für den Herbst 2024 geplant ist.
OpenAI klont Stimmen
OpenAI hat mit Voice Engine eine revolutionäre Technologie zur Stimmenklonung vorgestellt, die lediglich eine kurze Audioaufnahme benötigt, um natürliche Stimmen zu generieren. Die Technologie bietet eine breite Palette von Anwendungsmöglichkeiten in verschiedenen Branchen und Bereichen. Großes Potenzial bietet diese Innovation für das digitale Marketing, da sie personalisierte Kommunikation ermöglicht.
KI beantwortet Calls
Truecaller, bekannt für seine innovative Anrufer-ID-Dienstleistung, hat eine neue Funktion angekündigt, die in Zusammenarbeit mit Microsoft entwickelt wurde. Diese Funktion ermöglicht es Nutzern, Anrufe in ihrer eigenen Stimme beantworten zu lassen. Dies wird durch die Verwendung von Microsofts Personal Voice-Technologie ermöglicht, die im November als Teil von Azure AI Speech eingeführt wurde.
Voicebots sind beliebt
Viele Unternehmen setzen aktuell auf das Zusammenspiel von menschlichem und KI-Support, um das Kundenerlebnis über alle Kanäle und Kontaktpunkte hinweg zu verbessern und individueller auf Kundenanliegen einzugehen. Eine aktuelle Umfrage in den USA von Genesys zeigt, dass Kunden sich sehr gut vorstellen können, mit einem virtuellen Kundenbetreuer zu interagieren – wenn dieser die Stimme ihres Lieblingspromis hat.
Elevenlabs wird Einhorn
ElevenLabs, ein Startup für KI-gestützte Sprachsynthese, hat in einer Serie-B-Finanzierungsrunde 80 Millionen US-Dollar eingesammelt, was die Bewertung des Unternehmens auf über 1 Milliarde US-Dollar anhebt. Das Unternehmen, bekannt für seine browserbasierte Sprachgenerierungs-App, ermöglicht die Erstellung lebensechter Stimmen mit einstellbaren Parametern wie Betonung und Emotion.