Skip to main content
Allgemein

OpenAI stellt GPT-4o vor: Revolutionäre Stimmen für den KI-Dialog

Ein stoischer Löwe oder ein fies lachender Fuchs: In einem Demovideo zeigt OpenAI, wie GPT-4o Stimmen synthetisieren kann, um auf spannende Weise mit Nutzern zu kommunizieren.

OpenAI hat kürzlich GPT-4o vorgestellt, ein fortschrittliches Sprachmodell, das in der Lage ist, Stimmen zu erzeugen und mündliche Dialoge mit den Nutzern zu führen. Diese Technologie erinnert an Sprachassistenten wie Alexa und Google Assistant, bietet jedoch deutlich ausgefeiltere Möglichkeiten.

In einem Demo-Video zeigt OpenAI beeindruckend, wie das Modell funktioniert. Ein Nutzer gibt Sprachbefehle über eine App auf seinem Smartphone ein, um eine Geschichte zu erstellen. Die Software kann verschiedenen Charakteren Stimmen zuordnen: eine weise Eule, ein stoischer Löwe, eine schreckhafte Maus und ein fies lachender Fuchs. Jede Stimme wird anhand der vorgegebenen Charaktereigenschaften synthetisiert.

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen

Dialog in Echtzeit

Das Besondere: GPT-4o meistert flüssige, schnelle Gespräche inklusive typischer Füllwörter wie „like“, ohne den Faden zu verlieren. Wie bei Textinteraktionen kann sich die KI vergangene Eingaben merken und darauf aufbauen, was nun auch mündlich funktioniert. Das Modell schafft so eine dynamische und anpassungsfähige Kommunikation.

Experimentieren und rechtliche Hürden

Derzeit können Nutzer GPT-4o mit einem entsprechenden Account testen. Parallel dazu ist OpenAI in einen Rechtsstreit mit Schauspielerin Scarlett Johansson verwickelt. Einige KI-generierte Stimmen sollen ihrer Stimme zu ähnlich sein, was zu rechtlichen Auseinandersetzungen geführt hat. Es bleibt abzuwarten, wie OpenAI auf diese Herausforderung reagieren wird.

Zusammenarbeit mit Apple?

OpenAI plant eine Partnerschaft mit Apple. Gerüchten zufolge könnte GPT-4o zukünftig Siri ersetzen, was die Zusammenarbeit beider Unternehmen auf eine neue Ebene heben würde. Konkrete Pläne hierzu sind jedoch noch nicht bekannt.

Quelle: Golem

Leave a Reply

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

Verified by MonsterInsights