OpenAI lance des modèles vocaux en temps réel pour ChatGPT
OpenAI lance GPT-Realtime-2, GPT-Realtime-Translate et GPT-Realtime-Whisper, des modèles vocaux capables de raisonner, traduire et transcrire en temps réel. Ces modèles surpassent leurs prédécesseurs en précision et en complexité.
Que faut-il retenir ?
- GPT-Realtime-2 offre un raisonnement équivalent à GPT-5 avec une fenêtre contextuelle de 128 000 tokens.
- GPT-Realtime-Translate prend en charge plus de 70 langues d'entrée et 13 langues de sortie.
- GPT-Realtime-Whisper est un modèle de transcription en streaming à faible latence.
- GPT-Realtime-2 atteint 96,6 % de précision sur Big Bench Audio, contre 81,4 % pour son prédécesseur.
Pourquoi cette nouvelle compte-t-elle ?
Ces modèles révolutionnent les interactions vocales en temps réel, permettant des conversations fluides, des traductions précises et des transcriptions rapides. Ils sont essentiels pour les secteurs comme le support client, les ventes transfrontalières et les réunions professionnelles.
Public concerné : développeurs, entreprises
Quelles sont les améliorations apportées par GPT-Realtime-2 ?
GPT-Realtime-2 offre un raisonnement équivalent à GPT-5, une fenêtre contextuelle de 128 000 tokens et une précision de 96,6 % sur Big Bench Audio.
Commentaires (0)
💡 Aucun lien externe ni code HTML accepté. Soyez respectueux. Les commentaires sont modérés avant publication.
Aucun commentaire pour le moment. Soyez le premier !