OpenAI lance des modèles vocaux en temps réel pour ChatGPT

5 min de lecture · The Decoder · Matthias Bastian · 07/05/2026 IA générative 9/10 Élevé

OpenAI lance GPT-Realtime-2, GPT-Realtime-Translate et GPT-Realtime-Whisper, des modèles vocaux capables de raisonner, traduire et transcrire en temps réel. Ces modèles surpassent leurs prédécesseurs en précision et en complexité.

Que faut-il retenir ?

GPT-Realtime-2 offre un raisonnement équivalent à GPT-5 avec une fenêtre contextuelle de 128 000 tokens.
GPT-Realtime-Translate prend en charge plus de 70 langues d'entrée et 13 langues de sortie.
GPT-Realtime-Whisper est un modèle de transcription en streaming à faible latence.
GPT-Realtime-2 atteint 96,6 % de précision sur Big Bench Audio, contre 81,4 % pour son prédécesseur.

Pourquoi cette nouvelle compte-t-elle ?

Ces modèles révolutionnent les interactions vocales en temps réel, permettant des conversations fluides, des traductions précises et des transcriptions rapides. Ils sont essentiels pour les secteurs comme le support client, les ventes transfrontalières et les réunions professionnelles.

Public concerné : développeurs, entreprises

Quelles sont les améliorations apportées par GPT-Realtime-2 ?

GPT-Realtime-2 offre un raisonnement équivalent à GPT-5, une fenêtre contextuelle de 128 000 tokens et une précision de 96,6 % sur Big Bench Audio.

Voir l'article original → Lire en français

← Retour aux actualités

Accueil

Outils

Annuaire

Apprendre