Après la disponibilité de ChatGPT sur Windows, l’une des fonctions attendue depuis longtemps, le mode vocal avancé, est désormais disponible en France. OpenAI a lancé cette nouvelle fonctionnalité à la fin septembre 2024, mais son déploiement en Europe s’est fait de manière plus progressive. Découvrez les avantages de ce mode, comment l’activer, et ce qu’il apporte de nouveau dans l’interaction avec l’IA.
Le mode vocal avancé, lancé avec le modèle GPT-4, représente une avancée majeure dans l’usage de ChatGPT. Disponible uniquement pour les utilisateurs de l’offre ChatGPT Plus, il vise à rendre les conversations plus naturelles. Contrairement aux versions vocales précédentes, ce mode intègre des intonations réalistes, ainsi que des signaux non verbaux, offrant une expérience immersive proche de celle d’une interaction humaine. Les utilisateurs peuvent également interrompre l’IA en pleine conversation, apportant une dynamique inédite dans l’échange.
Cette innovation permet à ChatGPT de s’adapter à différentes situations, avec la capacité d’intégrer des émotions dans ses réponses. Toutefois, bien que la fluidité se soit grandement améliorée, certaines limites subsistent. Les coupures dans les réponses sont moins abruptes, mais il reste une légère latence, rendant l’échange encore perfectible par rapport à une conversation humaine.
L’accès à cette nouvelle fonctionnalité se fait exclusivement via l’application mobile de ChatGPT. Pour l’activer, suivez ces étapes simples :
Dans les paramètres, il est possible de définir si les conversations vocales peuvent être utilisées pour l’entraînement des modèles d’IA. À la fin de chaque échange, la transcription écrite de la discussion apparaît dans l’historique, permettant de revenir sur les échanges passés comme pour une conversation textuelle classique.
Avec le mode vocal avancé, les utilisateurs peuvent non seulement profiter de voix plus variées et expressives, mais aussi tester la flexibilité de ces voix. Il est possible, par exemple, de demander à l’IA de chuchoter ou d’adopter une intonation amusante, créant ainsi une interaction personnalisée. Très utilisé par le monde étudiant, cette capacité rend l’outil plus interactif et divertissant, tout en permettant des ajustements selon le contexte de la conversation.
Cependant, bien que cette fonctionnalité améliore considérablement l’expérience, elle n’égale pas encore le niveau d’une conversation totalement fluide entre humains. Le mode reste néanmoins prometteur, offrant une nouvelle dimension à l’échange avec l’intelligence artificielle.
Lors de la présentation de GPT-4, une autre fonctionnalité liée à la vidéo avait été mentionnée. Celle-ci permettrait aux utilisateurs de converser avec ChatGPT tout en filmant leur environnement, à l’image d’une conversation FaceTime. Bien que ce mode n’ait pas encore été déployé auprès du grand public, il pourrait représenter une nouvelle étape dans le développement des interactions avec l’IA, en combinant voix et images pour une expérience encore plus immersive.
En attendant, le mode vocal avancé reste une des innovations les plus marquantes de ChatGPT, offrant aux utilisateurs une interaction plus naturelle et personnalisée.