Imaginez pouvoir avoir une conversation naturelle avec une IA qui voit le monde à travers vos yeux. Ce n’est plus de la science-fiction ! OpenAI vient de concrétiser une promesse vieille de sept mois en déployant les capacités vidéo en temps réel pour ChatGPT, marquant ainsi un tournant majeur dans l’histoire de l’intelligence artificielle conversationnelle.
Une vision augmentée pour votre Assistant Personnel
La nouvelle fonctionnalité, baptisée Advanced Voice Mode with vision, permet aux utilisateurs de ChatGPT Plus, Team et Pro de transformer leur smartphone en véritable fenêtre interactive sur le monde. Plus besoin de décrire ce que vous voyez : pointez simplement votre téléphone vers un objet, et ChatGPT le comprendra instantanément, prêt à engager une conversation pertinente à son sujet.
Des fonctionnalités qui changent la donne
L’innovation ne s’arrête pas là. Le système peut également analyser ce qui se passe sur votre écran via le partage d’écran. Que vous soyez perdu dans les méandres des paramètres de votre appareil ou bloqué sur un problème de mathématiques, votre assistant est là pour vous guider avec une compréhension contextuelle approfondie.
Comment ça marche ?
- Tapez sur l’icône vocale à côté de la barre de chat
- Activez l’icône vidéo en bas à gauche
- Pour le partage d’écran, utilisez le menu à trois points
Une disponibilité progressive et maîtrisée
Le déploiement, qui a débuté ce jeudi, s’étalera sur une semaine. Cependant, certains utilisateurs devront patienter : les abonnés Enterprise et Edu jusqu’en janvier, tandis que l’Europe (UE, Suisse, Islande, Norvège et Liechtenstein) devra attendre une date ultérieure non précisée.
Des perspectives prometteuses, mais réalistes
Si les démonstrations sont impressionnantes, comme celle réalisée sur CBS News où Greg Brockman, président d’OpenAI, mettait le système à l’épreuve, il est important de noter que la technologie n’est pas infaillible. Des erreurs peuvent survenir, notamment sur des problèmes complexes de géométrie, rappelant que nous sommes au début d’une nouvelle ère technologique en constante évolution.
Un petit bonus festif en cette fin d’année
Pour célébrer cette avancée majeure, OpenAI a également introduit un « Mode Santa », permettant aux utilisateurs d’interagir avec une voix du Père Noël. Une touche ludique qui démontre la volonté de rendre cette technologie non seulement utile mais aussi divertissante.
La course à l’innovation dans le domaine de l’IA conversationnelle s’intensifie, avec Google et Meta développant leurs propres solutions similaires. Cette nouvelle étape franchie par OpenAI marque le début d’une ère où nos interactions avec l’intelligence artificielle deviennent toujours plus naturelles et intuitives. L’avenir nous dira jusqu’où cette technologie pourra nous mener, mais une chose est sûre : la façon dont nous interagissons avec la technologie ne sera plus jamais la même.