Le robot-chien de Boston Dynamics sait maintenant parler grâce à ChatGPT

Tout va bien (non.) — Spot, le robot-chien pas du tout flippant de Boston Dynamics est désormais en mesure de prendre des décisions et de s'exprimer grâce à ChatGPT.
Dans un billet publié sur son blog, l'entreprise américaine spécialisée dans la robotique ne cache pas son intérêt pour la percée des modèles d'intelligence artificielle qui alimentent des chatbots comme ChatGPT.
Gentil le toutou
Boston Dynamics a mis au point une version démo de son célèbre robot-chien reposant sur ce genre de modèle afin de lui permettre de prendre ses décisions en temps réel.
Le résultat est un robot "guide touristique" capable d'évoluer dans un environnement, d'observer les objets présents et de s'appuyer sur l'IA pour les décrire.
Le robot est par la même occasion en mesure de répondre aux questions de son audience et de planifier ses actions.
Pour ce faire, Spot est équipé d'un haut-parleur et d'un microphone, et est connecté à ChatGPT et l'API de Whisper, l'IA de reconnaissance vocale d'OpenAI. Whisper retranscrit le langage parlé en texte, lequel est ensuite traité par ChatGPT pour générer une réponse appropriée.
Les équipes de Boston Dynamics ont d'ailleurs partagé sur leur blog les prompts qui ont défini le cadre de conversation pour le robot.
Pour renforcer l'illusion de conversation, Boston Dynamics utilise le bras et la pince articulés de son robot pour l'animer lorsque celui-ci s'exprime, des petits yeux et quelques déguisements lui ont même été ajoutés pour l'occasion.
La vidéo ci-dessous expose le robot-chien en action :
Vous avez dit flippant ?
Pendant leurs tests menés au sein des locaux de Boston Dynamics, les ingénieurs expliquent néanmoins avoir été surpris par certaines réactions du robot.
Quand ils lui ont demandé, par exemple, qui était Marc Raibert — qui n'est autre que le fondateur et ancien CEO de l'entreprise de robotique —, celui-ci a répondu qu'il ne savait pas, et a trouvé judicieux d'aller poser cette question aux collaborateurs du support informatique, ce qu'il s'est empressé de faire de lui-même.
Plus surprenant encore : lorsque les ingénieurs lui ont cette fois demandé qui étaient ses "parents", le robot s'est rendu à l'endroit où les anciennes versions des robots "Spot" sont exposées (Spot V1 et Big Dog), et leur a répondu que ceux-ci étaient ses "aînés".
Tout va bien, n'est-ce pas ?
Le robot-chien a malgré tout mis en évidence certaines lacunes de ChatGPT. Lorsqu'il a été interrogé sur le robot "Stretch" de Boston Dynamics, dédié aux chargements lourds, le robot a répondu que celui-ci servait à faire du yoga (en référence au mot anglais qui signifie "s'étirer").
Le temps de latence avant que le robot fournisse sa réponse peut parfois être assez élevé, allant parfois jusqu'à 6 secondes, cassant quelque peu l'effet d'interaction.
Boston Dynamics s'avoue néanmoins enthousiaste face à ce test, et imagine déjà des cas d'usage où les robots pourraient communiquer sur leurs tâches avec les humains qui les encadrent.
Ceux-ci pourraient notamment s'avérer utiles dans des domaines comme l'industrie, le BTP, ou même, pourquoi pas, dans le tourisme ou le divertissement ?
L'histoire ne dit pas si, de leur côté, les réalisateurs de Black Mirror ont commencé à plancher sur un nouvel épisode pour leur série.
À lire aussi sur Les Joies du Code :
- 🍪 Pour mon site, j’ai intégré le gestionnaire de cookies le moins pire des Internets
- 🛠️ Les API de ChatGPT et Whisper sont désormais disponibles pour les développeurs
- 🗣️ OpenAI présente Whisper, son IA de reconnaissance vocale multilingue open source
- 🚘 Après de trop nombreux incidents, la Californie siffle la fin des voitures autonomes sur ses routes
À propos de l'auteur
Nicolas Lecointre
Chief Happiness Officer des développeurs, ceinture noire de sudo. Pour rire, j'ai créé Les Joies du Code. J'utilise Vim depuis 10 ans parce que je sais pas comment le quitter.
À lire également

Passbolt : le gestionnaire de mots de passe open source que votre équipe mérite vraiment
Je connais l’histoire, vous la connaissez, on la connaît tous. Le stagiaire qui est resté six mois, qui a fini par avoir accès à un peu (beaucoup) plus de choses...
Articles similaires

Elon Musk lance Grok, son IA censée concurrencer ChatGPT

DevDay : toutes les annonces de la première conférence pour développeurs d'OpenAI
Un utilisateur de Reddit crée des QR codes artistiques opérationnels en utilisant Stable Diffusion

Stack Overflow s’associe à OpenAI pour améliorer ChatGPT pour les développeurs

Elon Musk lance Grok, son IA censée concurrencer ChatGPT

DevDay : toutes les annonces de la première conférence pour développeurs d'OpenAI
Un utilisateur de Reddit crée des QR codes artistiques opérationnels en utilisant Stable Diffusion

Stack Overflow s’associe à OpenAI pour améliorer ChatGPT pour les développeurs
Plus de contenu

Quand mon dev passe l'étape de test du premier coup

Quand j'essaie de vendre ma solution technique au reste de l'équipe
Quand je suis en pause et qu'une notif m'indique que le serveur est down
Quand je pars en week-end après avoir aidé une autre équipe à corriger son bug

Quand je réalise que je viens de livrer du code bugué en production
Quand j'essaie de suivre les indications du dev senior

Quand j'exécute mon code pour la première fois

Le chef de projet quand la production est down

Quand mon dev passe l'étape de test du premier coup

Quand j'essaie de vendre ma solution technique au reste de l'équipe
Quand je suis en pause et qu'une notif m'indique que le serveur est down
Quand je pars en week-end après avoir aidé une autre équipe à corriger son bug



