OpenAI rend son IA DALL-E accessible aux développeurs avec le lancement d'une API
Enfin une API pour l'IA en text-to-image — Le laboratoire OpenAI, derrière l'incroyable IA DALL-E, capable de générer des images à partir de descriptions textuelles, vient d'annoncer l'ouverture de son API au public.
À partir d'aujourd'hui, les développeurs peuvent donc commencer à construire des applications s'appuyant sur cette IA.
On connaît tous à minima DALL-E à travers des comptes Twitter publiant des images toujours plus bizarres et drôles générées par l'IA. Pour faire simple, vous rentrez n'importe quelle phrase (vraiment n'importe quelle phrase 👀) et l'IA vous sort une ou plusieurs images qu'elle considère être des interprétations de ce que vous avez écrit.
— Weird Dall-E Generations 🧌 (@weirddalle) October 24, 2022
Aujourd'hui, cette IA est rendue accessible à tous au travers d'une API pour l'instant en version beta. Les développeurs pourront ainsi intégrer DALL-E à leurs projets en passant par une intégration officielle et surtout documentée. D'ailleurs, tout y semble déjà bien renseigné à l'aide d'exemple parlants.
OpenAI (à l'origine de DALL-E mais aussi de Whisper) fait référence dans son annonce à l'usage de sa nouvelle API par la solution Microsoft Designer. Le nouveau logiciel de création graphique de la firme de Redmond, concurrent direct de Canva, s'appuie en effet l'API de DALL-E pour permettre aux créatifs ou communicants de générer des visuels pour des posts sur les réseaux sociaux ou tout autre type de support.
Microsoft prévoirait aussi de l'intégrer à Bing et Edge afin de permettre de générer des images lorsque celles proposées dans les résultats ne sont pas assez satisfaisants. Sur ce dernier point, reste à voir s'il s'agira de créer une image de zéro ou de faire une variation d'un des résultats comme le permet déjà l'intelligence artificielle.
Dernier point qui n'est pas des moindres : OpenAI a intégré un système de modération directement au sein de son API. Ce ne sera donc pas aux développeurs de modérer les demandes à caractères haineux ou gores dans leurs applications, l'API le faisant d'elle-même. On ne sait pas encore ce qui sera exactement accepté ou non, ni s'il sera quand même possible de s'amuser un peu avec ce système.
Ce qui est sûr, c'est que cette ouverture au public va donner naissance à de toutes nouvelles applications dans les mois qui arrivent. Presque tous les domaines peuvent trouver quelque chose à tirer de la génération d'images par texte. Les possibilités sont d'autant plus grandes que l'IA s'améliore continuellement et sur des jeux de données toujours plus importants.
À propos de l'auteur
Etienne Moureton
Développeur Frontend freelance Actuellement chez Ykone Globalement, j'aime construire de petits produits, expérimenter des trucs... Tant que ça touche à du dev.
Articles similaires
DevDay : toutes les annonces de la première conférence pour développeurs d'OpenAI
Des chercheurs créent 3D-GPT, une IA qui génère des mondes virtuels avec des prompts à la ChatGPT
Après de trop nombreux incidents, la Californie siffle la fin des voitures autonomes sur ses routes
Le robot-chien de Boston Dynamics sait maintenant parler grâce à ChatGPT
DevDay : toutes les annonces de la première conférence pour développeurs d'OpenAI
Des chercheurs créent 3D-GPT, une IA qui génère des mondes virtuels avec des prompts à la ChatGPT
Après de trop nombreux incidents, la Californie siffle la fin des voitures autonomes sur ses routes
Le robot-chien de Boston Dynamics sait maintenant parler grâce à ChatGPT
Plus de contenu
Quand je dis à un utilisateur que je jetterai un oeil à son problème
Au secours
Quand le commercial a survendu mon expérience au client et que je dois faire bonne impression dès mon arrivée
i++
Quand je suis sur le point de corriger un bug et que tout le monde parle autour de moi
Quand je comprends enfin où est le problème dans mon code après avoir perdu 2 heures sur un bug
Quand le chef nous annonce que la deadline est avancée d'une semaine
Quand le lead dev croise le nouveau, arrivé pendant ses vacances
Quand je dis à un utilisateur que je jetterai un oeil à son problème
Au secours
Quand le commercial a survendu mon expérience au client et que je dois faire bonne impression dès mon arrivée
i++
Quand je suis sur le point de corriger un bug et que tout le monde parle autour de moi

