Enfin une API pour l'IA en text-to-image — Le laboratoire OpenAI, derrière l'incroyable IA DALL-E, capable de générer des images à partir de descriptions textuelles, vient d'annoncer l'ouverture de son API au public.
À partir d'aujourd'hui, les développeurs peuvent donc commencer à construire des applications s'appuyant sur cette IA.
On connaît tous à minima DALL-E à travers des comptes Twitter publiant des images toujours plus bizarres et drôles générées par l'IA. Pour faire simple, vous rentrez n'importe quelle phrase (vraiment n'importe quelle phrase 👀) et l'IA vous sort une ou plusieurs images qu'elle considère être des interprétations de ce que vous avez écrit.
— Weird Dall-E Generations 🧌 (@weirddalle) October 24, 2022
Aujourd'hui, cette IA est rendue accessible à tous au travers d'une API pour l'instant en version beta. Les développeurs pourront ainsi intégrer DALL-E à leurs projets en passant par une intégration officielle et surtout documentée. D'ailleurs, tout y semble déjà bien renseigné à l'aide d'exemple parlants.
OpenAI (à l'origine de DALL-E mais aussi de Whisper) fait référence dans son annonce à l'usage de sa nouvelle API par la solution Microsoft Designer. Le nouveau logiciel de création graphique de la firme de Redmond, concurrent direct de Canva, s'appuie en effet l'API de DALL-E pour permettre aux créatifs ou communicants de générer des visuels pour des posts sur les réseaux sociaux ou tout autre type de support.
Microsoft prévoirait aussi de l'intégrer à Bing et Edge afin de permettre de générer des images lorsque celles proposées dans les résultats ne sont pas assez satisfaisants. Sur ce dernier point, reste à voir s'il s'agira de créer une image de zéro ou de faire une variation d'un des résultats comme le permet déjà l'intelligence artificielle.
Dernier point qui n'est pas des moindres : OpenAI a intégré un système de modération directement au sein de son API. Ce ne sera donc pas aux développeurs de modérer les demandes à caractères haineux ou gores dans leurs applications, l'API le faisant d'elle-même. On ne sait pas encore ce qui sera exactement accepté ou non, ni s'il sera quand même possible de s'amuser un peu avec ce système.
Ce qui est sûr, c'est que cette ouverture au public va donner naissance à de toutes nouvelles applications dans les mois qui arrivent. Presque tous les domaines peuvent trouver quelque chose à tirer de la génération d'images par texte. Les possibilités sont d'autant plus grandes que l'IA s'améliore continuellement et sur des jeux de données toujours plus importants.
Consulter le billet d'annonce sur le site d'OpenAI
À lire aussi sur Les Joies du Code :
- 🗣 OpenAI présente Whisper, son IA de reconnaissance vocale multilingue open source
- 🧠 L'IA GPT-3 serait capable de rédiger des mémoires de fin d'études en moins de 20 minutes
- 🏃♂️ Une IA bat le record du jeu de course le plus dur et WTF au monde