Bluffant — Cela fait maintenant plusieurs mois que les créations d'images via des intelligences artificielles génératives comme DALL-E ou MidJourney vont bon train et ne cessent d'impressionner par leur qualité et leur niveau de détail.
Un utilisateur du réseau social Reddit a partagé cette semaine des images générées par Stable Diffusion qui ont la particularité d'être des QR codes fonctionnels, capables de mener vers un site web depuis l'appareil photo d'un smartphone.
Malgré la présence de patterns encombrés et de détails complexes dans ces créations, qui prennent le style d'animes japonais, les QR codes générés par "nhciao" (l'utilisateur en question) sont identifiables par les iPhone et smartphones Android et permettent d'accéder au lien caché qui s'y trouve.
Si vous avez du mal à les faire reconnaître à votre téléphone, il vous suffit de lui faire prendre un peu de recul.
Fraîchement sorti l'année dernière, le modèle de Stable Diffusion permet de générer des images en se basant sur des descriptions textuelles (prompts). Celui-ci est également capable de transformer et retravailler des images existantes à l'aide d'une technique intitulée "img2img".
Une technique bien rodée
Bien que le créateur de ces images ne donne pas d'indication sur la manière dont il a procédé pour générer ces images, cet article de blog et le titre de son post sur Reddit semblent indiquer qu'il aurait utilisé le modèle customisable ControlNet, lui-même basé sur Stable Diffusion.
Le modèle en question aurait alors été conditionné pour créer différents styles artistiques pour ses créations. L'utilisateur aurait alors fait en sorte d'alimenter le générateur d'images de Stable Diffusion avec ses QR codes, puis utilisé ControlNet pour s'assurer de maintenir le positionnement des données liées à ces QR codes, tout en construisant les détails des images autour.
Des solutions capables "d'upgrader" les QR codes en les rendant visuellement plus sympathiques à l'aide d'images et couleurs existent déjà depuis plusieurs années, mais celles-ci se s'appuient sur la présence de points intégrés dans les images pour assurer la reconnaissance des codes.
Les images générées par Stable Diffusion font bien plus que ces outils, en incrustant de manière intelligente ces points dans l'image, et en les rendant quasiment indiscernables.
À noter que cette prouesse est possible grâce à la fonction de correction d'erreur des QR codes (code de Reed-Solomon), qui contrairement aux codes-barres traditionnels sont capables nativement d'être reconnus malgré une dégradation partielle de leur apparence.
Alors que toutes les images partagées cette semaine mènent vers le même site web, la technique utilisée par nhciao pourrait techniquement fonctionner avec n'importe quel QR code, bien qu'un autre utilisateur ait précisé en commentaire que celle-ci devrait mieux convenir à des URL courtes étant donné la manière dont les QR codes encodent les données.
Cette technique pourrait ouvrir une nouvelle voie aux approches marketing, en permettant de créer des expériences plus complètes et esthétiques pour les communications de marques.
À lire aussi sur Les Joies du Code :
- 🧠 Les IA vont-elles vraiment voler nos jobs ? Une étude menée par OpenAI donne des éléments de réponse
- 🚀 Pour élever la productivité des développeurs, Logitech parfait sa gamme MX
- 🤿 Apple sort un masque de plongée révolutionnaire