Avec son projet Infinite Nature, Google génère des vidéos de survols de paysages à partir d'une seule photo
Nature infinie — Une intelligence artificielle sur laquelle travaille un groupe de chercheurs Google depuis plusieurs mois est capable de générer des vidéos de parcours 3D de paysages en s'appuyant sur une unique photo.
Après avoir initié des travaux sur la génération de vidéos de paysages grâce au Machine Learning, Google a partagé hier son dernier projet en date sur ce sujet : InfiniteNature-Zero.
Dans le cadre de leur précédente démarche, les ingénieurs de la firme de Mountain View expliquent avoir été confrontés à la difficulté de s'appuyer sur des vidéos comme données d'entraînement : celles-ci sont en effet difficiles à trouver en haute qualité et avec le bon type de mouvement de caméra.
De même, la qualité esthétique d’une image issue d’une vidéo n’est pas comparable à celle d’une photographie de paysage.
Les chercheurs ont repris la même méthode que dans leur première version du projet Infinite Nature, en se basant sur une stratégie de rendu-affinement-répétition. Afin de fournir un résultat en haute définition, ils utilisent désormais uniquement des photos pour entraîner leur réseau neuronal d'affinement d'images.
Pour réussir ce travail, les ingénieurs ont entrainé leur IA grâce à des trajectoires de caméras en boucle. Ainsi la première image étant identique à la dernière, ils peuvent plus aisément contrôler la qualité du rendu obtenu.
Pour générer des séquences longues et stables, les chercheurs ont inclus des trajectoires non cycliques de caméras. Ainsi un réseau discriminateur ne serait pas en mesure de différencier l'image originale de l'image finale synthétisée. Un composant permettant la génération de portions de ciel en haute qualité a également été intégré pour améliorer le réalisme du rendu final.
InfiniteNature-Zero a été entrainé avec ces méthodes sur des photos de paysage, beaucoup plus facilement trouvables en ligne. Les chercheurs indiquent avoir obtenu des améliorations importantes en terme de qualité et de diversité de contenu.
Six vidéos de démo sont exposées dans le billet d'annonce publié sur le blog Google AI, et ont également été partagées par le CEO Sundar Pichai sur les réseaux sociaux :
Comme pour son précédent projet, l'équipe a partagé ses travaux dans un repository GitHub public.
À lire aussi sur Les Joies du Code :
- 🖼 OpenAI rend son IA DALL-E accessible aux développeurs avec le lancement d'une API
- 🏔 Des chercheurs de Google créent une solution capable de générer des images de paysages sans fin (2021)
- 🚨 GitHub Copilot de nouveau dans la tourmente après avoir reproduit du code sous copyright
À propos de l'auteur
Fabien Schlegel
Lead Développeur. Fan de Border Collie. J'aime le code de qualité et les balades en forêt. Quand je suis fatigué par la vie, je fais des crêpes et ça va mieux.
Articles similaires
Des chercheurs créent 3D-GPT, une IA qui génère des mondes virtuels avec des prompts à la ChatGPT
Après de trop nombreux incidents, la Californie siffle la fin des voitures autonomes sur ses routes
Le robot-chien de Boston Dynamics sait maintenant parler grâce à ChatGPT
Elon Musk lance Grok, son IA censée concurrencer ChatGPT
Des chercheurs créent 3D-GPT, une IA qui génère des mondes virtuels avec des prompts à la ChatGPT
Après de trop nombreux incidents, la Californie siffle la fin des voitures autonomes sur ses routes
Le robot-chien de Boston Dynamics sait maintenant parler grâce à ChatGPT
Elon Musk lance Grok, son IA censée concurrencer ChatGPT
Plus de contenu
Quand mon projet passe l'audit avec succès
Quand le lead dev corrige mon bug et me dit de plus toucher à rien
Quand je découvre que quelqu’un a modifié la config du projet sans prévenir personne
Quand je ne parviens pas à reproduire un bug laissé de côté vendredi le lundi matin
Quand je veux copier le code d'un tuto et qu'en fait c'est une image
Quand je lance le compilateur et qu'il me balance 50 000 erreurs
Quand mon test unitaire fonctionne du premier coup
Boom
Quand mon projet passe l'audit avec succès
Quand le lead dev corrige mon bug et me dit de plus toucher à rien
Quand je découvre que quelqu’un a modifié la config du projet sans prévenir personne
Quand je ne parviens pas à reproduire un bug laissé de côté vendredi le lundi matin
Quand je veux copier le code d'un tuto et qu'en fait c'est une image

