Connaissez-vous le jeu QWOP ? Personnellement, ce n'était pas mon cas avant de tomber sur cette news, et je vous avoue qu'après avoir perdu quelques minutes dessus, il a de quoi mettre vos nerfs à rude épreuve. 😁
Créé en 2008 (ça commence à dater), QWOP se présente comme un jeu de course à pied, où vous dirigez un athlète participant aux 100 mètres des Jeux Olympiques.
Le truc tordu ? C'est que vous devez contrôler à l'aide des touches Q, W, O et P de votre clavier les membres du sportif virtuel, tout en parvenant à les synchroniser afin de parvenir à le faire avancer dans une démarche prenant parfois des allures assez... surprenantes (voire carrément improbables). 😅
Je ne vais pas vous le cacher, ce jeu est ultra frustrant, et le moindre mètre parcouru relève en lui-même de l'exploit. À ce jour, le record du monde est de 48 secondes pour parvenir à atteindre les 100 mètres du jeu.
Face à cette difficulté notoire de QWOP, l'ingénieur Wesley Liao décida de mettre au point une IA afin de voir si celle-ci parviendrait à battre les meilleurs scores, et surtout ce fameux record.
Après avoir alimenté son programme, qui s'appuie sur le concept de l'apprentissage par renforcement (un domaine du Machine Learning), en lui faisant analyser une cinquantaine de ses parties, l'IA parvint à comprendre quelles étaient les actions permettant d'obtenir un résultat positif (avancée de l'athlète) et lesquelles menaient à un échec (chute du sportif).
Liao créa un petit outil JavaScript pour permettre à son intelligence artificielle de jouer à QWOP, et celle-ci parvint à trouver une technique lui permettant d'atteindre la ligne des 100 mètres dans le jeu au fil de ses parties, ce qui en soit est déjà un exploit.
Afin de pousser son IA encore plus loin, Liao demanda à Kurodo, l'un des meilleurs joueurs de QWOP au monde, de s'enregistrer en train de jouer.
Après avoir analysé ses vidéos, l'IA de Liao (à prononcer à voix haute lol) parvint à atteindre son meilleur résultat au bout de 50 heures de jeu : 1 minute et 8 secondes.
Convaincu que son IA était capable de battre le record du monde, l'ingénieur modifia son système de récompense dans le but de maximiser la vitesse de l'athlète dans le jeu. Après avoir joué pendant 40 heures supplémentaires, le programme de Liao parvint enfin à battre le record du monde, avec un temps record de 47,34 secondes !
La vidéo de Wesley Liao au sujet de son IA