Baptisé DQN, ce logiciel un peu particulier a été mis au point par une équipe de chercheurs du laboratoire Deep Mind de Google, spécialisé dans l'intelligence artificielle. L'objectif était de créer un algorithme capable d'apprendre à jouer par lui-même. Pour ce faire, DQN a été testé sur 49 jeux de l'Atari 2600 et serait parvenu à battre les records de joueurs professionnels sur 23 d'entre eux.
Et là ou d'autres systèmes existants se contentent de réciter des commandes prédéfinies ou appliquer des règles déjà connues, cet algorithme évolue à un niveau tout autre. En effet, avant de commencer un jeu, il n'en connaît pas les règles. C'est au fur et à mesure des parties et en analysant les fonctionnement du jeu qu'il s'améliore et élabore des stratégies à la manière d'un être humain. Il finit ainsi par atteindre un niveau impressionnant, au Breakout notamment, puisqu'il comprend que coincer la balle dans la partie supérieure de l'écran lui permet de casser plus de briques à la suite et ainsi atteindre un meilleur score plus rapidement.
Evidemment, le système a ses limites et DQN s'est révélé plus efficace sur des jeux "simples". En effet, comprendre des jeux plus élaborés et utilisant des mécaniques plus complexes tels que Ms Pac-Man, Montezuma's Revenge ou Asteroids a été beaucoup plus compliqué pour lui et il n'y a réalisé que des scores médiocres, voire nuls. L'algorithme n'est pas adapté à des jeux complexes et récents et n'est pas encore capable d'analyser des environnements 3D riches, ni d'établir des séquences de jeux complexes.
Cependant, l'équipe à l'origine du projet pense que son algorithme sera à terme à même de découvrir des chemins plus sophistiqués et ainsi avoir des applications diverses, comme dans l'imagerie médicale ou la conduise automatisée.