Pour la première fois, l'intelligence artificielle dame le pion aux champions du jeu de cartes.
Il n'a pas d'as planqué dans sa manche, pas de caméra pour analyser les tics de jeu et les émotions de ses partenaires et pourtant Libratus, le superordinateur, est en train de tous les plumer ! Aux trois quarts de la partie, il a déjà raflé 1,2 M$ (1,1 M€) au nez et à la barbe de ses adversaires.
C'est une incroyable compétition de poker qui se déroule au Rivers Casino de Pittsburgh, en Pennsylvanie (Etats-Unis). Elle a débuté le 11 janvier et rassemble durant vingt jours la fine fleur des joueurs de poker. Face à Libratus, un superordinateur tout droit sorti des cerveaux de chercheurs de l'université de Carnegie Mellon, se relaient Jason Les, Dong Kim, Daniel McAulay, Jimmy Chou, quatre des meilleurs joueurs au monde sur Internet, de jeunes pros brillants et hypermotivés : celui qui battra Libratus empochera 187 000 € de récompense. Mais, à trois jours de la fin de ce formidable match homme-machine, rien n'y fait. Après 95 508 mains jouées (sur 120 000 prévues), c'est Libratus, la machine, qui mène. « Il devient chaque jour meilleur », remarque, admiratif, Jimmy Chou. Comme si plus rien n'arrêtait l'intelligence artificielle, pas même le poker !
Totalement imprévisible
« Jusque-là, le poker résistait encore à l'intelligence des algorithmes, explique Sébastien Konieczny, chercheur au CNRS. Après la victoire aux échecs de Deep Blue sur Garry Kasparov en 1997, et au jeu de go celle d'Alpha Go sur Lee Sedol, au printemps, une nouvelle étape est en train d'être franchie. » Car, contrairement aux jeux d'échecs et de go, qui reposent sur de la pure stratégie et où les positions sont connues de l'adversaire, le poker, en particulier cette variante Texas Hold'em No-Limit (sans limite d'argent) qui se joue en Pennsylvanie, est un jeu à multiples inconnues, où le facteur chance et l'élément psychologique priment !
« Les cartes sont distribuées de façon aléatoire, votre main est cachée à l'adversaire, enfin, toutes les formes de bluff sont possibles », résume Sébastien Konieczny. Comment Libratus le champion fait-il pour déjouer ces pièges ? Simple : il bluffe lui aussi ! Même si c'est le fruit de purs calculs mathématiques.
Car Libratus a trois bottes secrètes. D'abord le « deep learning » : doté d'une énorme puissance de calcul, il est capable, d'une partie à l'autre, d'apprendre comment jouent ses adversaires, y compris quand et comment ils bluffent. Ensuite, son algorithme puise un surplus de force dans « l'équilibre de Nash », la théorie des jeux du Prix Nobel d'économie John Nash (1994), qui permet d'optimiser ses gains. Enfin, il profite de ce que les joueurs de poker appellent la chance du débutant : il joue de manière totalement imprévisible ! « Chaque fois qu'on a trouvé la faille, le lendemain, elle avait disparu », confesse un des joueurs. Ils ont jusqu'à lundi pour la trouver.
(source : leparisien.fr/Aline Gérard)