L'intelligence
artificielle au banc d'essai du jeu de go
LE MONDE | 06.03.09 | 15h29 • Mis à jour le 06.03.09 | 15h29
Détrôné aux échecs par la machine, l'homme la surclasse encore sur le plateau quadrillé asiatique. Mais de peu
"Le monde,
dit un proverbe chinois, est un jeu de go dont les règles ont été
inutilement compliquées." Né dans l'empire du Milieu il y a quelque 4
000 ans, ce jeu est faussement simple : pierre après pierre, posées sur les
intersections d'un plateau quadrillé de 19 lignes par 19 colonnes, il consiste
à créer des archipels, à les connecter et à les protéger des visées
coloniales de l'adversaire.
Le jeu d'échecs, avec ses pièces aux mouvements multiples et
variés, peut sembler plus complexe. Il n'en est rien - du moins du point de vue
des machines : depuis que Garry Kasparov a dû s'incliner sur l'échiquier
devant le programme Deeper Blue, en 1998, le go est, dans l'univers des jeux,
l'ultime refuge de l'intelligence humaine, face à la puissance du silicium. Car
dans le go, il n'y a pas d'ouvertures codifiées, la valeur d'une pièce donnée
n'est pas fixée à l'avance. Et le nombre de combinaisons possibles (10171) dépasse
de beaucoup le nombre d'atomes dans l'Univers - et donc les capacités de calcul
des ordinateurs.
Mais ces dernières années, ceux-ci ont tout de même progressé
à pas de géant. Alors qu'il leur fallait une trentaine de coups de handicap
pour rivaliser avec des humains médiocres il y a encore dix ans, il leur suffit
désormais de sept pierres d'avance pour battre des grands maîtres : "Lors
de l'Open de Taïwan, à la mi-février, notre programme MoGo l'a emporté dans
ces conditions face au joueur professionnel taïwanais Zhou Junxun, classé au
neuvième dan, le grade le plus élevé de la discipline", se félicite
Olivier Teytaud, de l'Institut national de recherche en informatique et
automatisme à Saclay (Essonne).
"Cette progression a surpris tout le monde",
indique Tristan Cazenave (université Paris-Dauphine), un des pionniers de la
programmation du jeu de go en France. La révolution est née de l'importation
de techniques de physique statistique dans ce domaine de programmation. Ce système
s'appelle le Monte Carlo adaptatif. Il consiste, à partir d'une position donnée,
à faire jouer à l'ordinateur le maximum de parties aléatoires, et, dans
l'arbre des possibles ainsi engendré, à choisir la solution qui est en moyenne
le plus souvent gagnante.
Ce principe, proposé par le physicien en 1993, s'est révélé
très fécond, après de multiples raffinements, toujours en cours. Une rivalité
sportive oppose notamment MoGo à Crazy Stone, un programme développé par Rémi
Coulom, maître de conférence à l'université Lille-III. "Nous
publions nos méthodes après les compétitions, où on les met à l'épreuve,
raconte-t-il. Mais dans l'ensemble, nos programmes ont tendance à
converger."
Hervé Morin
Dernière mise à jour 29/11/2012