Dr JinXing
Créateur de Golaxy
Le 5 Décembre 2021, Golaxy gagnait le tournoi entre programmes de go organisé en Chine à Fuzhou pour la seconde année consécutive.
C'était le sixième titre mondial des tournois entre programmes pour Golaxy 星阵围棋 et son auteur le docteur JinXing , PDG de Thinker Technology 深客科技, a accepté une interview Q : Aujourd'hui, nous vous avons invité à vulgariser les connaissances en matière d'intelligence artificielle du go. Pourriez-vous nous rappeler le parcours de Golaxy, qui a remporté les titres de champion ?Jinxing : L'intelligence artificielle du go s'est améliorée très rapidement, on peut dire qu'elle est "époustouflante". C'est la troisième fois que Golaxy participe au tournoi de Fuzhou. En fait, à chaque fois, les participants sont beaucoup plus forts qu'auparavant. Cette année, il y a 28 équipes d'IA de Go de haut niveau venant de Chine dont Golaxy , du Japon (BSK), de Corée du Sud et de France (Golois). De nombreux programmes basés sur KataGo ont également participé. Il y a deux phases dans le tournoi, les préliminaires ont eu lieu en juillet, et après 7 tours Golaxy était classé numéro 1, puis la demi-finale a eu lieu la semaine dernière, notre premier adversaire est DapangGo, nous l'avons battus par 3-0 au meilleur des 5 matchs, et nous avons battu notre dernier adversaire TianGo par 4-0 au meilleur des 7 matchs. Nous n'avons perdu aucun match en demi-finale et nous avons remporté le titre de champion une fois de plus, mon équipe en est donc très heureuse. Le tournoi dans son ensemble, a été un succès du point de vue des fans ou du point de vue du jeu. Les parties sont très excitantes, et Golaxy a joué de nouveaux coups qui n'avaient jamais été montrés auparavant, probablement parce que lorsque le programme évolue au cours du temps, il a de nouvelles idées pour les coups. Les fans adorent parler de ces coups. Cependant, d'après les données de notre backside, le taux de victoire a augmenté régulièrement à chaque partie, sans trop de vagues, si vous regardez le score, vous pouvez constater que notre équipe domine nettement les autres équipes |
Q : Elle a donc remporté le tournoi assez facilement.
Jingxing : Oui, assez facilement.
Q : Nous aimerions savoir comment s'est déroulé le tournoi et avec combien de temps les moteurs pouvaient réfléchir sur un coup.
Jinxing : Auparavant, le tournoi se déroulait sur un vrai plateau, ce
qui avait un côté cérémonieux, mais certains développeurs qui ne savent
pas jouer au Go ou qui ne connaissent pas bien le jeu risquaient de mal
placer les pierres, ce qui se traduisait par des pertes pour les
moteurs.
En ce qui concerne le temps de réflexion du moteur, il est réglable, il
peut être long ou court. Le tournoi dure généralement 30 minutes pour
chaque camp, puis 5 périodes de 30 secondes avant que chaque coup ne
dure pas plus de 30 secondes. Une partie entière est toujours
terminée en moins de 2 heures.
Bien que les développeurs ne fassent rien pendant les matchs, nous nous
sentons nerveux lorsque nous regardons si notre programme gagne ou non.
Q : C'est la troisième fois que Golaxy devient champion du monde ici, quelles sont les amélioration que vous avez apportées ?
Jinxing : Nous avons procédé à différentes mises à jour techniques
depuis le début, par exemple en adoptant différentes règles et en
appliquant de nouvelles structures d'apprentissage par renforcement
pour nous améliorer. Il existe une technique appelée "apprentissage par
renforcement". Il s'agit d'un processus de cycle itératif, nous
utilisons la méthode d'auto-lecture pour générer des données, et cela
produira un grand nombre de données.
Nous
aurons alors un nouveau moteur plus puissant qu'auparavant. Ce
processus nécessite beaucoup de travail sur les big data, les
techniques d'apprentissage automatique. Il s'agit d'une tâche
d'ingénierie systématique. Nous avons beaucoup travaillé sur des
techniques telles que l'entraînement d'un modèle plus grand,
l'optimisation des données, la génération de données de haut niveau et
l'évitement des angles morts.
Q : Une chose que vous avez dite est assez intéressante : certains
développeurs ne savent pas jouer au Go, mais ils peuvent développer des
moteurs puissants. Quelle est l'importance du rôle du développeur
pendant le développement, qu'est-ce qui rend les programmes puissants
ou faibles, quelle est la différence entre ces moteurs en termes
d'algorithme ?
Jinxing : Tous ces programmes sont basés sur les documents d'AlphaGo,
tous ces développeurs l'ont appris. Mais les techniques se développent
également, et c'est le degré d'efficacité du travail effectué qui
détermine la force du programme.
Golaxy utilise principalement deux méthodes : l'apprentissage par
transfert et l'apprentissage par tâches multiples. L'apprentissage par
tâches multiples consiste à apprendre plusieurs choses sur la base
d'une seule, car les choses sont liées lorsque le processus de
développement est en cours. Cette méthode est préférable à
l'apprentissage d'une tâche individuelle, car elle permet d'économiser
des ressources et d'améliorer la vitesse d'apprentissage.
Le programme Golaxy a appris quatre tâches : le réseau stratégique
(policy network), le réseau des valeurs (value network), le réseau des
zones (area network) et le réseau des scores (score network). Il ne
s'appuie plus uniquement sur le taux de victoire.
Il permet au programme de "compter les territoires" en jouant, ce qui
donne un style de jeu unique "non conservateur". Lorsque nous sommes en
tête, nous essayons d'accroître notre domination et de réduire notre
position d'infériorité lorsque nous sommes en retard.
Q
: Il se préoccupe donc à la fois du taux de victoire et du score. En ce
qui concerne le Go informatique, nous connaissons tous AlphaGo, mais ce
dernier est-il toujours en développement ? Comment AlphaGo peut-il se
comparer à Golaxy ?
Jinxing : AlphaGo est une étape importante en termes de moteurs de Go
de haut niveau, il utilise l'intelligence artificielle et
l'apprentissage profond pour le jeu de Go. Il nous a aidé à ouvrir une
nouvelle porte pour les moteurs de Go. Notre innovation sur AlphaGo est
loin d'être à la hauteur d'AlphaGo, nous avons fait un travail
relativement facile. AlphaGo ne développe plus le jeu de Go, mais nous
sommes toujours en cours, nous espérons que notre équipe pourra faire
de nouvelles percées à l'avenir.
Notre équipe a deux objectifs, l'un est de pousser la puissance du
moteur à un niveau plus élevé, l'autre est d'aider l'analyse humaine du
jeu de Go. L'autre est d'aider l'analyse humaine du jeu de Go à
atteindre un niveau plus élevé. En outre, nous avons déployé beaucoup
d'efforts pour développer des produits commerciaux en plus des moteurs
de haut niveau, nous n'avons pas besoin que les utilisateurs utilisent
le moteur le plus puissant pour battre tout le monde. Il est plus
intéressant pour les humains de jouer avec des moteurs faibles. Vous
pouvez utiliser Golaxy pour analyser votre jeu en permanence, trouver
vos erreurs et en tirer des leçons. Il y a aussi beaucoup de
fonctionnalités.
Je pense que si AlphaGo est comme les frères Wright qui ont inventé les
avions, Golaxy est comme la compagnie Boeing qui permet à tout le monde
de prendre l'avion.
Q : Nous savons tous que la force de Golaxy est ajustable, et s'il est
au maximum de ses performances, quelle sera sa force contre les
meilleurs joueurs humains ?
Jinxing : Golaxy est bien plus fort que les humains. En 2018, nous
avons joué avec Kejie et l'avons facilement battu. Depuis, Golaxy a
gagné plus de 2000 elo, ce qui est une énorme amélioration.
Q : Les machines apprennent vite
JinXing : En effet.
Q : En étudiant le jeu de go, que peuvent apprendre les IA ?
Jinxing : En théorie des jeux, le jeu de Go est comme la conjecture de
Goldbach. Même si les moteurs actuels sont bien meilleurs que les
humains, ils sont loin de pouvoir résoudre le jeu de Go. Je pense qu'à
l'avenir, il y aura de nouveaux algorithmes qui surpasseront
complètement les algorithmes actuels. L'équipe Deepmind a déjà fait
d'autres choses après le jeu de Go, je pense que l'intelligence
artificielle nous aidera à rendre la vie plus belle.
Résultats du Championnat 2021
Finale : Golaxy - Tian Go : 4-0
Références :
Règles de la compétition entre IA de go de Fuzhou 2020
Interview du Dr JinXing 10 Décembre 2021 (Chinois)
Interview du Dr JinXing (Anglais)
Dernière mise à jour, le 28 Avril 2023