Dr JinXing

Créateur de Golaxy

Le 5 Décembre 2021, Golaxy gagnait le tournoi entre programmes de go organisé en Chine à Fuzhou pour la seconde année consécutive.

Scène de la compétition

C'était le sixième titre mondial des tournois entre programmes pour Golaxy 星阵围棋 et son auteur le docteur JinXing , PDG de Thinker Technology 深客科技, a accepté une interview

Q : Aujourd'hui, nous vous avons invité à vulgariser les connaissances en matière d'intelligence artificielle du go. Pourriez-vous nous rappeler le parcours de Golaxy, qui a remporté les titres de champion ?
Jinxing : L'intelligence artificielle du go s'est améliorée très rapidement, on peut dire qu'elle est "époustouflante". C'est la troisième fois que Golaxy participe au tournoi de Fuzhou. En fait, à chaque fois, les participants sont beaucoup plus forts qu'auparavant. Cette année, il y a 28 équipes d'IA de Go de haut niveau venant de Chine dont Golaxy , du Japon (BSK), de Corée du Sud et 
de France (Golois). De nombreux programmes basés sur KataGo ont également participé.
Il y a deux phases dans le tournoi, les préliminaires ont eu lieu en juillet, et après 7 tours Golaxy était classé numéro 1, puis la demi-finale a eu lieu la semaine dernière, notre premier adversaire est DapangGo, nous l'avons battus par 3-0 au meilleur des 5 matchs, et nous avons battu notre dernier adversaire TianGo par 4-0 au meilleur des 7 matchs.
Nous n'avons perdu aucun match en demi-finale et nous avons remporté le titre de champion une fois de plus, mon équipe en est donc très heureuse. Le tournoi dans son ensemble, a été un succès du point de vue des fans ou du point de vue du jeu. Les parties sont très excitantes, et Golaxy a joué de nouveaux coups qui n'avaient jamais été montrés auparavant, probablement parce que lorsque le programme  évolue au cours du temps, il a de nouvelles idées pour les coups. Les fans adorent parler de ces coups.
Cependant, d'après les données de notre backside, le taux de victoire a augmenté régulièrement à chaque partie, sans trop de vagues, si vous regardez le score, vous pouvez constater que notre équipe domine nettement les autres équipes
Dr JinXing

Q : Elle a donc remporté le tournoi assez facilement.
Jingxing : Oui, assez facilement.
Q : Nous aimerions savoir comment s'est déroulé le tournoi et avec combien de temps les moteurs pouvaient réfléchir sur un coup.
Jinxing : Auparavant, le tournoi se déroulait sur un vrai plateau, ce qui avait un côté cérémonieux, mais certains développeurs qui ne savent pas jouer au Go ou qui ne connaissent pas bien le jeu risquaient de mal placer les pierres, ce qui se traduisait par des pertes pour les moteurs.
En ce qui concerne le temps de réflexion du moteur, il est réglable, il peut être long ou court. Le tournoi dure généralement 30 minutes pour chaque camp, puis 5 périodes de 30 secondes avant que chaque coup ne dure  pas plus de 30 secondes. Une partie entière est toujours terminée en moins de 2 heures.
Bien que les développeurs ne fassent rien pendant les matchs, nous nous sentons nerveux lorsque nous regardons si notre programme gagne ou non.
Q : C'est la troisième fois que Golaxy devient champion du monde ici, quelles sont les amélioration que vous avez apportées ?
Jinxing : Nous avons procédé à différentes mises à jour techniques depuis le début, par exemple en adoptant différentes règles et en appliquant de nouvelles structures d'apprentissage par renforcement pour nous améliorer. Il existe une technique appelée "apprentissage par renforcement". Il s'agit d'un processus de cycle itératif, nous utilisons la méthode d'auto-lecture pour générer des données, et cela produira un grand nombre de données.

Nous aurons alors un nouveau moteur plus puissant qu'auparavant. Ce processus nécessite beaucoup de travail sur les big data, les techniques d'apprentissage automatique. Il s'agit d'une tâche d'ingénierie systématique. Nous avons beaucoup travaillé sur des techniques telles que l'entraînement d'un modèle plus grand, l'optimisation des données, la génération de données de haut niveau et l'évitement des angles morts.
Q : Une chose que vous avez dite est assez intéressante : certains développeurs ne savent pas jouer au Go, mais ils peuvent développer des moteurs puissants. Quelle est l'importance du rôle du développeur pendant le développement, qu'est-ce qui rend les programmes puissants ou faibles, quelle est la différence entre ces moteurs en termes d'algorithme ?
Jinxing : Tous ces programmes sont basés sur les documents d'AlphaGo, tous ces développeurs l'ont appris. Mais les techniques se développent également, et c'est le degré d'efficacité du travail effectué qui détermine la force du programme.
Golaxy utilise principalement deux méthodes : l'apprentissage par transfert et l'apprentissage par tâches multiples. L'apprentissage par tâches multiples consiste à apprendre plusieurs choses sur la base d'une seule, car les choses sont liées lorsque le processus de développement est en cours. Cette méthode est préférable à l'apprentissage d'une tâche individuelle, car elle permet d'économiser des ressources et d'améliorer la vitesse d'apprentissage.
Le programme Golaxy a appris quatre tâches : le réseau stratégique (policy network), le réseau des valeurs (value network), le réseau des zones (area network) et le réseau des scores (score network). Il ne s'appuie plus uniquement sur le taux de victoire.
Il permet au programme de "compter les territoires" en jouant, ce qui donne un style de jeu unique "non conservateur". Lorsque nous sommes en tête, nous essayons d'accroître notre domination et de réduire notre position d'infériorité lorsque nous sommes en retard.

Q : Il se préoccupe donc à la fois du taux de victoire et du score. En ce qui concerne le Go informatique, nous connaissons tous AlphaGo, mais ce dernier est-il toujours en développement ? Comment AlphaGo peut-il se comparer à Golaxy ?
Jinxing : AlphaGo est une étape importante en termes de moteurs de Go de haut niveau, il utilise l'intelligence artificielle et l'apprentissage profond pour le jeu de Go. Il nous a aidé à ouvrir une nouvelle porte pour les moteurs de Go. Notre innovation sur AlphaGo est loin d'être à la hauteur d'AlphaGo, nous avons fait un travail relativement facile. AlphaGo ne développe plus le jeu de Go, mais nous sommes toujours en cours, nous espérons que notre équipe pourra faire de nouvelles percées à l'avenir.
Notre équipe a deux objectifs, l'un est de pousser la puissance du moteur à un niveau plus élevé, l'autre est d'aider l'analyse humaine du jeu de Go. L'autre est d'aider l'analyse humaine du jeu de Go à atteindre un niveau plus élevé. En outre, nous avons déployé beaucoup d'efforts pour développer des produits commerciaux en plus des moteurs de haut niveau, nous n'avons pas besoin que les utilisateurs utilisent le moteur le plus puissant pour battre tout le monde. Il est plus intéressant pour les humains de jouer avec des moteurs faibles. Vous pouvez utiliser Golaxy pour analyser votre jeu en permanence, trouver vos erreurs et en tirer des leçons. Il y a aussi beaucoup de fonctionnalités.
Je pense que si AlphaGo est comme les frères Wright qui ont inventé les avions, Golaxy est comme la compagnie Boeing qui permet à tout le monde de prendre l'avion.
Q : Nous savons tous que la force de Golaxy est ajustable, et s'il est au maximum de ses performances, quelle sera sa force contre les meilleurs joueurs humains ?
Jinxing : Golaxy est bien plus fort que les humains. En 2018, nous avons joué avec Kejie et l'avons facilement battu. Depuis, Golaxy a gagné plus de 2000 elo, ce qui est une énorme amélioration.
Q : Les machines apprennent vite
JinXing : En effet.
Q : En étudiant le jeu de go, que peuvent apprendre les IA ?
Jinxing : En théorie des jeux, le jeu de Go est comme la conjecture de Goldbach. Même si les moteurs actuels sont bien meilleurs que les humains, ils sont loin de pouvoir résoudre le jeu de Go. Je pense qu'à l'avenir, il y aura de nouveaux algorithmes qui surpasseront complètement les algorithmes actuels. L'équipe Deepmind a déjà fait d'autres choses après le jeu de Go, je pense que l'intelligence artificielle nous aidera à rendre la vie plus belle.


Résultats du Championnat 2021

Tableau final IA World Cjampionship 2021

Finale : Golaxy - Tian Go : 4-0


Golaxy a participé à différentes compétitions entre programmes :

2018 Tencent World AI Weiqi Competition : 2ème derrière Fine Art 7-0, 3-2 contre ELFOpenGo


2018 CITIC Securities Cup World AI Go Open : 1er : 4-1 against AQ ( Japon)


2019 Bossoft Cup  World AI Weiqi Competition : 1er  3-0 contre BADUKi ( Korea)


2019 Computer Go 11th UEC Cup  : 1er contre Globis-AQZ

Références :

Règles de la compétition entre IA de go de Fuzhou 2020

Interview du Dr JinXing 10 Décembre 2021 (Chinois)

Interview du Dr JinXing (Anglais)


Dernière mise à jour, le 28 Avril 2023

Retour Go