|
Stockfish la brute par ins12537 le
[Aller à la fin] |
| Informatique | |
Ayant fait des matchs entre Houdini 1.5 et Stockfish dd 64 modern je trouve Stockfish plutôt étrange dans ses évaluations. Les matchs ont montré des niveaux très proches mais des évaluations très différentes.
Stockfish m'a semblé une vraie brute avec un calcul plus profond, régulièrement une demi-douzaine de demi-coups de plus, mais des évaluations fantaisistes qui s'éloignent très rapidement de 0 (si Houdini évalue +.50 Stockfish peut indiquer +3.
Au bilan je préfère rester sur l'évaluation d'Houdini qui me semble plus réaliste.
|
|
Oui cela se confirme en visualisant les parties retransmises par chessbomb.
Ce site proposait il y a quelques temps les analyses d'Houdini qui semblaient tomber pratiquement tout le temps juste.
Maintenant c'est Stockfish qui est employé et sur certaines positions (même tactiques!), il change d'avis d'un coup à l'autre, il a l'air perdu.
Certains bugs même avec des eval totalement erronées.
Problème de configuration?
|
|
Sur chessbomb, c'était effectivement flagrant, en particulier quand on s'approchait des finales.
Je n'ai pas perdu du temps à faire des matchs pr savoir qui est le plus fort, mais les évaluation les plus justes étaient clairement celles d'houdini.
|
|
la vraie question est semble t il celle-ci :
A qui ou à quoi sont destinées les valeurs d'évaluation ?
- au joueur humain pour l'aider à juger la position sur l'echiquier et mieux l'analyser ?
- ou elles servent au logiciel uniquement pour calculer quel sera son prochain coup sur l'echiquier, l'affichage n'etant alors qu'un gadget destiné à distraire l'humain pour le faire patienter pendant les calculs ....
peut etre que les concepteurs de Houdini et de Stockfish, n'ont pas répondu de la même manière , même si indiscutablement les deux logiciels jouent extremement bien tous les deux sur l'échiquier.
|
|
on est d'accord,pour le peu que j'en ai vu, les 3 soft suggèrent la plupart du temps les mêmes coups, mais avec des éval très différentes.
Peut-être à un moment donné, faudra t il que les programmeurs intègrent dans leurs algorithmes un paramètre "humain" en évaluant les chances d'erreur dans une position.
Maintenant, c'est quand même très étonnant de voir dans certaines positions humainement résolues un soft évaluer correctement la position quand elle est nulle, 2 autres afficher des +0,7 voire plus si affinité.
Forcément, cette erreur d'évaluation influence leurs "décisions" plus tôt dans le jeu, maintenant, si la réponse amène à minimiser le rôle de ces "décisions", ça risque d'être désespérant ;)
|
|
Exemple au 19ème coup de la partie Nakamura-Carlsen à Zurich, Stockfish indique +1.85 sur Chessbomb, c'est à dire une position gagnante, tandis que sur mon PC HOudini est bien plus optimiste avec +0,70.
|
|
@Jean-Luc : les fonctions d'évaluation de SF et houdini sont bien évidemment différentes par bien des aspects. Mais avant tout, elles ne sont pas calibrées de la même façon. Houdart a programmé houdini de façon à ce que une évaluation de +1.00 corresponde à 80% de chances de gain. Pour SF, je ne sais pas exactement à quoi correspond le +1, mais il est souvent dit qu'il faut diviser par 2 l'évaluation de SF pour avoir environ la même échelle que celle d'houdini.
Autrement dit une évaluation de position par houdini de +1 environ correspondra à une position gagnante mais pour SF il faudra +2, c'est juste une habitude à prendre.
|
|
|