L'amnésie des probabilités
Vous voilà devant une table de casino, à jouer à la roulette. Vous misez sur rouge et un numéro rouge sort. Vous décidez de retenter votre chance avec le rouge, et il sort à nouveau. Vous continuez, avec succès : le rouge sort une troisième fois, puis une quatrième ! Alors, coup de folie, vous retentez une cinquième fois, et maintenant que vous avez attiré l'attention de tout le monde par vos gains successifs, ceux-ci vous regardent le souffle coupé. Le rouge va-t-il sortir une cinquième fois ? Les probabilités sont si faibles, le noir a maintenant tellement de chances de sortir ! Suspense. Si jamais cela se produit, vous aurez vraiment une chance insolente ce soir !
Vraiment ? En êtes-vous si sûr ?
Car si vous avez eu indéniablement de la chance jusque-là, le coup que vous vous apprêtez à jouer comporte un risque, certes, mais il n'est pas plus risqué que les précédents. Et en particulier, votre choix de miser une fois de plus sur la couleur rouge n'est pas contre les probabilités. Si vous pensez que le noir a réellement de plus en plus de chances de sortir au fur et à mesure que le rouge sort, vous vous trompez ! Tout simplement parce qu'à chaque fois que vous jouez, vous repartez de la même situation de jeu. Comment, dès lors, les probabilités pourraient changer d'une partie à l'autre ? Ce n'est pas possible !
Et pourtant, il y a peut-être cette petite voix qui insiste et vous dit : « mais si, elles doivent changer. Car étant donné qu'il y a autant de nombres rouges que de noirs, il ne doit pas y avoir de déséquilibre entre eux en moyenne. Puisque le rouge est déjà sorti quatre fois, il y a un fort déséquilibre, que les noirs doivent absolument compenser ! Il faut donc qu'ils sortent plus souvent par la suite, c'est-à-dire que leur probabilité d'occurrence augmente par rapport aux rouges. »
L'idée n'est pas bête, mais il y a en fait un second moyen, peu intuitif, qui permet de voir le déséquilibre se résorber SANS toucher à la valeur des probabilités. Pour l'illustrer plus simplement, oublions la roulette et utilisons un simple dé à 6 faces.
Comme la roulette, le lancer d'un dé correspond toujours à la même situation de départ. Pour un dé classique, on a les mêmes chances de tomber sur chacune des faces, donc la probabilité pour chacune est de 1/6. Pourtant, si l'on tombe quatre fois sur un 6 d'affilée, on peut se faire la même réflexion qu'auparavant et se dire qu'il est extrêmement improbable de tomber dessus une cinquième fois. Peut-être a-t-on maintenant une chance sur 30, sur 100 ou sur 1000 de voir apparaître le 6 ? Il vaudrait alors mieux parier sur n'importe laquelle des cinq autres faces !
En fait, il n'en est rien. Choisir à nouveau le 6 n'est pas déraisonnable, car comme les autres faces, ses chances sont toujours de 1/6 !
Ici déjà, il y a une confusion à ne surtout pas faire : penser que vouloir obtenir une séquence de cinq 6 d'affilée, et obtenir le cinquième 6 d'une séquence de 6 est la même chose !
Obtenir une séquence de cinq 6 d'affilée, c'est vouloir que les cinq coups suivants donnent 6. Autrement dit, je ne sais pas si le 1er lancer va donner un 6, ni le 2ème, ni le 3ème, ni le 4ème, ni le 5ème. Ça fait beaucoup d'incertitude, et c'est pour cela que c'est très improbable (vous avez 0,0129% de chances d'y arriver).
Obtenir le cinquième 6 d'une séquence de 6, c'est vouloir que le 5ème lancer donne 6, sachant que j'ai déjà les quatre premiers 6 ! Il n'y a qu'un seul résultat encore incertain, j'ai donc 16,7% de chances d'y arriver. Il y a une différence énorme entre planifier une séquence précise et constater qu'on réalise cette même séquence un coup après l'autre.
Maintenant, concentrons-nous sur le problème de la moyenne. La valeur moyenne d'un dé à 6 faces est de (1+2+3+4+5+6)/6 = 3,5. Avec notre série de quatre coups à 6, la moyenne actuelle de nos résultats est 6. Nous savons que cette moyenne des résultats doit diminuer lorsque l'on poursuit les lancers, et puisque nous sommes au-dessus de 3,5, on peut penser qu'il est nécessaire d'avoir des 1, 2 et 3 qui sortent plus que les 4, 5, 6 pour y arriver.
Maintenant, je vais construire une séquence à partir de ma série de quatre 6 et calculer sa moyenne progressivement, c'est-à-dire en prenant en compte petit à petit chaque élément de la séquence. On verra ainsi le comportement de la moyenne.
Voici la séquence : les quatre 6, suivis d'un grand nombre N de coups à 3,5. Vous pourriez me reprocher le fait qu'un dé ne peut pas tomber sur la valeur 3,5, mais faisons comme si, dans un premier temps. Qu'est-ce que l'on constate ?
On constate que la moyenne, au fur et à mesure des lancers, tend vers 3,5. Logique ! me direz-vous. Oui, mais réalisez que du même coup, il n'est pas nécessaire d'obtenir des 1, des 2 ou des 3 en excès pour compenser le déséquilibre de départ des quatre 6 ! Ce déséquilibre se lisse simplement avec le nombre de lancers, puisque le poids des 6 devient de plus en plus faible dans le calcul de la moyenne.
Alors certes, un dé ne peut pas tomber sur la valeur 3,5, mais en deux lancers, il peut tomber sur 1 et 6, sur 2 et 5 ou sur 3 et 4, ce qui est équivalent à deux dés de valeur 3,5. Ou encore, en quatre lancers, les séquences (2, 3, 3, 6) et (5, 4, 4, 1) sont équivalentes à quatre dés de 3,5. Il n'est pas nécessaire que ces tirages se fassent dans l'ordre ou de manière consécutive, il suffit simplement de réorganiser les résultats.
Or 3,5 est la moyenne, donc il y a à chaque fois autant de chances d'obtenir une valeur supérieure à 3,5 qu'une valeur inférieure. Au fur et à mesure des lancers, il sera rapidement possible de combler les séquences incomplètes pour faire apparaître ces « dés moyens ». Et cela rend viable la séquence des quatre 6 + dés à 3,5 que je présentais juste avant. L'exemple n'est donc pas farfelu.
Je l'illustre ci-après avec un tirage de 35 dés après les quatre 6 imposés, où j'associe les dés entre eux pour faire apparaître une séquence équivalente de dés moyens.
Voilà comment on peut détruire l'idée qu'il y ait une forme de « compensation » qui se mette en place pour favoriser l'apparition des petites valeurs lorsque les grandes sont sorties plus souvent à un moment donné. Les probabilités ne retiennent pas les résultats successifs, elles ne changent pas pour des expériences où l'on revient à la situation initiale à chaque fois, comme le lancer de dés.
Mais... que sont les probabilités, au fond ? Quelle est l'essence même des probabilités ? Pour prédire qu'une face possède 16,6666...% de chances de sortir, comment s'y prend-t-on ? On regarde toutes les possibilités et on calcule le nombre de cas favorables (1 face donnée) sur le nombre de cas possibles (6 faces distinctes), ce qui donne 1/6.
Autrement dit, on n'est jamais allés voir une liste de résultats de lancers ! Les probabilités sont donc une construction théorique qui décrivent certaines propriétés de l'expérience que l'on mène.
Des propriétés de l'expérience que l'on mène, et non pas simplement des propriétés du dé ! Si vous jouez à un jeu de hasard avec quelqu'un et que cette personne lance un dé plusieurs fois sans le faire rouler, accepterez-vous les résultats ? Non ! Car vous sentez intuitivement que ces résultats sont liés à l'orientation initiale du dé dans la main du joueur, et les différentes faces n'auront pas toutes les mêmes chances de sortir. Les conditions devenant particulières, les probabilités associées seront différentes.
Insistons là-dessus : en réalité, les probabilités ne changent jamais, mais les situations oui. Si j'ai une urne contenant deux boules blanches et deux boules noires (50% de chances de tirage pour chaque couleur), et que je tire une blanche, une nouvelle situation se met en place avec une urne contenant une boule blanche et deux boules noires, à laquelle correspondent de nouvelles probabilités (1/3 pour la blanche, 2/3 pour une noire). On n'a pas vraiment modifié les probabilités en elles-même par notre tirage, on a simplement changé de situation.
Du coup, si l'on remet la boule blanche dans l'urne, on revient à la situation précédente et les probabilités sont de 50/50. Ce qui a pu se passer avant n'a aucune influence.
Dans cet article, j'ai tenté de tordre le cou à cette idée, intuitive mais fausse, que les chances d'obtenir un résultat donné (comme la face d'un dé) devenaient de plus en plus faibles si l'on venait d'obtenir le même résultat aux coups précédents, alors que l'on revient à la situation initiale à chaque fois. C'est un point expliqué, je pense, un peu partout, mais j'ai voulu mettre en évidence et illustrer la raison derrière ce fait (l'absence de toute nécessité d'une « compensation » lorsqu'un résultat apparaît en « excès »).