……….
1. Position du problème
La recherche biomédicale s’appuie beaucoup sur la statistique qui permet notamment de comparer l’effet de différents traitements à partir d’un échantillon de patients. La statistique est absolument ubiquitaire et actuellement aucun article médical ne peut être publié sans qu’il ne contienne des intervalles de confiance, des écarts-types ou des tests statistiques avec leur p.
Tous ces résultats sont obtenus avec différentes techniques faisant toutes parties de ce que l’on appelle la statistique fréquentiste. Ces méthodes fréquentistes ont été développées essentiellement par Pearson et Fisher au début du xx siècle et l’aura scientifique de ces deux personnes, ainsi qu’une relative facilité d’emploi de ces méthodes, ont largement contribué à la position ultradominante des méthodes fréquentistes dans la littérature médicale.
La statistique bayésienne
Il existe cependant des méthodes statistiques alternatives, englobées sous le vocable générique de statistique bayésienne.
Les méthodes bayésiennes sont historiquement les premières puisqu’elles ont été introduites dès le xviii e siècle par Thomas Bayes puis par Pierre Simon de Laplace. Elles sont pourtant restées quasiment inutilisées jusqu’à la fin du xx e siècle. Basées sur le théorème de Bayes, elles constituent un cadre théorique permettant de réaliser de l’inférence statistique [1]. Encore appelé théorème des probabilités inverses, le théorème de Bayes permet en effet, à partir de données observées, de déterminer laquelle parmi plusieurs hypothèses concurrentes a le plus probablement généré les données, ce qui définit l’inférence (ou induction) statistique.
Ce principe inductif se généralise dans le cadre de la statistique, dite bayésienne.
La statistique bayésienne connaît depuis une vingtaine d’années un regain d’intérêt, notamment grâce à l’amélioration de certaines techniques de calcul et à l’apparition de logiciels spécialisés [2]. Si elle domine dans les publications spécialisées de biostatistique et se répand en épidémiologie, elle reste relativement confidentielle dans le domaine clinique malgré quelques exemples récents [3–8]. Ce constat peut surprendre car le théorème de Bayes est bien connu des cliniciens qui l’utilisent, parfois sans le savoir il est vrai, dans le cadre des tests diagnostiques.
La statistique bayésienne
Rappelons brièvement qu’un test diagnostique est un outil permettant de déterminer si un patient est atteint ou non par une maladie. Le calcul de la valeur prédictive positive (VPP) du test permet, après observation du résultat du test, de déterminer la probabilité que le sujet soit malade. Or, le calcul de la VPP est une application directe du théorème de Bayes [9].
L’objectif de cette mise au point est d’expliciter le fonctionnement de la statistique bayésienne à partir de l’équivalence existant entre les tests diagnostiques et le raisonnement bayé-sien, puis de montrer son intérêt dans le cadre de la recherche biomédicale en général. Après un rappel sur le test d’hypothèse nulle et les tests diagnostiques, nous illustrerons par un exemple l’intérêt des méthodes bayésiennes par rapport à la méthode fréquentiste en terme d’interprétation.
La statistique bayésienne
2. La statistique fréquentiste et le principe du test d’hypothèse nulle
La statistique fréquentiste utilise comme principal outil le test d’hypothèse nulle (THN). Les principes généraux de son fonctionnement sont les suivants [10] :
• pour comparer deux traitements, un traitement de référence A et un nouveau traitement B, on utilise souvent comme critère de jugement la différence entre les taux de guérison de chaque traitement. On compare donc le taux de guérison T du traitement A avec le taux de guérison T du traitement B.
On utilise pour cela classiquement un test du khi-carré (χ B);
• en général, le but affiché de l’étude est de montrer la supério-rité de l’un des deux traitements par rapport à l’autre. Pour cela, le test d’hypothèse nulle pose comme hypothèse de départ que les deux traitements ont le « même effet ». Cela revient à dire que TA=T. Cela peut être réexprimé en disant que T A− TBB = 0. Cette hypothèse est appelée « hypothèse nulle» car elle spécifie que la différence entre les traitements est nulle ;
• il faut par ailleurs introduire une « hypothèse alternative » qui est le complément logique de l’hypothèse nulle. L’hypothèse alternative est donc la suivante : la différence entre les taux de guérison n’est pas nulle (mais l’ampleur exacte de la différence n’a pas à être précisée). L’idée fondamentale ici est que l’hypothèse nulle est soit vraie, soit fausse et que si elle est fausse, alors c’est l’hypothèse alternative qui est vraie : soit il n’y a pas de différence entre les deux traitements, soit il y en 2A a une. Le test d’hypothèse nulle est une procédure qui permet de décider laquelle des deux hypothèses doit être retenue, en se basant sur des données observées, par exemple, au cours d’un essai thérapeutique. En pratique, le but de l’expérience est de montrer que c’est l’hypothèse alternative qui est vraie et ainsi de montrer que le nouveau traitement est supérieur au traitement de référence.
Lors de l’essai, on constitue aléatoirement deux groupes, le premier recevant le traitement A et le second recevant le traitement B. Même si les deux taux de guérison sont théoriquement identiques, en pratique, sur un échantillon donné, ils ne le sont quasiment jamais car la différence observée est soumise aux fluctuations aléatoires inhérentes au tirage au sort. Cette différence observée est en général faible, proche de zéro. Cependant, dans une petite proportion de cas, la valeur observée de la différence sera éloignée de cette valeur nulle. En utilisant la loi de Gauss (loi normale), on peut calculer la probabilité que la différence observée dépasse un certain seuil. La loi de Gauss permet de dire que des différences faibles sont très probables alors que des différences importantes sont peu probables. Si la différence observée dépasse le seuil choisi, la différence est « grande» et elle est considérée comme« rare » sous l’hypothèse d’égalité des traitements : une telle différence n’aurait pas dû être observée.
La statistique bayésienne
Si elle a pourtant été observée, c’est que l’hypothèse de départ était probablement fausse. Par conséquent, on rejette l’hypothèse nulle et on accepte l’hypothèse alternative qui dit que les deux taux de guérison diffèrent.
En résumé, le raisonnement du test fréquentiste est le suivant :
• on fait l’hypothèse que les deux traitements ne diffèrent pas (hypothèse nulle), ce qui revient à dire que, en raison des effets du tirage au sort, une grande différence a peu de chance d’apparaître ;
• on quantifie la différence entre les deux traitements ;
• si la différence est grande et qu’elle a moins de 5 % de chance d’être observée, on admet que l’hypothèse nulle de départ était fausse et donc que les deux traitements diffèrent. On dit que p <5% (oup < 0,05) et que le test est significatif au seuil de 5 %.
Il faut insister sur l’interprétation correcte de p < 0,05. Cela signifie que si l’hypothèse d’égalité des traitements est vraie, il y a moins de 5 % de chance d’observer par hasard une différence aussi importante que celle constatée dans l’essai. Mais le p ne dit absolument pas quelle est la probabilité que l’hypothèse d’égalité des traitements soit vraie (ou fausse).