Comment faire dire n'imp aux stats : Paradoxe de Simpson

Après l'effet cigogne, voyons un peu le très étonnant paradoxe de Simpson.
Date de publication : 06 Août 2015
Nombre de commentaires : 4

Prenons l'exemple d'un patient qui aurait le choix entre deux traitements. Chimiothérapie ou chirurgie ? Voyons les stats.

Taux de guérison stat
Taux de guérison en fonction du traitement choisi

Le choix semble assez évident. Il faut choisir les médicaments. Paradoxalement, la chirurgie semble toujours meilleure si on considère la taille des tumeurs.

Taux de guérison selon la taille des tumeurs
Taux de guérison selon la taille des tumeurs

Pourtant, les chiffres proviennent de la même étude. On peut vérifier : le total ne présente pas d'erreur de calcul.

Le paradoxe de Simpson
Le paradoxe de Simpson

4:14 Comment est-ce possible ? Il y a deux observations importantes à faire.

  • Les grosses tumeurs ont des taux de guérison plus faibles.
  • La chirurgie est beaucoup plus utilisée dans le cas des grosses tumeurs.

En réalité la chirurgie marche mieux, elle a un moins bon score car on lui a toujours filé les cas difficiles.

S'il y avait eu autant de cas de petites tumeurs que de grosses tumeurs traités par les deux techniques, les chiffres au global de la chirurgie auraient été bien meilleurs que ceux des médicaments.

5:11 Le facteur de confusion : c'est un facteur externe qui joue à la fois sur la conséquence et sur la cause que l'on veut étudier.

Ici, la taille de la tumeur influe à la fois sur le taux de guérison et sur le choix du traitement.

6:02 On peut, grâce au facteur de confusion, détecter des arguments faux dans un débat. Exemple :

Le redoublement, ça ne sert à rien. La preuve : les élèves qui ont redoublé pendant leur scolarité, au final au Bac, ils ont des notes moins bonnes que les autres. Intervenant Lambda dans un débat lambda

Facteur de confusion : Les élèves qu'on fait redoubler sont ceux en difficulté scolaire. Il n'y a rien de surprenant de constater qu'ils ont de moins bons résultats au Bac.

7:17 Exemple de la bière et de la libido :

Résultats de l'étude
Résultats de l'étude

Il semble que la consommation de bière et la libido soient liées. Mais regardons les mêmes chiffres en fonction des sexes.

Biere et libido séparées par sex
Bière et libido séparées par sexes

On n'observe aucune corrélation dans chacun des deux groupes.

Ici, le facteur de confusion est le sexe des gens. Les hommes ont tendance à boire plus de bière et ils ont aussi tendance à avoir une libido plus élevée.

9:22 Comment se prémunir du paradoxe de Simpson ?

Si on connait les facteurs de confusion, alors il suffit d'analyser les chiffres correctement.

On ne peut pas se passer d'un spécialiste du domaine pour analyser les chiffres. Sans spécialiste, on ne connait pas les facteurs de confusion.

10:35 Malgré tout, pour être sûr de ne pas tomber dans le piège, la seule vraie solution, c'est l'essai clinique avec tirage au sort.

Le tirage au sort permet de casser le lien entre le facteur de confusion et la cause. Si le groupe témoin et le groupe test sont tirés au sort, alors les facteurs de confusion influeront de manière égale dans les deux groupes.

L'étude rétrospective, c'est quand on analyse des chiffres déjà existants. Malheureusement, cela ne permet aucun tirage au sort et on peut facilement se faire piéger.

L'étude prospective, c'est quand on crée de toute pièce une expérience pour analyser les données. Le tirage au sort nous protège contre les facteurs de confusions inconnus.

Le problème de l'étude prospective, c'est que c'est souvent long, très cher et que cela pose parfois des problèmes d'éthique.

Voir aussi :

Commentaires (4)

Attention, il ne vous reste que : caractères.

  • Vévé le 15 Août 2015, 11h40

    Salut,
    bravo pour tout!
    L'article, le blog, la démarche etc...
    Vous avez un fan! :)
    Message court mais sincère.
    Bonne continuation!

    • barbalabs le 19 Janvier 2016, 11h30

      Merci, ça fait chaud au coeur

  • doudou le 12 Juin 2017, 10h03

    J'adore, ça m'a beaucoup aidé pour mon exposé. Merci beaucoup !

  • Un rageux sur le net le 13 Octobre 2017, 09h53

    Explication très détaillée, je le prépare pour mon TPE et grâce à ce blog j'ai très bien assimilé le principe du facteur de confusion. J'ai découvert beaucoup de choses, encore une fois MERCI!
    Je suis un autiste veuillez m'excuser pour les fautes d'orthographe ou de syntaxes merci :D

Cet article vous plait ? Pensez à vous inscrire à la newsletter pour ne pas manquer nos autres publications !


... et sur FB :