Tests d’hypothèses

De Baripedia


Principe Généraux[modifier | modifier le wikicode]

On formule une hypothèse sur la population étudiée. On vérifie si l’échantillon utilisé provient bien (avec un certain degré de confiance) de la population étudiée. Le test statistique lui-même correspond à la règle de décision. Que tester ? :

  • La valeur d’un paramètre (notamment son égalité à 0 = test de significativité)
  • L’égalité de deux ou plusieurs paramètres
  • La forme de la distribution d’une ou plusieurs variables

Hypothèses nulles et alternatives[modifier | modifier le wikicode]

Un test consiste à choisir entre deux hypothèses en fonction d’un échantillon :

  • L’hypothèse nulle, notée H0 est l’hypothèse de base du test, celle qui est considérée comme vraie jusqu’à preuve du contraire. (= status quo)
  • L’hypothèse alternative, notée H1, est son « contraire ». (= ce que l’on aimerait montrer)

Exemple :

H0 est rejetée dès lors que la valeur de la statistique de test observée dans l’échantillon est trop différente de la valeur théorique postulée sous H0 pour la population. Grâce au calcul, on veut savoir si c’est plausible d’avoir H0.

L’hypothèse nulle porte généralement sur une seule valeur ou sur une égalité entre paramètres. On parle d’hypothèse simple :

L’hypothèse alternative regroupe généralement un très grand nombre de situations différentes. C’est une hypothèse composite avec 3 variantes :

Exemple : au tribunal

Une personne est jugée. Les hypothèses suivantes sont formulées :

  • P (condamner un innocent) = () Erreur de type I
  • P (acquitter un coupable) = () Erreur de type II

Ne pas condamner un innocent est prioritaire par rapport à acquitter un coupable !

Risques, puissance[modifier | modifier le wikicode]

() = Erreur de première espèce (type I) => risque de rejeter faussement H0

() = Erreur de deuxième espèce (type II) => risque de rejeter faussement H1

1 – () = puissance du test (probabilité de ne pas se tromper en rejetant H0 )

Risque d'erreurs[modifier | modifier le wikicode]

  • Risque ():
    • Spécifié par le chercheur avant d’effectuer le test
    • Fixé généralement à 5%.
  • Risque () :
    • N’est pas choisi librement mais dépend des autres éléments de l’analyse (risque (,) taille de l’échantillon, écart entre les 2 hypothèses du test…)
    • Plutôt que (), on considère souvent la notion de puissance du test, à savoir la probabilité d’accepter (lorsqu’elle doit l’être) l’hypothèse alternative H1 : 1 – () = P(accepter H1 / H1 vraie)
  • Risque de première et de deuxième espèce sont liés puisque si j’augmente un, je diminue l’autre et vice versa

Exemple d’un test unilatéral à droite :

Situations problématiques :

() est trop petit -> () est grand

H1 peut différent de H0 -> () est grand

Sur ce graphique, on peut observer deux lois normales, chacune correspondant à une hypothèse. A gauche, on a la distribution de H0 (notre hypothèse nulle) si elle est vraie. A droite, on a la distribution H1 si c’est l’hypothèse alternative qui est vraie. Ces deux intervalles découpent l’ensemble des possibles en matière de moyenne en deux zones, celle proche de H0 et celle proche de H1. « r » représente la zone de rejet, c’est-à-dire que selon où on se situe par rapport à elle, on acceptera l’une ou l’autre des hypothèses. Ainsi, la surface de la zone orange représente la probabilité de rejeter faussement l’hypothèse nulle alors que la surface de la zone verte représente le risque de rejeter faussement l’hypothèse alternative.

Si on souhaite non pas avoir un alpha à 5% comme généralement accepté, mais un alpha à 1%, la courbe se déplacera sur la droite si bien que c’est bêta qui deviendra plus grand. Cela correspond à rapprocher notre hypothèse nulle de notre hypothèse alternative faisant par la même grandir bêta. De plus, comme nous l’avons vu, deux hypothèses proches sont difficilement distinguables pour le test d’hypothèse ! La seule solution pour réduire le risque alpha et bêta, c’est d’augmenter la taille de l’échantillon. Ainsi, c’est au terme d’une réflexion préalable que l’on peut voir si l’étude projetée en vaut la peine et sous quelles conditions.

P- valeur et son utilisation[modifier | modifier le wikicode]

La p-valeur ( ou degré de signification), notée p, est la probabilité d’avoir observé l’échantillon utilisé sachant que l’hypothèse nulle H0 est vraie. La p-valeur s’interprète aussi comme la probabilité d’obtenir à partir d’un autre échantillon tiré de la même population une valeur du paramètre testé plus extrême (plus éloignée de H0) que la valeur réellement observée.

Après avoir fixé le niveau du risque de première espèce, alpha, le résultat du test s’obtient à l’aide de la règle de décision suivant :

Pour un test unilatéral à droite, la situation décrite par le graphique suivant conduit au rejet de H0, car la p-valeur (zone hachurée verticalement) est plus petite que le risque alpha (zone hachurée horizontalement)

Sur ce schéma, on voit que la p-valeur représente la probabilité d’être à droite de Z0. Ainsi, si le test prouve, pour la p-valeur, une valeur supérieure à la zone de rejet, la p-valeur sera plus petite qu’alpha et H0 sera affirmer. Mais comme on voit sur le graphique, la p-valeur est plus petite qu’alpha si bien qu’H0 est rejetée.

  • Pour conclure par rapport à un test statistique, on observe la p-valeur, si elle supérieure au risque alpha, le status quo demeure (H0). Par contre on rejette H0 si p est inférieure ou égale à alpha. Si p est supérieure à alpha, on accepte H0 parce que la probabilité est supérieure à 0.05.

Exemple : le niveau d’activité physique

  • Hypothèse nulle : H0 : () = 2.5
  • Hypothèse alternative : H1 : () ≠ 2.5
  • Le risque () est fixé à 5%.

Ces données sont rentrées dans R. On voit que la p-valeur est égale à 0.151 donc 15.1% ! Ce résultat est plus grand qu’() (5%) si bien que l’on se trouve dans la zone d’acceptation de l’hypothèse nulle H0. On peut donc continuer de dire qu’en moyenne, les jeunes de moins de 18 ans pratiquent une activité physique 2.5 jours par semaine. Cet histogramme représente l’activité physique de l’échantillon sur la dernière semaine. De cette manière, on voit que l’on est éloigné d’une loi normale puisque la répartition ne se fait pas de manière symétrique autour d’un axe unique.

Conslusion[modifier | modifier le wikicode]

Statistiquement, il y a suffisamment d’évidences pour rejeter H0 mais on ne va jamais dire qu’on l’accepte. Avec l’exemple de la machine à sou, on va dire que si on joue 100 fois et qu’on perd à chaque fois, on va dire qu’on va rejeter l’hypothèse H0. De ce fait, on arrive à un rejet de l’hypothèse nulle. A chaque fois, on essaie de montrer une relation et de ce fait, on aimerait avoir suffisamment d’évidences pour montrer quelque chose qui se trouve dans l’hypothèse alternative. Les raisons pour ne pas rejeter l’hypothèse nulle sont multiples : elle peut être vraie, l’échantillon n’est pas assez grand…. Dans ces tests, on a l’hypothèse nulle (=status quo) et l’hypothèse alternative (ce qu’on veut montrer). Pour conclure un test, il y a une règle : avant d’effectuer le test, on se fixe une marge d’erreur (=erreur de première espèce notée alpha qui se trouve avec une probabilité à 5%) puis là, on peut faire le test. Le test nous donne pleins d’indications mais entre autres, la p-valeur qui est une probabilité comprise en 0 et 1. Puis on compare cette probabilité à notre seuil critique qui est alpha. Si c’est plus petit que 5%, on rejette l’hypothèse nulle sinon on ne la rejette pas. La p-valeur est la probabilité basée sur un échantillon d’être éloigné de H0. Avec le jeu, c’est la probabilité d’avoir 5 fois de suite un échec sachant qu’on a 1/10 de gagner. La probabilité d’avoir un résultat aussi éloigné de ce que l’on s’attend ; si on perd 10 fois, la probabilité d’avoir un tel score est la p-valeur (probabilité théorique d’avoir un tel résultat). C’est ce qui nous permet de conclure par rapport au risque pris préalablement.

  • Tout ceci pour faire un test statistique. Il nous permet d’indiquer si oui ou non on a suffisamment de preuves pour affirmer quelque chose. Par contre, pour l’instant, on n’a pas encore l’intensité de l’effet. Si statistiquement on peut dire que oui, peut-être que cet effet est très petit.