Actions

Le cas des comparaison de populations

From Baripedia


Introduction[edit | edit source]

On ne va plus faire des tests sur une seule population mais on veut voir ce qui se passe quand on a deux populations et on veut voir quel test on peut appliquer sur ces deux populations.

Problématique[edit | edit source]

Un problème classique en recherche consiste à déterminer si deux ou plus de deux populations sont significativement différentes les unes des autres. Une problématique similaire s’observe lorsque l’on désire comparer les réponses de mêmes personnes interrogées à plusieurs reprises au fil du temps. EN pratique, on considère une ou plusieurs variables numériques d’intérêt et on se demande si leurs caractéristiques (moyenne, variance…) diffèrent réellement d’une population l’autre.

Données appariées ou indépendantes ?[edit | edit source]

Deux populations sont dites appariées si chaque élément de la première population correspond exactement à un élément de la seconde population et vice verse. Deux populations sont dites indépendantes s’il n’existe aucune relation particulière entre un élément de la première population et un élément de la seconde. Deux populations appariées contiennent forcément le même nombre d’individus, alors que ce n’est pas forcément le cas pour des populations indépendantes. Ces mêmes concepts s’étendent naturellement à un nombre quelconque de populations.

Comparaison des moyennes[edit | edit source]

Le critère de comparaison le plus souvent utilisé est celui de la moyenne. L’analyse de variance ou ANOVA permet de faire une comparaison des moyennes entre plusieurs populations. Dans le cas particulier où l’on ne désire comparer entre-elles que 2 populations, on utilise généralement le test de Student, une version particulière de l’ANOVA.

Tests non-paramétriques[edit | edit source]

Quand on veut faire un test, on veut dire quelque chose sur la population. L’ANOVA et le test de Student sont des méthodes paramétriques (on veut établir un paramètre) reposant notamment sur l’hypothèse selon laquelle les données sont distribuées selon des lois normales. Cette hypothèse de normalité se révèle parfois fausse. Par ailleurs, lorsque la taille de l’échantillon est petite, les tests de normalité usuels, tel que celui de Kolmogorv-Smirnov, ne sont pas assez puissants et ils ne peuvent donc jamais rejeter l’hypothèse nulle de normalité, ce qui est donc non-informatif. Les tests paramétriques sont alors souvent remplacés par des tests équivalents non-paramétriques qui ne postulent aucune distribution particulière des données.

Les tests non-paramétriques comparent les médianes et non les moyennes ! Ils sont généralement moins puissants que leurs équivalents numériques mais ils sont plus robustes (médiane n’est pas sensible aux valeurs extrêmes ! Donc test non-paramétrique comparant des médianes et plus robuste) et ont un plus grand champ d’application. Tests non-paramétriques pour les comparaisons de populations :

  • Test du signe et test du signe de Wilcoxon (comparaison de 2 populations appariées / test de calcul sur la différence entre les rangs en considérant l’amplitude, à savoir la différence entre les rangs)
  • Test de Wilcoxon et test de Mann-Whitney (test non paramétrique de comparaison entre 2 populations indépendantes)
  • Test de Friedman (comparaison de plus de 2 populations appariées)
  • Test de Kruskal-Wallis (comparaison de plus de 2 populations indépendantes)

Exemple : données du test pilote LHC

En décembre 2014, des étudiants des Universités de Lausanne et Genève ont participé au premier test pilote d’un nouveau type de questionnaire biographique online : le LHC (Life History Calendar). A deux semaines d’intervalles, différentes données ont été récoltés telles que l’âge, le genre, la taille, le poids, le nombre de déménagements…. Ces données permettent soit de comparer les réponses données à la même question lors des deux passations du questionnaire (données appariées), soit de comparer lors d’une même passation les réponses fournies par deux groupes distincts de personnes (données indépendantes).

Test de Student[edit | edit source]

Données appareillées[edit | edit source]

Test de la moyenne de la différence[edit | edit source]

Lorsque les données sont appariées, il est possible de construire une variable D (quantité à l’instant T1 et T2 et on regarde la différence) représentant leur différence terme à terme. Soit X et Y, deux variables appariées dont les moyennes dans la population sont notées () et (). Alors : D = Y – X.

Le test de Student se formule alors de la façon suivante : [[File:./media/image126.emf]]

Exemple : comparaison de la taille à T1 et T2

Nous voulons déterminer si la taille en centimètres donnée lors des deux passations du questionnaire est la même ou pas. Formellement, D = taille temps 1 – taille temps 2

Pour savoir ce sur quoi porte le test, c’est l’hypothèse alternative où la différence réelle est différente de 0. Donc H0 = 0 et H1 ≠ 0. La valeur 0 est-elle comprise dans l’intervalle de confiance ? Oui c’est le cas donc rien qu’avec ça, on peut dire qu’on ne peut pas rejeter l’hypothèse nulle indiquant que la différence ne moyenne est égale à 0. Cela se confirme avec la p-valeur qui est supérieure au seuil que l’on se fixe pour faire le test donc dans ce cas-là, on ne peut pas rejeter l’hypothèse nulle. Il n’y a pas de différence significative entre la taille donnée au temps 1 et la taille donnée au temps 2. Le degré de liberté est de 57 ; on a une indication sur la taille de l’échantillon et la valeur statistique de test t.

  • On peut conclure en regardant soit la p-valeur soit l’intervalle de confiance. Les tailles données au temps 1 et au temps 2 par ces mêmes individus, il n’y a pas eu de changement significatif. A-t-on le droit d’effectuer ce test ? Les données proviennent d’une population avec une distribution normale.

Données indépendantes[edit | edit source]

Test de la différence des moyennes[edit | edit source]

Lorsque les données sont indépendantes, il n’est pas possible de construit une variable D représentant leur différence terme à terme. Les hypothèses du test de Student s’écrivent alors simplement :

Variances égales ou inégales[edit | edit source]

Mathématiquement, la distribution théorique du test de Student n’est pas le même selon que les populations dont sont issues les deux variables X et Y ont la même variance ou non. Il existe donc deux versions du test de Student pour des données indépendantes. Afin d’utiliser la bonne version, on commence par tester l’égalité des variances des deux variables. Ensuite, si les variances sont égales, on utilise le test de Student standard alors que si les variances sont inégales, on utilise le test de Welch.

Test de l’égalité des variances[edit | edit source]

Le test le plus courant pour comparer les variances de deux populations est le test F du rapport des variances. Nous voulons tester les hypothèses suivantes :

Mais ces hypothèses sont reformulées de manière équivalente comme suit :

Exemple : taille des femmes et des hommes

Nous voulons déterminer si la taille en centimètres est égale chez les femmes et les hommes. Nous commençons par comparer les variances des deux populations :

On va tester les variances dans ces populations ; est-ce que la variance chez les hommes est le même chez les femmes ? On fait le test F et il nous dit que l’hypothèse alternative est indiquée. On regarde la p-valeur (0.55) et on ne peut pas rejeter l’hypothèse nulle puisqu’on pourrait dire qu’on n’a aucune preuve pour la rejeter. Peut-on supposer que les variances sont égales ? Oui ! Le résultat du test, oui, les variances peuvent être supposées égales.

L’hypothèse d’égalité des variances étant acceptées, nous pouvons utiliser la version habituelle du test de Student.

On a suffisamment d’évidence pour rejeter H0 (p-valeur) et rejeter le fait que la moyenne chez l’homme et chez la femme est égale. Donc la taille moyenne des hommes et des femmes est significativement différente.

Exemple : Age au premier smartphone

Nous voulons déterminer si l’âge en années auquel les femmes et les hommes ont eu le premier smartphone est le même ou pas.

On applique le test F qui nous dit qu’avec une p-valeur inférieure à 0.5, on rejette l’égalité des variances.

Donc, on va devoir faire le test de Welch du test de Student où on applique le test avec une p-valeur égale à 0.77. On ne peut pas rejeter l’hypothèse nulle donc l’âge peut être considéré comme identique entre les hommes et les femmes. Autre manière de voir, si on regarde l’intervalle de confiance, puisque la différence est comprise entre -1.313 et 0.981, le zéro se situe là-dedans.