Analyses uni-,bi- et tri-variées, Quelles utilités pour la recherche ?

De Baripedia


Introduction générale[modifier | modifier le wikicode]

L’analyse univariée nous permet de décrire des variables et comment une variable est distribuée. L’analyse univariée est aussi importante quand on fait la plausibilité d’un jeu de données. Par exemple, quand on récolte nos données, on regarde toutes les fréquences de toutes les variables pour voir s’il y a des problèmes. A chaque recodage, il est utile de tirer des fréquences pour voir s’il n’y a pas de missing.

Au niveau bi-varié, on peut regarder des corrélations ou associations entre deux variables mais on doit toujours veiller au risque de fausse relation.

Analyse univariée[modifier | modifier le wikicode]

C’est l’analyse la plus basique. Elle sert à décrire une variable d’où le nom univariée tel que combien de femmes on a dans notre échantillon ? Cette analyse permet de regarder la distribution, la fréquence et le pourcentage d’items dans une variable. Elle permet également de regarder la centralité et la dispersion d’une variable à travers la moyenne et la médiane et pour d’autres types de variables, à travers la moyenne et l’écart-type.

Utilité de l’analyse univariée[modifier | modifier le wikicode]

Ce sont des informations clés qu’on veut savoir. Par exemple, si on travaille sur l’action protestataire, je veux savoir si je travaille sur un phénomène marginal ou important de notre société. Elle permet aussi d’expliquer un processus. La description peut se faire dans le temps et l’espace mais dans le cas de l’explication qui est un cas plutôt rare dans la recherche, elle a lieu quand la variable n’est pas mesurée ou qu’on ne peut pas mesure la variable indépendante. Ainsi, l’analyse descriptive est capable de nous faire connaître un objet ou un phénomène. Comme le dit Bunge, pour accroître la connaissance sur un phénomène, il faut pouvoir le décrire et l’expliquer.

  • Exemple : protestation politique dans les démocraties

L’analyse univariée ne permet pas seulement de décrire une variable dans une base de données mais aussi de suivre une variation dans le temps et l’espace. Avec ce type d’analyse, on peut répondre aux questions comme « est-ce que le protestation politique est stable ou fluctuante dans le temps ? », « Est-ce qu’on retrouve plus/moins de protestation en Suisse depuis 1968 ? ». On peut également tenter d’expliquer une variation à travers des moments qui ont eu lieu à un moment donné. On peut également analyser si la protestation politique varie dans l’espace. Cette comparaison peut aider à expliquer la variation à travers les institutions politiques. Par exemple, Kriesi a montré pourquoi il y a beaucoup de grèves en France et comparativement, peu en Suisse ? Leur hypothèse c’est que c’est lié aux institutions politiques des pays respectifs.

  • Exemple : stabilisation des conflits politiques et démocratie (Bartolini et Mair)

L’objectif majeur de leur étude est de tester la thése de Rokkan et Lipset qui dit que les conflits majeurs dans une société sont organisés autour de 4 grands clivages politiques qui sont entre le capital et le travail, entre l’Eglise et l’Etat, entre la ville et la campagne et entre le centre et la périphérie. Ces clivages sont représentés par les partis politiques majeurs dans un pays. Du coup, les partis politiques majeurs reflètent les conflits politiques les plus importants et permettent ainsi de stabiliser et représenter ces conflits au niveau politique. Le clivage de classe est le conflit politique le plus célèbre et il est traditionnellement représenté par un parti précis. Grâce à ce processus d’intégration politique de ces conflits sociaux, on assiste à une organisation t à un déclin de ces conflits et ainsi à une stabilisation de la démocratie puisque l’électorat a pu s’aligner derrière les partis représentatifs traditionnellement pour ce genre d’intérêts.

Bartolini et Mair utilisent un dessin de recherche qusi-expérimental de groupes identifiées en amont (pays) Ils font cette comparaison dans le temps et l’espace. Ils utilisent un temps très long (un siècle) et ils comparent 13 pays européens. L’unité d’analyse sont les individus ou plus précisément, le vote des individus agrégés par période de 5 ans et par pays. Ils utilisent des données exhaustives donc pas de sondage et d’échantillon de toutes les élections ayant eu lieu dans chaque pays. Avec ces données, ils ont créé une mesure de « volatilité » qui mesure combien de gens ont changé de camp politique d’une période à une autre. Comme on n’a pas à faire à des mesures de ce que les gens pensent ou disent ce qu’ils ont fait mais à des chiffres officiels, donc ce sont des bonnes mesures en termes de validité. De mesure similaire, pour augmenter la fiabilité, on se retrouve avec deux indicateurs pour la volatilité du clivage de classe :

  1. Une moyenne sur 5 an : meilleure lisibilité des courbes
  2. Moyenne sur 5 ans et 1 an : pour voir s’il n’y a pas de biais (variations erratiques)

[[File:./media/image134.emf]]Leur hypothèse est affirmée puisqu’une stabilisation politique signifie qu’il y a moins de volatilité. Sauf qu’il y a des controverses liées à la volatilité électorale et clivage. On assiste à une émergence de nouveaux clivages puisque de le clivage de classe n’existe plus et à une hausse de la volatilité électorale à partir des années 1990.

  • Exemple : citoyenneté contestée (Koopmans, Statham, Giugni, Passy)

Question de recherche : Les migrants arrivent-ils à se mobiliser politiquement dans leur pays d’accueil ? Cette étude fait le constat en 2005 que le sujet de la migration est des relations ethniques sont des enjeux vivement débattus dans nos sociétés. Ce débat tourne autour de la question de l’Etat-nation, c’est-à-dire que c’est l’Etat-nation qui définit les paramètres du fait « d’être suisse » donc il joue un rôle important tout comme la migration. Donc les auteurs essaient de lier l’Etat-nation à la migration. Comme la nation et surtout l’accès à la nation est au cœur de ce débat, ce sont des débats qui varient en fonction de l’Etat. Les auteurs appellent cela des débats à géométrie variable qui varient dans leur contenu qui est discuté mais également dans le type d’acteurs et le mode d’action utilisé dans un pays différemment. Dans chaque pays, ce débat a des caractéristiques spécifiques. L’accès à la nation ne signifie rien d’autre que la conception de la citoyenneté qui est au centre de ce débat. A nouveau, cette conception varie d’un pays à l’autre et par conséquent, les enjeux migratoires peuvent être placés de manière variée sur l’agenda politique.

L’opérationnalisation des régimes de citoyenneté ou de l’accès à la nation se fait sur 2 dimensions :

  1. Accès individuel : entrée dans l’espace national. L’accès civique contre l’aspect ethnique (le droit du sol VS le droit du sang).
  2. Accès collectif : mesure le fait de vivre ensemble et plus précisément si dans un pays on accentue plutôt la diversité ou une assimilation culturelle.

Conséquences de régimes de citoyenneté sont fortes et multiples. Les auteurs soulignent deux impacts majeurs, à savoir que ces régimes exercent une influence sur l’intégration/exclusion de migrants et d’autres part, ces régimes posent des structures contraignantes pour participer au débat politique et la mobilisation politique.

Pour la Suisse, cela a créé du débat ! A partir de ce cadre théorique, ils choisissent leur cas d’étude : Suisse, France et GB :

L’étude et ses analyses[modifier | modifier le wikicode]

On se retrouve dans une comparaison de groupes (pays) qu’ils ont pu identifier en amont. Donc on est dans un dessin de recherche quasi-expérimental. L’unité d’analyse sont les acteurs collectifs et notamment leurs actes de paroles et de mobilisation. Les chercheurs ‘s’intéressent à qui parlent dans un acte de parole ou qui se mobilisent, comment ils se mobilisent (type d’action) et avec quel message. Pour mesurer cela, ils utilisent la presse écrite et ils ont codé une édition sur deux pendant 10 ans. Attention, on pourrait croire que les 10 ans impliquent une comparaison dans le temps mais ce n’est pas le cas ! Ils ne regardent pas une comparaison dans le temps puisque les 10 ans ne doivent pas être pris en compte dans le dessin de recherche. Ils ont choisi de récolter des données pendant 10 ans pour augmenter la validité de leurs mesures et d’éviter des variations conjoncturelles. S’ils avaient pris une année particulière, il y aurait eu un biais sur leurs résultats censés être généralraislb.es Ils présentent surtout des fréquences qui comparent les actions d’acteurs publics dans différents pays. C’est une analyse centrée sur le cas, typiquement pour un dessin quasi-expérimental. Sauf qu’ils ne peuvent pas mesurer directement le régime de citoyenneté.

Résultat : les migrants sont-ils porteurs de leur propre revendication ? Si oui, est-ce le cas dans tous les pays ? La Suisse dispose d’un des régimes les plus contraignants avec un accès à la citoyenneté civique et un monisme culturelle. La conséquence serait-elle que les migrants ne se mobilisent pas ou qu’ils sont exclus de l’espace public ?

[[File:./media/image136.emf]]Si on compare ce pourcentage relatif entre les différents pays, on constate qu’il y a une moindre mobilisation en Suisse qu’en GB. Il semble qu’il y a peu de différence entre la France et la Suisse. Donc il se pourrait que ce ne soit que l’accès collectif qui tranche cette différence. Donc le régime de citoyenneté est plus contraignant en Suisse que dans les deux autres pays.

Conclusion : concernant le régime en Suisse, il y a double contrainte. En tout cas, pour ce qui concerne la mobilisation des migrants eux-mêmes en suisse pour des revendications destinées à la Suisse. EN même temps, l’enjeu de migration est essentiellement porté par des acteurs collectifs de solidarité et d’autres acteurs qui s’engagent sur plusieurs enjeux (UNIA). Ces acteurs « suisses » semblent fonctionner comme des relais politique pour les revendications des migrants.

Migrants en Suisse : que conclure ?

AU niveau thématique, les résultats semblent indiquer que les institutions de citoyenneté excluent fortement la mobilisation de certains acteurs et notamment des migrants eux-mêmes mais également le relais politique privilégié. Ceci fait la lutte pour la voix des migrants et contre le racisme, une des luttes les plus compliquées de nos jours.

Au niveau méthodologique, les analyses descriptives ne servent pas seulement à décrire mais également à comprendre et expliquer des processus sociaux.

Analyse bi-variée[modifier | modifier le wikicode]

Elle constitue un premier pas dans l’analyse causale et met en relation deux variables. Les outils statistiques qu’on utilise sont les tableaux croisés, la comparaison des moyennes et les corrélations.

Utilité de l’analyse bi-variée[modifier | modifier le wikicode]

Dans ce cours, on nous apprend l’analyse statistique par étape et on passe du simple au complexe. Cela est nécessaire pour déjouer les problèmes si on passe directement à l’analyse multivariée. L’analyse bi-variée nous montre s’il y a une association entre deux variables aussi elle permet de visualiser la nature de la relation : est-elle linéaire ou plurilinéaire ou une autre forme de relation entre deux variables. Ceci est crucial puisque dans une analyse univariée, on ne peut pas le voir et du coup, ça peut donner des relations non-significatives et donc inexistantes mais c’est juste parce que la relation est inexistante. Par exemple, l’âge est plurilinéaire. L’étape bivariée est une étape incontournable de l’analyse statistique mais rarement suffisante parce qu’on ne peut pas contrôler les causes concurrentes et donc éviter les relations fallacieuses. On ne peut s’arrêter au niveau bivariée.

Analyse tri-variée[modifier | modifier le wikicode]

C’est le premier pas vers le contrôle et on met en relation deux variables sous le contrôle d’une 3ème variable. Les outils statistiques utilisés sont les mêmes que pour l’analyse bivarée. On utilise également des tableaux croisés, des moyennes comparées, des corrélations partielles et des régressions multiples (linéaires, logistiques). L’analyse tri-variée n’a pas de propre outil statistique.

Utilité de l’analyse tri-variée[modifier | modifier le wikicode]

Elle joue un rôle clé vers une approximation de la causalité parce qu’elle permet de contrôler si une relation au niveau bivariée subsiste au contrôle d’une troisième variable. Dans l’analyse tri-variée, on peut détecter ce qui se cache derrière. Cependant, pour avoir un petit retour de l’analyse causale, ce n’est pas seulement par l’analyse multivariée qu’on peut contrôler pour la causalité. L’enjeu pour ce niveau d’analyse est le contrôle de la causalité et donc de déceler les fausses relations et d’identifier les causes concurrentes. C’est pourquoi la théorie joue un rôle essentiel, permettant de déjouer en amont les causes concurrentes ou les fausses relations. Ainsi, le contrôle peut s’effectuer à divers moments de la recherche en fonction du dessin de recherche plébiscité par le chercheur (expérimentaux = contrôle ex-ante, corrélationnels = contrôle ex-post).

Logique et analyse du contrôle[modifier | modifier le wikicode]

  • Si X a véritablement un effet sur Y, cet effet devra perdurer malgré l’introduction de causes concurrentes |R.
  • Si X à Y n’est pas une relation fallacieuse, alors l’effet de X devra perdurer après l’introduction d’une cause concurrente |R.

Logique du contrôle ex-post[modifier | modifier le wikicode]

Ainsi, le contrôle ex-post tente de déterminer si l’introduction d’une nouvelle variable influence la relation postulée entre X et Y. Si la relation ne se maintient pas, quatre explications sont possibles :

Nous nous trouvons dans une relation fallacieuse : C’est à dire que la relation supposée est une fausse relation car un autre effet se cacher derrière elle. La relation X1 à Y ne se maintient pas lorsque X5 est introduit. Ainsi, c’est X5 qui se trouve être la véritable cause de la relation entre X1 et Y. C’est par exemple le cas lorsque l’on observe pour ce qui est de l’acceptation de la légalisation de l’avortement. Les jeunes acceptent plus grandement cela par rapport aux vieux si bien que l’on pourrait conclure à une relation entre âge et acceptation de l’avortement. En réalité, c’est l’éducation qui se trouve être la cause de cela.

On peut se trouver dans un cas de multicolinéarité. C’est à dire que les deux causes appliquées à la variable dépendante ne sont pas indépendantes l’une de l’autre ! L’effet de X1 est restreint pas X5 , qui est corrélé à X1 et diminue son pouvoir explicatif. Ainsi, X1 n’explique pas un élément et X5 un autre mais bien le même de manière associée. Sur le schéma, on voit que les deux causes associées diminuent par la même
leur pouvoir explicatif contrairement au cas où ces deux
causes auraient été indépendantes.
Voici un exemple. X1 et X2 explique
Y, les deux ont un effet mais le poids explicatif des deux est diminué de par cette association.

On peut également assister à un effet médiatisé, c’est à dire que l’effet de X1 sur Y est médié par une seconde variable. Ainsi, l’effet de X1 est réduit par le présence de X5 , c’est pourquoi on peut parler d’effet indirect. Sur l’exemple, on voit comment un effet médiatisé peut exister entre la confiance gouvernementale, la participation électorale et l’efficacité politique.

Enfin, on peut être en présence d’un effet d’interaction. Il en existe deux types. Il peut être conditionnel, c’est à dire que l’effet X1 ne s’exerce sur Y que si la variable X5 est présente, ou variable, c’est à dire que l’effet de X5 sur X1 varie selon les catégories considérées. Par exemple, on sait que l’impact d’une manifestation dépend de l’opinion publique sur elle. Un autre exemple peut être l’impact du genre sur la participation électorale. Bien que l’on voit que les femmes participent moins que les hommes, le genre n’est pas la variable explicative première puisque c’est avant tout le niveau d’éducation qui influence la participation électorale. Ainsi, on voit que cette variable influence différemment selon le groupe socioculturel d’appartenance comme le montre ce graphique.

Une analyse importante[modifier | modifier le wikicode]

Ainsi, l’analyse tri-variée est très importante puisqu’elle permet de rendre compte des relations sous-jacentes et constitue le premier pas du contrôle (exclure des relations fallacieuses, examiner l’interdépendance des VI (multicolinéarité), réfléchir aux éventuels effets médiatisés, détecter les effets d’interactions. Toutefois, ce niveau n’est toujours pas suffisant pour ce qui est de l’analyse statistique. En effet, le niveau multivarié est très fréquemment utilisé pour contrôler l’effet de plusieurs causes concurrentes sur une variable dépendante. C’est ce que l’on appelle les analyses de régression multiple. De plus, cette analyse constitue le premier pas du contrôle où on peut contrôler les effets des causes concurrentes tel que l’effet de l’âge sur la législation de l’avortement ; relation fallacieuse ? (contrôlé par l’éducation), multicolinéarité (entre intérêt politique et éducation) et relation additive ?

Conclusion[modifier | modifier le wikicode]

L’analyse uni-variée est très importante puisqu’elle permet de décrire les variables et de commencer à les expliquer. L’analyse bivariée est tout aussi cruciale bien que problématique, ne permettant d’avoir aucun contrôle sur nos variables. C’est pourquoi on passe à un niveau d’analyse plus complexe que représente l’analyse tri-variée. Elle consiste en le premier pas du contrôle et permet de vérifier si l’intervention d’une cause concurrente impacte ou non la relation premièrement observée. Toutefois, elle n’est également pas suffisante, c’est pourquoi on passe alors au niveau mutli-varié. On a besoin de méthodes d’analyse plus puissantes telle que l’analyse de la régression multiple. Ainsi, on va toujours du niveau le plus simple au niveau le plus complexe lorsque l’on effectue des analyses statistiques.