Modification de De la teoría a los datos
Attention : vous n’êtes pas connecté(e). Votre adresse IP sera visible de tout le monde si vous faites des modifications. Si vous vous connectez ou créez un compte, vos modifications seront attribuées à votre propre nom d’utilisateur(rice) et vous aurez d’autres avantages.
La modification peut être annulée. Veuillez vérifier les différences ci-dessous pour voir si c’est bien ce que vous voulez faire, puis publier ces changements pour finaliser l’annulation de cette modification.
Version actuelle | Votre texte | ||
Ligne 7 : | Ligne 7 : | ||
| assistants = | | assistants = | ||
| enregistrement = | | enregistrement = | ||
| cours = [[ | | cours = [[Introduction aux méthodes de la science-politique]] | ||
| lectures = | | lectures = | ||
* [[ | * [[Cours introductif aux méthodes de la science-politique]] | ||
* [[ | * [[Le paradigme positiviste et le paradigme interprétatif]] | ||
* [[ | * [[Les méthodes scientifiques fondamentales]] | ||
* [[De la | * [[De la théorie aux données]] | ||
* [[ | * [[Le recueil des données]] | ||
* [[ | * [[Le traitement des données]] | ||
}} | }} | ||
Ligne 21 : | Ligne 21 : | ||
{{Translations | {{Translations | ||
| en = From theory to data | | en = From theory to data | ||
| | | es = De la teoría a los datos | ||
}} | }} | ||
Ligne 240 : | Ligne 239 : | ||
== Criterios para distinguir las variables == | == Criterios para distinguir las variables == | ||
La variable | La variable est un concept opérationnalisé ; il y a plusieurs manières de définir les variables et donc plusieurs manières de les classer : | ||
*''' | *'''non-manipulables / manipulables''' : | ||
**''' | **'''non-manipulable''' : ce sont des variables qu’on ne peut modifier par exemple les caractéristiques sociodémographiques. | ||
**'''manipulable''': | **'''manipulable''' : les questions à se poser. | ||
*''' | *'''dépendantes / indépendantes''' : | ||
**''' | **'''dépendantes''' : variables expliquées ; c’est ce que l’on veut expliquer aussi appelé variable endogène. | ||
**''' | **'''indépendantes''' : variables explicatives ; elle est censée d'expliquer aussi appelée variable exogène. | ||
*''' | *'''non-observées (latentes) / observées (manifestes)''' : | ||
**''' | **'''non-observées''' : les valeurs sont des variables latentes non-observables. | ||
**''' | **'''observés''' : les opinions peuvent être par exemple observées. | ||
Nota bene: | Nota bene : quand on travaille sur les valeurs en science-politique on aborde les attitudes ; à travers on va remonter à quelque chose de non-observable. | ||
*''' | *'''Individuelles / collectives''' (agrégées, globales, contextuelles) | ||
*''' | |||
== | *'''Traitement des valeurs''' : c'est l'aspect le plus important, il est lié à la mesuration. Il existe différents types de variables. Savoir à quel type de variable on a à faire va nous dire à quel type d’analyse on a à faire ; tout le processus d’opérationnalisation et la fin du processus à savoir la création de variables est fondamental débouchant sur des variables de natures différentes. | ||
== Types de variables == | |||
Il y a trois types de variables qu’il est possible de distinguer entre quatre critères | |||
{| cellspacing="0" cellpadding="20" border="1" | {| cellspacing="0" cellpadding="20" border="1" | ||
Ligne 267 : | Ligne 268 : | ||
!cardinales | !cardinales | ||
|- | |- | ||
|''' | |'''États de propriétés : les valeurs de la variable''' | ||
| | | | ||
Catégories non ordonnés et non ordonnables. | |||
ex : nationalité, religion | |||
| | | | ||
Aussi catégorielles, mais ordonnées ; on peut créer un ordre. | |||
ex : niveau éducation, dans quelle mesure s'intéresse-t-on à quelque chose. | |||
| | | | ||
Plus des catégories, mais des variables : | |||
*''' | *'''continues''' - ex : âge = 1 an, un mois, 3 heures), | ||
*''' | *'''discrètes''' - ex : 1, 2, enfants, pas demi enfant ! | ||
|- | |- | ||
|''' | |'''Procédure d'opérationnalisation''' | ||
| | | | ||
Logique de classification. | |||
| | | | ||
On peut les mettre dans un certain ordre. On peut les inclure dans des catégories différentes. Il y a un ordonnénement, la variable ordinale résulte de la définition opératoire qui consiste à donner un ordre aux différents objets. | |||
| | | | ||
*''' | *'''Mesuration''' : | ||
intervalle entre eux est le même (1 an, par exemple) -v. continues- | |||
*''' | *'''Comptage''' : | ||
on peut les compter -v. discrètes- | |||
|- | |- | ||
|''' | |'''Caractéristiques de valeurs''' | ||
| | | | ||
La | La caractéristique des valeurs est des noms. | ||
ex: | ex : canadien, suisse | ||
Les catégories doivent être exhaustives. Toutes les catégories doivent être contemplées et mutuellement exclusives. | |||
| | | | ||
Nombre avec propriétés ordinales. | |||
ex : peu, assez, très ; on associe un chiffre à chaque état, ce code est arbitraire. | |||
| | | | ||
Nombre avec propriétés cardinales, le nombre reflète une propriété réelle. | |||
ex : allé voter 5 fois, on ne peut pas associer des chiffres arbitrairement. | |||
|- | |- | ||
|''' | |'''Opérations effectuables sur les valeurs''' | ||
| | | | ||
Egalite ou inégalité. | |||
ex : musulman diffèrent de catholique | |||
| | | | ||
Egalite ou inégalité, ordre supérieur ou inférieur. | |||
| | | | ||
On peut appliquer toutes les opérations mathématiques, équivalences, différences, multiplication, etc. | |||
ex : un individu de 40 ans est deux fois un individu de 20 ans. | |||
|} | |} | ||
[[Fichier:Types de variables.png|600px|vignette|centré]] | [[Fichier:Types de variables.png|600px|vignette|centré]] | ||
Corbetta distingue | Corbetta distingue les variables quasi-cardinales, elles se situent entre les deux à savoir entre l’ordinal et le cardinal. Ce serait des variables ordinales, mais qu’on considère comme variables cardinales. On essaie de rendre continue une variable discrète ou ordinale. | ||
Ce sont de variables ordinales qu'on essaie de rendre comme des variables continues. On essaie de rapprocher la différence entre deux valeurs, par exemple (pas, peu, assez, très) ; on ne peut pas dire que la distance entre « pas » et « peu » est la même qu'entre « assez » et « très ». Il est possible de les ordonner, mais pas de mesurer la distance. | |||
Une manière de procéder sont les échelles, par exemple de 0 - 10 afin de définir si nous somme de gauche ou à droite. Dès lors on passe de variables ordinales à cardinales. | |||
== Rapport entre concepts et indicateurs == | |||
C’est l’opérationnalisation des concepts complexes. Généralement, les concepts complexes ne sont pas observables, on ne peut observer que leur manifestation, par exemple la déviance, la religion, le pouvoir. Ce sont concepts à un niveau de généralité plus élevé et abstrait, de plus on ne peut pas les observer directement. | |||
La plupart des concepts en sciences sociales peuvent être définis comme étant des concepts complexes qui sont plus difficiles à opérationnaliser c’est-à-dire de les transformer en propriété d’unité d’analyse. | |||
Exemple : concept de religiosité ; on utilise cinq définitions différentes afin de le formuler qui sont de plus en plus spécifiques : | |||
*croire en une divinité : permet de se diriger vers la concrétisation. | |||
*croire au dieu chrétien : chaque religion à sa définition de dieu. | |||
*appartenir à l'Église catholique | |||
*agir selon les règles de l'église : degrés de précision plus élevée. | |||
*aller à l'église tous les dimanches : on peut essayer d’opérationnaliser le concept de religiosité en le réduisant au fait d’aller à l’église tous les dimanches. | |||
Ainsi, on voit comment peut-on passer du général au spécifique à travers différents passages. | |||
Comment mesurer, opérationnaliser ces différents concepts complexes ? | |||
On peut subdiviser le concept en sous-concepts que l’on appelle des indicateurs. Les indicateurs sont cruciaux dans le processus d’opérationnalisation. | |||
Un indicateur est un concept plus simple, plus spécifique du concept d’origine qui peut être immédiatement traduit en des termes observables. | |||
Les indicateurs sont liés aux concepts plus généraux par un rapport d’indication entre le concept et l'indicateur. On descend dans l'échelle de généralité à des concepts plus spécifiques ; c’est un rapport de représentation sémantique entre l’indicateur et le concept qu’il est censé représenter, indiquer, mesurer. | |||
En d’autres termes, on descend dans l’échelle de généralité et d’abstraction des concepts généraux à des concepts plus spécifiques liés au premier par des affinités de significations. | |||
Nota bene : il n'y a pas un juste choix d’indicateurs. | |||
== Quel est le rapport entre les concepts et l’indicateur ? == | |||
*'''Partialité''' | |||
Un concept ne peut pas être saisi entièrement par un seul indicateur, un indicateur donné couvre seulement un aspect de cette complexité du concept. Les indicateurs sont des représentations partielles. Il faut toujours, si possible, trouver plusieurs indicateurs pour un même concept complexe ; un même concept complexe ne peut jamais être indiqué par un seul indicateur, il y a un critère de multiplicité des indicateurs. | |||
Exemple – la pratique religieuse peut être un indicateur de la composante de la dimension rituelle de la religiosité, mais la religiosité a aussi d’autres composantes comme les sentiments religieux, une idéologie religieuse, une appartenance religieuse, etc. | |||
Il faut toujours être conscient qu’un indicateur est toujours dans un rapport de partialité avec le concept général qu’il est censé indiquer. | |||
*'''Polysémie''' | |||
Un indicateur peut se superposer seulement partiellement à un concept ; en d’autres termes un même indicateur peut être lié à plusieurs concepts, il peut indiquer, signifier, représenter des concepts différents. | |||
Exemple – dans les sociétés théocratiques, la pratique religieuse peut être un indicateur de conformisme sociale plutôt que de religiosité. La pratique de la religion peut être à la fois un indicateur du conformisme sociale et de religiosité. | |||
Un même indicateur ne couvre que partiellement un concept tout en étant un indicateur de concepts différents. | |||
*'''Arbitrariété''' | |||
Le choix des indicateurs est arbitraire, donc il faut les argumenter plutôt que montrer que le choix est correct. Il faut chercher à montrer le lien étroit entre la dimension théorique du concept et la dimension empirique, les deux choses ne peuvent pas être dissociées. | |||
Les indicateurs d’un concept complexe peuvent être trouvés de plusieurs manières selon un raisonnement logique et même selon le sens commun ou plus systématique selon ce qui a été fait dans les recherches précédentes avec une importance de la littérature. | |||
== | == Traduction empirique de concepts complexes : phases de l’opérationnalisation des concepts complexes == | ||
Si on a des concepts qui ne sont pas multidimensionnels, cette phase peut être supprimée ; si on travaille avec un concept complexe, on doit avant tout simplifier le complexe en passant par des dimensions, c’est une réflexion théorique, on analyse le concept dans ses principales composantes de significations. | |||
On distingue quatre phases : | |||
#Articulation du concept en dimensions : on réfléchit aux autres dimensions du concept comme, par exemple, la religiosité qui a des dimensions de pratiques, des idéologies, etc. C’est le passage d'abstractions générales au spécifique,on dit qu'on peut le diviser en sub-concepts pour chaque dimension, toutefois nous ne sommes pas encore dans la phase d’opérationnalisation. On s’interroge sur les différents aspects et significations des concepts. | |||
#Choix des indicateurs : on se pose la question de la traduction empirique, on décide des indicateurs qu’on va choisir. Les indicateurs sont des concepts plus spécifiques, on commence à faire un pas vers les variables comme par exemple s’intéresser à la participation à des rites qui relève de la participation rituelle soit de la dimension pratique religieuse. | |||
#Opérationnalisation : on transforme les indicateurs qui sont encore des concepts en variables. C’est la création des variables qui peuvent être, ordinales, cardinales ou intervalles. Par exemple en ce qui concerne la pratique religieuse on va mesurer et opérationnaliser la pratique religieuse qui est un indicateur d’une dimension de la religiosité c’est-à-dire le nombre de fois qu'on va à l'église par année. Cet indicateur relève de la composante comportementale, car choisir un indicateur « pratique » de la religion permet de déterminer une fréquence. | |||
#Formation des indices : on synthétise l'ensemble des indicateurs en une mesure globale. On va procéder à la formation des indices, on essaie de regrouper ces indicateurs sous une seule mesure cela peut-être par exemple la construction d’échelles ; sur le plan empirique, concret, spécifique, on essaie d’arriver à une mesure, car il est plus facile de travailler avec une variable qu’avec une multitude de variables. | |||
En fonction des objectifs de la recherche, on va choisir plusieurs mesures ou plusieurs indicateurs. | |||
[[Fichier:Traduction empirique de concepts complexes- schéma.png|500px|vignette|centré]] | |||
Ce graphique montre le processus qui va du concept complexe à des indicateurs soit des indicateurs plus spécifiques qui indiquent le concept ; ensuite on a créé des variables puis dans la dernière étape on va regrouper les variables dans une seule mesure qu’on appelle l’indice. | |||
À travers ce processus d’opérationnalisation on crée des variables qui peuvent être, ordinales, cardinales, catégorielles ou des variables intervalles – ordinales. Dans cet exemple on aurait neuf indicateurs à partir desquelles on va construire un indice qui résume le concept. On part d’un concept qui est le niveau théorique vers une variable, l’indice est une variable dérivée de la somme des autres opérations sur les différentes variables. | |||
Dans ce processus il y a toujours une possibilité qu’il y ait des erreurs qui s’introduisent ce qui fait qu’une variable n’est jamais complètement assimilable aux concepts, il y a toujours un décalage ; ce qui est important est de d’abord connaître quelles sont les différentes sources d’erreurs qui produisent le décalage. | |||
On peut remédier à certaines erreurs et à d’autres non, mais le fait de connaitre le problème est quelque chose de très important. | |||
== | == Traduction empirique de concepts complexes : exemples == | ||
[[Fichier:Traduction empirique de concepts complexes- exemple1.png|500px|vignette|centré]] | [[Fichier:Traduction empirique de concepts complexes- exemple1.png|500px|vignette|centré]] | ||
Nota bene: | Nota bene : on a commencé à spécifier le concept à travers sept dimensions | ||
[[Fichier:Traduction empirique de concepts complexes- exemple2.png|500px|vignette|centré]] | [[Fichier:Traduction empirique de concepts complexes- exemple2.png|500px|vignette|centré]] | ||
Nota bene : la distinction entre concept et dimension est relative, maintenant la participation est devenue une dimension d’un autre concept notamment à travers les critères de polysémie, partialité et d’arbitrariété. | |||
Les concepts complexes et les indicateurs sont tous au fond des concepts, on entre dans la phase empirique avec la dernière étape. | |||
[[Fichier:Traduction empirique de concepts complexes- exemple3.png|500px|vignette|centré]] | |||
L’idée est qu’on passe d’un concept abstrait et général à travers des sous dimensions qui permettent d’arriver à choisir des bons indicateurs au sens qu’ils soient justifiables et justifiés dans le contexte de la théorie étant un rapport d’indication avec le concept que l’on veut mesurer. | |||
== | == Erreurs dans le passage des concepts aux indicateurs == | ||
[[Fichier:Erreurs dans le passage des concepts aux indicateurs.png|500px|vignette|centré]] | [[Fichier:Erreurs dans le passage des concepts aux indicateurs.png|500px|vignette|centré]] | ||
Il y a qu’une couverture partielle du concept par l’indicateur, mais il y a toujours un décalage entre la valeur observée et la vraie valeur liée au concept que l’on souhaite mesurer. | |||
Il faut d’abord faire une distinction entre deux types d’erreurs: | |||
*erreur systématique, « erreur constante » | |||
*erreur accidentelle, « erreur variable » | |||
L'erreur totale est la somme de l'erreur accidentelle et de l’erreur systématique. | |||
ERREUR TOTALE = ERREUR ACCIDENTELLE + ERREUR SYSTÉMATIQUE | |||
*'''erreur systématique''' | |||
Se produisent dans toutes nos mesures d’une façon systématique, par exemple tout le monde a tendance à surestimer sa propre participation. | |||
*'''erreur accidentelle''' | |||
C’est une erreur variable d'une mesure à une autre, nous mesurons de façon diffèrent à des moments différents. | |||
Un des deux types d’erreurs est plus facilement détectable que l’autre. Si un problème reste constant, si on ne suppose pas de problèmes alors on ne s’apercevra de rien, c’est pourquoi une erreur accidentelle est plus facilement identifiable. | |||
Il peut y avoir différents types d’erreurs procédant d’une distinction entre deux phases : | |||
1) '''phase d'indication''' : théorique | |||
On peut distinguer deux types d'erreurs : | |||
* | *'''d'indication''' : dû à un mauvais choix des indicateurs, l’indicateur ne mesure pas ce qu’il est censé mesurer. C’est une erreur qui est presque par définition constante ou systématique, difficilement détectable sinon à travers le raisonnement logique et l’intuition. Dans ce cas il y a un problème de validité de l’indicateur c’est-à-dire qu’il ne mesure pas vraiment le concept qu’il est censé mesurer. | ||
* | *'''systématique''' : une fois mal fait, cela va se répercuter sur la recherche. | ||
2) '''phase empirique''' : erreur opérationnalisation | |||
Ces erreurs peuvent découler d’erreurs d’opérationnalisations, elles peuvent être systématiques ou accidentelles. On peut distinguer trois sources d’erreurs d’opérationnalisation, en d’autres termes il y a trois moments auxquels on est soumis au danger et au risque de tomber dans ces erreurs. Toutefois nous allons ignorer l’erreur de traitement des données. | |||
*''' | *'''sélection des cas''' : cas mal choisis, il peut y avoir des erreurs. | ||
**'''couverture''' : consiste du fait qu'on n'ait pas couvert la population qu'on voulait couvrir. | |||
**'''échantillonnage''' : si l'échantillon est fait selon certaines procédures on peut calculer le pourcentage d'erreur. | |||
**'''non-réponse''' : il y a des individus qui ne souhaitent pas répondre au sondage ce qui va biaiser l’analyse. | |||
Il y plusieurs sources d’erreurs liées à la sélection des sujets dans une première phase qui est aussi une erreur d’opérationnalisation. | |||
*''' | *'''d'observation''' : mauvaise observation des cas | ||
**'''interviewer''' : erreurs liées à l’interviewer, il pourrait soumettre l’interviewé à des pressions directes ou indirectes. | |||
**'''interviewé''' : la personne peut mal comprendre la question ou volontairement biaiser la recherche. | |||
**'''instrument''' : la manière dont est administrée la question. | |||
**'''mode de traitement des données''' : analyser d’une mauvaise manière. | |||
*''' | |||
*''' | |||
Il peut y avoir des erreurs qui font que le concept initial ne correspond plus ou correspond seulement en partie avec le concept final qui est la variable. Pour cela il faut être conscient et mettre en place toutes les choses possibles pour réduire au maximum le décalage. Il faut noter que le seul type d’erreur qu’on peut mesurer est l’erreur d’échantillonnage. | |||
Lorsqu’on fait une analyse des données, lorsqu’on a les variables, il faut être conscient que la variable n’est qu’une approximation du concept qu’elle est censée mesurer ou opérationnaliser. | |||
D’autre part il faut faire en sorte de réduire au maximum ces sources d’erreurs en essayant d’éviter tous biais liés à la personne interviewée, en utilisant le bon instrument et le bon mode d’administration tout en couvrant toute la population qu’on est censé étudier par la réduction des non-réponses. | |||
== Fiabilidad y validez == | == Fiabilidad y validez == |