Le recueil des données

Données clés
Faculté	Faculté des sciences de la société
Département	Département de science politique et relations internationales
Professeur(s)	Marco Giugni^[1]
Cours	Introduction aux méthodes de la science-politique

Lectures

Languages

English Español

Italiano

Deux manières de recueillir de l’information[modifier | modifier le wikicode]

Il y a deux grandes manières de recueillir des données en sciences sociales :

Observation : comportements directement observables comme par exemple le degré de tension. C’est une manière de recueillir l’information qui est relativement rare.
Interrogation : le choix dépend de plusieurs facteurs c’est-à-dire des choix faits pendant la question de recherche qui dépend de la question de la question de recherche. C’est le choix de la manière de recueillir les données ; si par exemple on s’intéresse plus à des comportements que des opinions ou des valeurs qui ne sont pas observables.

Enquête par sondage[modifier | modifier le wikicode]

La plupart de la recherche en sciences politiques passe par l’interrogation. La manière privilégiée dans le paradigme positiviste et post-positiviste est l’enquête par sondage.

Si on est intéressé à étudier le comportement électoral, on passe par des données qui ont été collectées par quelqu’un d’autre par le biais d’une enquête par sondage soit d’un questionnaire.

L’enquête par sondage, selon Corbetta, est une manière de recueillir des informations en interrogeant les individus qui sont les objets de la recherche. Les individus appartiennent à un échantillon représentatif à travers une procédure standardisée d’interrogations dans le but d’étudier des relations existantes entre les variables.

L’enquête par sondage se base sur l'interrogation, c’est le fait de poser des questions aux gens ; c’est l’instrument crucial le plus souvent utilisé.

Une enquête par sondage est donc :

recueillir l’information en interrogeant les gens : on pose et formule des questions.
individus objet de la recherche : cela permet de faire une distinction, car il y a d’autres méthodes de collectes des données qui passent par l’interrogation et/ou les individus qu’on interroge ne sont pas les individus ou les sujets que l’on souhaite étudier et notamment les entretiens de type « key informations » c’est-à-dire l’interrogation de personnes qui peuvent nous donner des informations concernant le sujet étudié.
échantillon représentatif : on interroge une partie de la population, si on s’intéresse au comportement électoral des Suisses on ne va pas interroger les sept millions de Suisses, c’est pourquoi on interroge seulement une partie de la population. Toutefois on peut tomber dans les erreurs de sélections et notamment les erreurs d’échantillonnages. Dès lors l’enquête par sondage procède par l’interrogation d’un échantillon représentatif de la population que l’on souhaite étudier.
procédure standardisée de la manière de poser la question : il y a une standardisation de la procédée, car dans l’optique la recherche quantitative on veut standardiser l’information, car on veut comparer les réponses entre elles, c’est pourquoi on pose les mêmes questions à tout le monde et de la même manière. Cela vise à pouvoir traiter les réponses à travers les outils offerts par la statistique. Les choix dépendent de la perspective dans laquelle on s’inscrit, le choix entre une approche quantitative et qualitative est dicté par la question de recherche, mais aussi par les préférences ainsi que les la tradition dans laquelle on s’inscrit. En d’autres termes, la standardisation permet le traitement statistique et la comparaison.
étudier les relations entre les variables : on met les concepts en relations, ensuite on a l’opérationnalisation et à travers cette procédure on arrive à des variables qui permettent d’étudier des relations entre variables. Cette caractéristique permet de distinguer « l’enquête par sondage » du « sondage ». Un sondage n’a pas pour objectif de tester les hypothèses alors que l’enquête par sondage permet de tester les hypothèses. Le sondage est principalement descriptif. On veut vérifier empiriquement des hypothèses et non pas seulement explorer et décrire.

Types de recueil des données à travers l’interrogation[modifier | modifier le wikicode]

Réponses : standardisées/libres[modifier | modifier le wikicode]

Il y a une manière de classer les différents types de recueils de données à travers l’interrogation. La typologie repose sur le degré de standardisation des questions, mais aussi des réponses. On peut dire que lorsqu’on procède par interrogation dans la recherche en sciences sociales on peut poser des questions qui sont standardisées c’est-à-dire les mêmes pour tout le monde.

On peut aussi poser des questions différentes en fonction des sujets qui varient. On pourrait par exemple poser des questions différentes aux hommes et aux femmes si l’on souhaite s’intéresser aux différents rôles dans la famille ou la société.

Il est aussi possible d’envisager un type d’interrogation ou l’on pose des questions différentes à des personnes différentes, car on n’est pas intéressé à standardiser.

En ce qui concerne la standardisation, la formalisation ainsi que la séquence des questions est la même.

Questions : standardisées/libres[modifier | modifier le wikicode]

On a aussi une distinction entre les questions standardisées ou libres. On peut faire en sorte que les réponses soient pareilles pour tout le monde ou laisser un degré de liberté à chacun quant aux réponses.

La réponse standardisée présente des modalités de réponses, on demande de choisir entre différentes modalités.

Typologie[modifier | modifier le wikicode]

dans le questionnaire : les questions et réponses sont standardisées.
l'entretien libre : sans standardisation pour les réponses ni pour les questions.
l'entretien structure : on a les mêmes types de questions cependant chacun peut répondre comme il veut. Les questions sont standardisées, mais on ne donne pas les modalités de réponses, ceci a évidemment des avantages et des désavantages.

Ce sont trois types de procédures afin de tester des hypothèses à travers l’interrogation.

Problèmes de fonds du recueil d’informations à travers l’interrogation[modifier | modifier le wikicode]

Il faut être conscient d’un certain nombre de problèmes de fonds.

Problèmes liés à la standardisation[modifier | modifier le wikicode]

La standardisation découle du paradigme positiviste, on est dans une approche épistémologique objectiviste, on essaie d’uniformiser. Cela a un certain nombre de contre-indications dont surgissent des problèmes : lorsqu’on standardise on gagne d’une part et l’on perd de l’autre côté avec notamment une dépersonnalisation entre l’enquêteur et l’enquêté.

Pour ceux qui s’inscrivent dans ce paradigme, il est préférable qu’il y ait différenciation, car le chercheur doit être séparé du sujet.

Cet objectif d’essayer de se rapprocher d’une neutralité de l’instrument pour obtenir une comparabilité des personnes pose un certain nombre de problèmes, nous sommes dans le cadre des réflexions épistémologiques.

Fiabilité du comportement verbal[modifier | modifier le wikicode]

Si on observe des comportements, on est sûr qu’on l’ait observé ayant une idée de validité de ce qui est observé. Il faut mettre en œuvre tout un appareil méthodologique qui permet de diminuer les sources d’erreurs liées à l’interviewés :

désirabilité sociale des réponses : les individus tendent à répondre d’une manière à offrir une image positive de soi ou de façon à ne pas heurter la sensibilité de la personne qui administre la question.
absence d’opinion : lié à la question des « pseudo-opinions ». Lorsqu’on pose des questions aux individus, si l’on pose la même question à deux individus avec un qui a déjà réfléchi sur la question et s’est formé une opinion et que l’autre personne est confrontée pour la première fois à la question, dans ce cas on se forme une opinion sur le moment qui n’en est peut-être pas une ; dès lors l’absence d’opinion est un problème fondamental dans les démarches d’interrogations. Si on est dans des démarches plus qualitatives on a le temps d’interagir avec la personne lui permettant de se former une opinion et évitant le problème de « pseudo-opinion ».

Quatre aspects de l’enquête par sondage[modifier | modifier le wikicode]

Types de questions[modifier | modifier le wikicode]

Substance[modifier | modifier le wikicode]

Il y a un aspect lié à la substance du contenu de la question ainsi que sa forme.

données sociodémographiques : il y a différents aspects abordés, dont les caractéristiques sociodémographiques des personnes interrogées. C’est quelque chose qu’il ne faut jamais oublier. Les caractéristiques des individus affectent des autres comportements.
attitudes : c'est une prédisposition acquise par rapport à un enjeu politique. Cela permet par exemple d’étudier les valeurs.
comportements : on peut les observer, mais si on ne peut pas les observer il faut interroger les individus. On oriente la recherche sur le comportement de gens par exemple poser des questions sur la participation des individus. Ces données sont plus contrôlables que les « attitudes », car elles sont moins soumises à des variations et plus faciles à observer. On distingue les « questions factuelles » qui portent sur les faits des « questions sur les motivations ». L’idée est que, si possible, il est préférable de poser des questions factuelles et qui concernent les comportements.

Forme[modifier | modifier le wikicode]

Questions ouvertes[modifier | modifier le wikicode]

On laisse la liberté de répondre aux personnes interrogées ; elles sont moins standardisées dans la réponse.

Avantages

Désavantages

permettent la liberté d'expression : tout le monde s'y retrouve, l’individu n’est pas enfermé dans un choix prédéfini.
profondeur des informations : on va dans l’intensif plutôt que dans l’extensif.
plus proches de la donnée réelle : on ne renferme pas la personne dans des modalités de réponses préétablies avec le danger des « pseudo opinions », dès lors on est plus proche de la réalité.

réponses vagues : chacun peut répondre de la manière qu’il souhaite.
absence d’homogénéité dans l'intervention des interviewers.
difficultés dans la phase d'interprétation et de codification des réponses : sur un échantillon de beaucoup de personnes, il est difficile de classer les questions ouvertes, il est mieux de le faire au préalable avec des questions fermées.
suppose un travail de codage pour standardiser.

Questions fermées[modifier | modifier le wikicode]

Ne prévoient pas des modalités de réponses spécifiques, dans les enquêtes par sondage (questionnaire) cette méthode est plus utilisée, car on peut comparer les réponses puisqu’elles sont déjà standardisées.

Avantages

Désavantages

donnent à tous le même cadre de référence : tout le monde a le même cadre de référence.
facilitent le souvenir : permet de faciliter le souvenir, toutefois cela peut être vu comme un désavantage, car cela peut influencer les réponses.
stimulent l'analyse et la réflexion : on réfléchit sur les différents systèmes de réponses.

excluent toutes les alternatives de réponses que le chercheur n'a pas prévues : il faut faire en sorte que toutes les modalités de réponses doivent être incluses.
les alternatives proposées influencent parfois les réponses : on influence l’interviewé et on s’éloigne de la vraie valeur que l’on souhaite observer.
les réponses n’ont pas la même signification pour tous : la définition doit être comprise par tous de la même manière.

Questions mixtes[modifier | modifier le wikicode]

Il y a un item de réponses style « autre » et on a en même temps la question fermée avec les modalités de réponses présentées à la personne interviewée. Dans ce cas on flexibilise l’instrument ; on a la fois la standardisation et on évite l’oublie d’offrir certaines modalités de réponses qui est une erreur fatale, car on ne peut la réparer. D’autre part en cas de doute cela permet de laisser une réponse ouverte.

Question « cafeteria »[modifier | modifier le wikicode]

Renvoie aux questions fermées avec à une liste plus longue de réponses, d’autre part les modalités de réponses peuvent être unique ou multiples.

Formulation des questions[modifier | modifier le wikicode]

Il n’y a pas de bonnes et de mauvaises questions, toutefois il existe un certain nombre d’astuces et de biais afin de les rendre plus pertinentes. On essaie de réduire un certain nombre d’erreurs à travers différentes recettes.

La manière dont on pose la question a des répercussions sur la réponse. Aux États-Unis a été posé la question sur la liberté de parole en ces termes : pensez-vous que les États-Unis devraient permettre les déclarations publiques contre la démocratie ? Les individus ont répondu à 75% « non ». Une autre question a été posée : pensez-vous que les États-Unis devraient interdire les déclarations publiques qui vont contre la démocratie ? Les individus ont répondu à 54% « oui ».

Le résultats est assez diffèrent tandis que dans la première question ¾ des personnes sont d’accord pour ne pas laisser les gens proférer des propos contre la démocratie ; pour la même question posée différemment les individus répondent « oui » à 54%.

Une autre question est : si une situation comme celle du Viêtnam devait se développer dans une autre partie du monde, pensez-vous que les États-Unis devraient envoyer ou ne pas envoyer de troupes ? 18% des gens étaient d’accord. La même question a été posée à un autre groupe, c’est un autre dessin expérimenta par splitage de l’échantillon d’un autre manière : les États-Unis devraient intervenir ou pas en envoyant des troupes pour arrêter une prise de pouvoir de la part des communistes ? Dans ce cas, 33% avait dit « oui ». Ainsi la manière de poser la question est cruciale et change la réponse ; en d’autres termes la manière dont les questions sont posées peut créer des biais.

simplicité du langage : on construit une question que l’on va donner aux personnes interviewées, il faut utiliser un langage simple et qui s’adapte à la personne ou au groupe interviewé.
longueur des questions : il faut essayer de poser des questions courtes.
nombre d’alternatives de réponses : dans le cadre des questions « cafeteria » il faut essayer de ne pas donner une liste trop longue de réponses, en d’autres termes limiter le nombre de réponses.
expressions en jargon : lorsqu’on étudie des subcultures, il faut éviter d’utiliser leur langage.
définitions ambigües : il faut les éviter comme, par exemple, « avez-vous un travail stable ? » ; il faut avant tout préciser ce qu’est un travail stable ; il faut être le plus spécifique possible dans la formulation de la question.
mots à forte connotation négative : si on fait une recherche sur les relations entre parents et enfants et les sanctions appliquées à ces derniers, une question mal posée serait « frappez-vous vos enfants ».
questions syntaxiquement complexes : éviter les questions négatives et notamment celles impliquant une double négation ; par exemple « êtes-vous d’accord ou pas d’accord avec l’affirmation suivante : ce n’est pas vrai que les travailleurs sont dans une si mauvaise situation comme le dise les syndicats aujourd’hui ? ». Il est préférable de poser les questions selon une forme affirmative.
questions avec réponse non-univoque : « vos parents sont-ils religieux ? » ; le problème étant qu’on a deux parents et qu’il y ait une distinction entre mère et père.
questions non-discriminantes : éviter les questions qui ne font pas de différences entre les sujets, car une question qui débouche ensuite sur une réponse presque unanime ne donne plus lieu à une variable, mais à une constante. Afin de travailler dans la recherche quantitative, il faut des variations dans les sujets. Par exemple, « auquel des groupes suivants faites-vous le plus confiance ? » tout le monde fait confiance aux proches ; il faut élargir les possibilités de réponse.
questions tendancieuses : éviter les questions qui suggèrent une réponse, « dans notre pays 700 prêtres ont déclaré que la bible est le message des pauvres et des exploités donc de ceux travaillant dans les usines, participant activement dans les syndicats et organisations politiques afin d’obtenir plus de droits sociaux, pensez-vous que les prêtres ont raison ? ». Il y a trop de termes tendancieux.
comportements présumés : éviter de donner comme acquis certains comportements, par exemple « pour quelle partie avez-vous voté lors de la dernière élection ? », avant tout il faut demander s’individu interrogé peut voter. On appelle aussi ce type de question les « questions filtres ».
focalisation dans le temps : en général, il faut éviter de poser des questions qui sont vagues, par exemple « combien de fois lisez-vous des journaux par mois ? ». il est toujours difficile de se souvenir et de fixer un repère. En général on trouve une question standard qui permet de spécifier le contexte et de fixer un repère temporel permettant ainsi la compatibilité des réponses.
questions abstraites : « pensez-vous que la peine de mort doit être appliquée dans le cas de crimes particulièrement graves ? » Le concept de « crime grave » varie selon l'individu et les groupes d’individus interrogés. Selon que la question est formulée en terme abstrait ou concret influe la réponse, la question la plus valide sera posée par la concrétisation des exemples.
comportements et attitudes : il est toujours mieux de se focaliser sur les comportements que sur les attitudes plus difficiles à déterminer. Par exemple plutôt que dire « êtes-vous intéressé par la politique » on dirait « lisez-vous les actualités politiques dans les journaux ?». Toutefois il n’y a pas d’unanimité. Les comportements donnent un repère factuel qui donne la réponse plus facile, valide et comparable.
désirabilité sociale des réponses : il y a surestimation systématique.
questions embarrassantes : en sociologie dans le cadre d’études notamment sexologiques certaines questions peuvent être embarrassantes.
absence d’opinion et « je ne sais pas » : dans le cadre de pseudo-opinions, un individu répond parce qu’il était forcé de répondre quelque chose. Il faut laisser la possibilité à la personne interviewée de dire qu’il n’a pas d’opinion. Il est possible que l’échantillon interrogé dans une grande proportion n’ait pas d’opinion. C’est un point véritablement problématique.
intensité des attitudes : souvent, il manque une mesure d’intensité des attitudes par rapport à des enjeux spécifiques alors on construit des échelles permettant de donner une mesure de l’intensité de la réponse.
acquiescence : tendance des répondants à dire « oui ». Les individus ont tendance à dire « oui », selon la manière dont on pose la question on peut avoir des réponses différentes.
effet mémoire : le souvenir n'est pas précis, renvoie à la question de donner des repères temporels et factuels. Si possible il faut donner des items de réponses afin de fixer la mémoire du répondant.
séquence des questions : la séquence des questions peut aussi influencer les réponses. Des erreurs peuvent s’infiltrer dans le fait de répondre. Il faut tenir compte de la dynamique du rapport entre l’intervieweur et l’interviewé, de la fatigue de l’interviewé qui permet une pertinence de la réponse, de la séquence de l’interview en termes de savoir ou poser les questions les plus importantes, de « l’effet contamination », car la réponse d’une question peut être influencé par une réponse immédiatement précédente. La réponse à une question ne dépend pas de la question elle-même, mais des questions posées précédemment.

Batteries de questions[modifier | modifier le wikicode]

On pose une question avec différents items de réponses :

épargnent de l’espace et du temps.
facilitent la compréhension du mécanisme de réponse.
améliorent la validité de la réponse puisqu’il y a un cadre unique donné s’appliquant à un cycle de sous-questions.
permettent de construire des indices synthétiques.

Quand on fait un questionnaire standardisé, il faut passer beaucoup de temps à formuler les bonnes questions qui vont nous permettre d’obtenir les bonnes données.

Modalités d’administration du questionnaire[modifier | modifier le wikicode]

On distingue trois grandes manières de faire une enquête par sondage :

face à face : coprésence
interview téléphonique
questionnaire autoadministré
questionnaire online

Interview face-à-face (CAPI : Computer-Assisted Personnal Interviewing /PAPAI : Paper And Pencil Interviewing)[modifier | modifier le wikicode]

Avantages

Désavantages

si on voit qu’une personne a mal comprise la question on peut lui expliquer et même lui montrer des items de réponses.
on peut moduler le temps de l’interview.

il y a une interaction entre interviewé et interviewer, il faut éviter d’influencer le répondant, il est nécessaire d’avoir un certain équilibre.
il faut bien préparer l’entretien afin que les interviewer soient instruits sur la manière dont ils doivent se comporter agissant tous de la même manière.
lorsqu’on pose des questions face à face il faut éviter une attitude passive, fatiguée et démotivée.

Interview téléphonique (Computer-Assisted Telephone Interviewing)[modifier | modifier le wikicode]

L’enquête par téléphone est une méthode qui assure une rapide collecte des données, c’est pourquoi c’est la méthode la plus populaire.

Avantages

Désavantages

il y a moins de résistance des personnes interviewées avec un certain anonymat.
permet d'atteindre des réponses à la périphérie.
permet de faciliter la logistique par la centralisation des enquêteurs.
permet d’informatiser les données.

il y a moins de concentration des gens qui répondent et donc d’implication des personnes interviewées.
les réponses sont plus superficielles.
certains groupes sans téléphone ne sont pas atteignables excluant certains secteurs sociaux introduisant une erreur de sélection et notamment une erreur de couverture de la population sélectionnée.
il faut garder l’attention des interviewés, à partir de 20 minutes les réponses deviennent moins pertinentes.
on ne peut pas utiliser de la matière visuelle.
on ne peut pas récolter de la matière non-verbale.

Questionnaire autoadministré : (Computer-Assisted Web Interviewing)[modifier | modifier le wikicode]

Avantages

Désavantages

réduction des coûts : n’implique que les coûts liés à l’impression du questionnaire et aux frais d’envois qui sont généralement beaucoup plus réduit que les coûts reliés au fait d’engager des enquêteurs. Les frais de personnels sont réduits.
il peut être rempli quand on veut.
donne des garanties d’anonymat plus importantes.
pas de distorsions liées à l’interface interviewée – interviewer.

risque d’erreur dans les réponses : on ne peut pas savoir comment la personne a répondu.
faible taux de réponse : c’est important, car l’erreur de non-réponse est une source d’erreur importante pouvant amener à un problème de représentativité. Si les personnes qui répondent sont égales en termes de caractéristiques alors le problème est moindre, on a moins de cas, mais il reste représentatif de la population en général, car pas diffèrent de la population qui a répondue.

Nota bene : la forme la plus rependue est le questionnaire postal. Un examen est un questionnaire autoadministré avec une contrainte de restitution.

Questionnaire online[modifier | modifier le wikicode]

C’est une modalité qui devient de plus en plus importante, mais qui est critiquée, car il y a un problème de couverture lié à un problème de représentativité de l’échantillon.

Le taux de pénétration d’internet est tellement élevé en occident notamment ce qui justifie que la population est suffisamment bien couverte.

D’autre part les autres types d’administration de questionnaires disposent d’autant de biais que les questionnaires onlines.

Phases qui précèdent le recueil des données[modifier | modifier le wikicode]

Étude exploratoire

C’est une étape très importante dans l’approche quantitative et dans le cadre d’une enquête par sondage ne serait-ce que pour bien définir des modalités de réponses à mettre dans le questionnaire.

Il n’est jamais aisé de définir les questions essentielles, c’est pourquoi il faut procéder à des entretiens qualitatifs qui permettent de dégager quelles sont les réponses possibles des personnes et ceci est d’autant plus important si le sujet n’a pas été exploré auparavant.

Prétest

C’est le fait de tester le questionnaire avant de l'utiliser dans la recherche. L’échantillon doit être semblable à la population étudiée.

Préparation et supervision des interviewers

Préparation des interviewers, il faut avoir une bonne préparation et une bonne supervision.

Contact initial

Il faut clarifier le mandataire de l’enquête, définir clairement les objectifs de l’interview, garantir l’anonymat, souligner l‘importance de la collaboration, mais aussi envoyer plusieurs rappelles afin de faire en sorte que la personne réponde et de manière fiable dans l’optique de baisser le taux de non-réponses.

Forme graphique du questionnaire

Il est nécessaire d’avoir une présentation soignée afin de maintenir la concentration et l’intérêt de la personne qui y répond.

Échantillonnage[modifier | modifier le wikicode]

On procède par échantillonnage plutôt que d’étudier toute une population dans son ensemble ce qui permet de faire des inférences sur l’ensemble de la population.

Définition[modifier | modifier le wikicode]

Selon Corbetta, l’échantillonnage est une procédure à travers laquelle on extrait à partir d’un ensemble d’unités qui constituent l’objet de l’étude en un nombre réduit de cas appelés « échantillon » choisit avec ou selon des critères qui permettent la généralisation à l’ensemble de la population des résultats obtenus sur l’échantillon.

L'enquête par sondage se fait sur une population. On sélectionne un certain nombre de personnes à partir d'une population que l’on souhaite étudier. Dès lors on sélectionne en fonction d’un certain nombre de critères. Pour cela il faut pouvoir inférer les résultats.

Avantages	Désavantages
le coût du recueil des données diminue drastiquement. la durée du recueil des données et du traitement des données est inférieure. l’organisation de l’enquête est plus aisée. la précision est l’approfondissement de l’enquête s’améliore.	on perd une certaine quantité d’informations : si on interview toutes les personnes qui constituent l’objet d’étude, on n’a pas de marge d’erreur possible.

La technique de l’échantillonnage n’a au fond que des avantages. Dans l‘échantillonnage on peut extraire des personnes qui permettent d’estimer la différence entre ce que l’on trouve dans l’échantillon et ce que l’on trouverait dans la population.

Principaux types d’échantillons[modifier | modifier le wikicode]

Les types d’échantillons découlent de la manière dont on extrait l’échantillon de la population. La manière de calculer et d’estimer la marge d’erreur s’applique seulement aux échantillons probabilistes.

Ce sont différents types d’extractions d’une « population mère » qui sont différentes ; la grande distinction est entre les échantillons probabilistes et non-probabilistes.

Échantillon probabiliste / aléatoires simple / systématique / stratifié[modifier | modifier le wikicode]

probabiliste

C’est un échantillon ou chaque unité est extraite avec un probabilité connue, on connait la probabilité que chaque individu de la population a d'être sélectionné. La probabilité est différente de 0.

Cela présent une avantage majeur puisqu’on peut calculer la marge d’erreur. Si on infère et généralise des résultats que l’on trouve dans l’échantillon d’une population, il y a une certaine marge d'erreur, avec l’échantillon probabiliste on peut calculer la marge d'erreur. Comme il est difficile de remplir tous les critères, on choisit parfois l’échantillonnage non-probabiliste.

aléatoire simple

Toutes les unités de la population ont la même probabilité d'être incluses dans l'échantillon. En d’autres termes, chaque personne à la même probabilité de tomber dans l’échantillon. À partir de la liste complète, on extrait par tirage au sort ; on s’appuie sur la loi des grands nombres et on peut démontrer statistiquement que si on extrait de manière aléatoire ces personnes seront représentatives de la population.

systématique

La liste est incomplète, on tire systématiquement tous les individus ; par exemple, sur une liste d’individus on tire tous les dix individus.

stratifié

L'idée est la même que l’échantillonnage aléatoire simple, mais on subdivise d'abord la population en diverses strates puis on choisit en fonction de ce qu'on veut étudier (exemple : classes sociales). Avec des échantillons simples à l'intérieur de chaque strate, la marge d'erreur procédant ainsi est minimisée en comparaison aux autres manières de tirer en général,ainsi la population est plus homogénéisée.

Toutefois, on peut faire des erreurs d’échantillonnage ou encore avoir un problème de non-réponse.

Il y a des sources d’erreurs de couverture, d’échantillonnage et de non-réponse ; cependant on a la chance de pouvoir calculer l’un des trois si on n’a pas procédé à un échantillonnage non-probabiliste : le paramètre qu’on estime dans la population est la somme de l’estimation plus l’erreur d’échantillonnage. Le paramètre estimé pour la population comporte un niveau de confiance sur la base duquel on peut estimer la valeur. Par exemple si on s’intéresse au nombre de fumeurs dans la population suisse et on trouve dans un échantillon de 2000 personnes 30% de Suisses qui fument, on peut dire que 30% de la population suisse est fumeur, mais avec un certain niveau de confiance.

En allant plus loin, on peut utiliser l’intervalle de confiance, on peut dire que les 30% trouvés dans l’échantillon sont représentatifs de la population en fonction d’une marge d’erreur si on veut l’inférer dans la population ; on ne peut pas dire que 30 % de la population suisse, mais on peut dire qu’entre 30 – 33 et 27% fument ; il y a un intervalle dans lequel on va trouver la vraie valeur de la population à partir de la valeur observée dans la population.

Il y a une notion liée à l’intervalle et une notion la confiance en cet intervalle. Si le revenu moyen de la population de Genève est de 5000.- on peut dire que dans la population il va se trouver entre 4500 et 5500 avec une probabilité de 95% que le paramètre va se trouver dans cet intervalle. À partir d’une estimation faite dans l’échantillon, on va trouver la valeur dans la population avec une certaine marge d’erreur et un niveau de confiance.

Échantillons non-probabilistes[modifier | modifier le wikicode]

On ne connaît pas la probabilité de chaque individu de tomber dans l'échantillon donc on ne peut pas calculer la marge d'erreur.

par quota : même logique que pour la stratification, la différence est que dans les quotas on ne choisit pas les sujets de façon aléatoire.
dessin factoriel
« boule de neige »
sondage téléphonique
sondage de convenance

Erreurs d’échantillonnages[modifier | modifier le wikicode]

Erreur d’échantillonnage pour une moyenne[modifier | modifier le wikicode]

Erreur d’échantillonnage pour une moyenne.png

L'erreur d'échantillonnage dépend surtout de trois facteurs :

N, Taille : plus l'échantillon est grand, plus la marge d'erreur est petite ; inversement proportionnel.
S, Écart-type (tendance centrale en fonction de l’hétérogénéité) : dispersion du paramètre que l’on souhaite estimer ; plus il est élevé, plus la marge d'erreur est importante cependant ce n’est pas très important s’il y a beaucoup d'échantillons. On parle de variabilité des paramètres, en d’autres termes c’est un indicateur de l’homogénéité ou de l’hétérogénéité de l’échantillon. Ce qui est important est que la marge d’erreur dépend de manière proportionnelle de l’hétérogénéité de l’échantillon, mais surtout il dépend d’une manière inversement proportionnelle de la taille de l’échantillon, plus l’échantillon est grand plus la marge d’erreur est petite.
Z, Niveau de confiance de l'estimation : c’est un intervalle de confiance, on ne peut pas savoir la vraie valeur, mais il est possible de s’en approcher. En d’autres termes c’est le degré de certitude qu'on accepte quand on fait une inférence. Ainsi cela représente l’intervalle de confiance, on peut montrer que pour un certain niveau de confiance, par exemple pour 95% la confiance est de 1,96, pour un seuil de confiance de 99%, z=2,58. Dans le cas d’un seuil de confiance de 95% cela signifie qu’on a 5% de se tromper.
f, s’applique dans le cas de population très petite, c’est un facteur de correction entre la taille d'échantillon et la population, c’est la division de la taille de l’échantillon par rapport à la taille de la population. Si la fraction s’approche de zéro, le facteur est négligeable. De manière plus pratique, on peut dire que dans n’importe quel sondage l’échantillon est toujours beaucoup plus petit que la population alors que les échantillons dépassent rarement 10000 personnes ce qui fait qu’on peut généralement oublier ce facteur. D’autre part si la différence entre l’échantillon et la population est très petite alors on ne fait pas d’échantillonnage et on interroge tout le monde.

Dès lors, la marge d’erreur dépend :

de la taille de l’échantillon.
du degré d’hétérogénéité du paramètre.
du niveau de confiance que nous sommes disposés à concéder dans l’inférence statistique.

Erreur d’échantillonnage pour une proportion[modifier | modifier le wikicode]

Erreur d’échantillonnage pour une proportion.png

P et Q sont des proportions dans l'échantillon de paramètre que nous voulons expliquer.

Au fond, afin de calculer la marge d’erreur on doit tenir compte en particulier de la taille de l’échantillon. C’est quelque chose qui peut paraitre surprenante, la taille de la « population mère » n’apparaît pas dans le calcul de la formule de l’erreur d’échantillonnage. Autrement dit un échantillon de 1000 personnes sur une population de 50000 personnes donne lieu à la même marge d’erreur qu’un échantillon de 1000 personnes sur une population de 350 millions d’habitants. La taille de l’échantillon donne la même marge d’erreur si on fait un échantillon sur la population des Eaux-Vives ou de la population de l’Australie.

Exemple[modifier | modifier le wikicode]

n	x	S
1000	1253000	311000
100	1250000	308000

Il y a deux échantillons, un de 100 et un 1000 et on veut estimer le revenu moyen. Admettons que tout le monde réponde ; on va essayer de calculer l’erreur d’échantillonnage.

Dans le premier échantillon :

n : 1000
x : 1253000
S: 311000
e : 1,96 pour 5% (seuil standard en sciences sociales)

18700 est l’erreur d’échantillonnage calculée pour un échantillon de 1000 personnes tirées sur une population de 10000 personnes. C’est une marge d’erreur pour un estimateur de la moyenne avec une variabilité qui est calculable et on va trouver une marge d’erreur de 18700.

On interprète 18700 en « plus ou moins » () ; si dans l’échantillon on a trouvé que le revenu moyen est de 1253000, dans la population on peut être sûr de se tromper à 5% si on dit que dans la population le revenu moyen est de 1253000 18700 soit

Plus on veut de sécurité dans l’inférence, plus l’intervalle devient grand.

Dans le second échantillon :

n : 100
x: 1250000
S: 308000
e : 1,96 pour 5% (seuil standard en sciences sociales)

Nota bene : lorsque les proportions sont différentes, la marge d’erreur est plus petite.

Le tableau suivant montre la taille de l’échantillon pour un échantillon aléatoire simple qui est nécessaire pour une certaine précision de la mesure. Plus l’intervalle de confiance est étroit, plus on a une mesure précise, mais il faut à nouveau tenir compte du niveau de confiance.

Si on veut une précision de l’estimateur de 5%, pour une population de 1000 personnes on a besoin d’une population de 285 personnes, etc.

Source: Corbetta, P. (2003). Social Research. Thousand Oaks, CA: Sage.

On voit entre autres que pour une population de 50000 personnes ou plus nécessite une population de 2500 personnes afin d’avoir une estimation précise.

Lorsqu’on a la possibilité de faire un échantillon probabiliste, on a la chance de pouvoir calculer la marge d’erreur et de pouvoir estimer quelle est cette erreur, chose qu’on ne peut faire avec l’erreur de couverture.

Toutefois il y a un problème. Parfois voire même souvent ce n’est pas possible d’avoir un échantillon probabiliste. Souvent l’échantillonnage aléatoire simple n’est pas applicable, car on ne dispose pas de la liste complète des personnes.

Dans ces cas on ne peut procéder à ces types de calculs, alors on procède à d’autres types d’échantillons :

échantillon systématique

On prend une personne à des intervalles réguliers et on peut démontrer que cela se rapproche d’un échantillon probabilité soit d’un échantillon aléatoire. Un exemple est les « exits polls », on rencontre les individus qui sortent des urnes en interviewant toutes les 20 personnes. Un échantillon systématique a la même propriété qu’un échantillon probabiliste, car chaque personne a la même probabilité de rentrer dans l’échantillon.

échantillon stratifié

On a subdivisé la population préalablement pour une raison précise parce qu’on veut diminuer l’hétérogénéité de la population, plus c’est hétérogène plus la marge d’erreur est diminuée. Dans l’échantillon stratifié on prend une variable qui nous intéresse dont les proportions sont dans la population sont connues et on tire des échantillons aléatoires à l’intérieur de chaque catégorie selon ces variables. On a un écart type plus faible et une marge d’erreur plus petite, combinée à un échantillon on démontre que la marge d’erreur globale est inférieure que lorsqu’on tire des individus indifféremment.

échantillons non-probabilistes

Il y a des erreurs de non-réponses et des erreurs de couvertures de la population. De plus en plus de chercheurs faisant des sondages disent que les autres sources d’erreurs sont aussi déterminantes. Il n’est pas vraiment nécessaire de faire ces calculs, mais il faut plutôt aller vers des échantillons non-probabilistes.

Selon Corbetta, un échantillon non-probabiliste est un échantillon qui ne se base pas sur le nombre d’individus ; le plus connu est l’échantillon par quota : à l’intérieur de chaque strate, on choisit un certain nombre de personnes qui vont composer l’échantillon. Si on sait que dans la population que l’on veut étudier il y a 60% de femmes et 40% d’homme, on va faire en sorte qu’il y ait la même proportion dans l’échantillon. On va choisir selon les critères que l’on veut, mais en respectant le quota soit la proportion dans l’échantillon.

Cet échantillon devient de plus en plus fréquent, car il est moins cher et moins laborieux, mais a le désavantage de ne pas pouvoir calculer la marge d’erreur.

Techniques qualitatives[modifier | modifier le wikicode]

On est dans le cadre du paradigme interprétatif :

il n’y a pas de distinction nette du point de vue conceptuel et terminologique.
il n’y a pas de distinction nette du point de vue de l’application, on combine.
le parcours de recherche ne suit pas des phases séparées et distinctes.

Types de recherche qualitative[modifier | modifier le wikicode]

Ce sont les trois grandes activités qu'on peut faire dans le cadre de la recherche. De chacune découlent une méthode qui permet d’interpréter une réalité sociale.

Observation participante[modifier | modifier le wikicode]

C’est une méthode beaucoup moins utilisée en sciences politiques, c’est toutefois une méthode originale utilisée, en d’autres termes c’est un cas particulier de l’observation directe ; c’est une observation avec une participation de l’enquêteur. Elle correspond bien du point de vue épistémologique au paradigme interprétatif qui veut que le chercheur soit partie prenante de sa propre enquête.

Définition[modifier | modifier le wikicode]

Selon Corbetta, l’observation participante est la compréhension par la participation de l’intérieur au phénomène étudié : c’est une stratégie de recherche dans lequel le chercheur s’insère de façon directe et pour une période de temps relativement long dans un groupe social donné pris dans son environnement naturel en instaurant un rapport d’interactions personnelles avec les membres de ce groupe ayant pour but de décrire les actions et de les comprendre moyennant un processus d’identification afin de comprendre leurs motivations.

observation par le chercheur : /
période assez longue : il ne suffit pas d’observer une seule fois.
habitat naturel du groupe : il faut aller observer le groupe dans son habitat naturel.
interaction entre chercheur et objet d’étude : cela caractérise les méthodes du paradigme interprétatif c’est pourquoi on participe au phénomène étudié.
but de décrire et comprendre : on essaie de se mettre à la place de l’autre, c’est une forme d’empathie.

Dans l’observation participante, on recherche une implication du chercheur, le but final est de décrire et de comprendre.

Un exemple très connu est un livre écrit par Goffman qui avait étudié les asiles psychiatriques en Écosses pendant qu’il était infirmier. À partir des observations participantes, il en a déduit que les asiles psychiatriques sont des institutions totales et totalisantes.

Objets de l’observation participante[modifier | modifier le wikicode]

contexte physique : contexte du groupe, des individus observés.
contexte social : phénomène et des dynamiques observe.
interactions formelles : constitue l’objet principal de cette méthode.
interactions informelles : /
interprétations des acteurs sociaux : on observe les interprétations que les acteurs donnent eux-mêmes de leur participation.

Quand doit-on enregistrer les observations quand fait-on des observations participantes ?[modifier | modifier le wikicode]

L’enregistrement d’observations doit être fait le plus près de l’environnement possible, le but de la participation est d’être dans l’évènement que l’on étudie, on observe le plus proche et le concret possible.

Il est très important d’avoir un journal dans lequel on note les différentes observations que l’on fait :

on décrit le « fait » qu’on observe.
on note l’interprétation que fait le chercher.
on note l’interprétation que les sujets eux-mêmes font, l’objectif est de confronter les interprétations.
il faut appliquer un principe de fidélité par un enregistrement précis et filtré de sa propre subjectivité.
il faut distinguer les faits de l’interprétation.

Une observation participante a été faite sur les mouvements sociaux et en particulier le mouvement altermondialiste ; c’était une recherche comparative où on s’intéressait de voir de quelle manière les controverses apparaissent lorsqu’un groupe doit discuter de certains enjeux.

L’objet de l’étude est de par l’observation participante de voir si ce que les organisations mettent en place c’est-à-dire un processus de participation qui relève d’un consensus plutôt qu’un vote majoritaire ou de décisions autonomes afin de rendre compte de la démocratie représentative.

Traditionnellement le journal est utilisé en sociologie et en anthropologie est fait de notes personnelles.

Dans le cas de ces organisations, on a systématisé les observations en créant un protocole qui s’appuie sur des variables et chaque variable est censée mesurer un aspect spécifique de ces débats lorsqu’il y avait des enjeux allant de l’organisation de la prochaine manifestation jusqu’à l’orientation stratégique et idéologique à adopter.

Le chercheur devait récolter des informations de base comme la durée des interactions, les discussions autour d’une controverse, mais aussi le nombre de personnes qui étaient présentes et combien ont participé ainsi que le degré de réciprocité de la discussion à savoir quand les participants se réfèrent à ce que les autres ont dit lorsqu’ils font des propositions, il y avait aussi des aspects de hard power c’est-à-dire l’usage sa position pour influencer la discussion, etc.

En conclusion, on peut très bien étudier de manière quantitative de la matière qualitative. La partie la plus difficile n’est pas la collecte d’informations, mais de les analyser.

Interview qualitative[modifier | modifier le wikicode]

Cette méthode est beaucoup plus utilisée que l’observation participant ; l’objectif est d’essayer d’accéder à la perspective du sujet étudié.

Définition[modifier | modifier le wikicode]

Selon Corbetta, il s’agit d’une conversation provoquée par l’interviewer apprécié par des sujets choisis sur la base d‘un plan d’observations qui sont un nombre consistant ayant comme finalité la connaissance guidé par l’observateur.

conversation provoquée par l’interviewer : une personne conduit l’entretien.
sujets choisis selon un plan systématique d’observation : on interroge les individus sur la base de la manière de mener la rechercher fait préalablement.
nombre assez consistant d’objets : la question est de savoir dans quel mesure on a besoin de faire X entretiens plutôt que Y.
objectif de connaissance : objectif même de la science.
conversation guidée par l’interviewer : l’interviewer guide l’interaction.
schéma flexible et non-standardisé d’interrogation : permet de moduler l’interview.

L’entretien qualitatif se différencie d’un entretien qualitatif par :

l’absence de standardisation.
optique de la compréhension par rapport à une logique de document, on est dans le contexte de découverte plutôt que celui de la justification qui a pour objectif de justifier l’hypothèse.
absence d’un échantillon représentatif : on veut singulariser.
on est dans une approche centrée sur les sujets plutôt que sur les variables.

On peut faire une subdivision supplémentaire, car il y a différentes manières de mener une interview qualitative, on distingue :

entretien structuré

On pose les mêmes questions à toutes les personnes interviewées dans la même formulation et dans la même séquence. Les personnes interviewées ont la liberté complète de réponse, c’est un entretien fait par des questions ouvertes, il y a un souci de comparabilité derrière ce type d’enquêtes.

C’est un type d’interview qui n’est pas très répandu, car on peut standardiser un minimum, mais pas suffisamment.

entretien semi-structuré

L’interviewer n’a qu’une trace de ce qu’il veut toucher et des arguments qu’il veut aborder, mais on peut poser ces arguments dans des ordres différents, on n’est plus dans le contexte de l’interaction. Cette trace peut varier dans la décision et le détail, l’idée est qu’on ne pose pas la même question à tout le monde, mais on ajuste les arguments.

entretien non-structuré

Ni la forme ni le contenu des questions est préétablie, cette forme et ce contenu peut varier d’un sujet à l’autre donc il y a une individualité des arguments et un itinéraire variable de l’entretien,on a seulement un itinéraire, tout le reste est ouvert.

méthode des « histoires de vie »

Narration de la vie de l’individu, c’est un cas extrême.

entretien non-directif

La finalité est différente que celle de la recherche scientifique, il peut y avoir des entretiens thérapeutiques ou cliniques.

entretiens faits par des observateurs privilégiés / key informers

On fait des entretiens, mais les personnes interviewées ne sont pas l’objet de la recherche, on interroge ces personnes parce qu’elles sont bien informées sur un certain phénomène.

entretien de groupe / collectif

On interview plusieurs personnes en même temps, ce sont des « focus groups » à savoir des groupes focalisés c’est-à-dire qu’il y a un aspect lié à l’interaction entre les personnes interviewées qui devient crucial.

Conduite de l’interview : suggestion de « bonne pratique »[modifier | modifier le wikicode]

explications préliminaires : expliquer pourquoi on est là, quel est le but de la recherche, mettre l’individu dans le contexte.
questions primaires : ce sont des questions qui introduisent de nouveaux thèmes dans un entretien, en général ce sont les questions qu’on met dans son guide d’entretiens.
questions secondaires : permettent d’approfondir ou d’articuler la question primaire.
questions de relance : toute l’habilité de l’enquêteur est de les maitriser.
- répétition de la question : répéter la question.
- répétition de la réponse ou d’une synthèse des dernières réponses : répéter la réponse donnée par la personne interviewée ou de faire une sorte de synthèse de ce que la personne à dit.
- encouragement, expression d’intérêt : on doit voir la personne en train de se rappeler de quelque chose.
- pause : temporisation.
- demande d’approfondissement : obtenir des détails supplémentaire ou plus précis.
langage : il faut soigner son langage et faire attention à l’utilisation d’un langage sectoriel ou propre à une sous-culture ni d’en abuser.
rôle de l’interviewer : le rôle est crucial lorsqu’il s’agit d’un entretien qualitatif beaucoup plus que dans le cadre d’enquête par sondage ou on peut payer quelqu’un qui réalise l’entretien. On peut difficilement envoyer quelqu’un d’autre mener l’entretien, car il n’a pas été impliqué dans le processus d’élaboration de la recherche.

L’élément qui est à la fois la force et la faiblesse de cette méthode est l’absence de standardisation qui permet de mieux approfondir certains sujets, mais en même temps cela rend plus difficile la comparaison, la confrontation des réponses des personnes interviewées.

Concernant l’analyse des données basées sur les entretiens qualitatifs, il faut savoir que :

l’analyse de données est centrée d’abord sur les cas et non pas sur les variables sauf exception à travers des protocoles standardisés pour les observations participantes.
la présentation des résultats se fait selon une perspective narrative, on raconte des épisodes, on décrit les cas, souvent à travers les mots de personnes interviewées, on peut prendre des extraits et les utiliser pour l’analyse.
on procède par la voie de classifications, de typologies dans le cadre d’approche techniques, on vise à faire ressortir des profils.

Lecture - Documents[modifier | modifier le wikicode]

C’est le type d’affinité que l’on fait lorsqu’on s’insère dans une approche qualitative.

Définition[modifier | modifier le wikicode]

Selon Corbetta un document est un matériel informatif sur un phénomène social donné qui existe indépendamment de l’action du chercheur.

matériel informatif.
sur un phénomène social donné.
existe indépendamment de l’action du chercheur.

Types de documents[modifier | modifier le wikicode]

On fait une distinction entre les données primaires construites par le chercheur des données secondaires qui sont les données qui existent.

Documents personnels :
- autobiographies
- journaux intimes
- lettres
- témoignages oraux

Documents institutionnels : en science politique ce sont surtout ces documents qui nous intéressent.
- moyens de communication de masse : source d’information privilégiée pour les politologues.
- narration, textes pédagogiques, récits de la culture populaire : approche plutôt sociologique.
- matériel judiciaires
- documents de la politique
- documents d’entreprises et administratifs
- traces physiques