« Data collection » : différence entre les versions

De Baripedia
Ligne 90 : Ligne 90 :
* '''Difficulties in the interpretation and coding phase of the responses''': on a sample of many people, it is difficult to classify open-ended questions, it is better to do so beforehand with closed-ended questions.
* '''Difficulties in the interpretation and coding phase of the responses''': on a sample of many people, it is difficult to classify open-ended questions, it is better to do so beforehand with closed-ended questions.
* '''requires coding work to standardize'''.
* '''requires coding work to standardize'''.


|}
|}


==== Closed Questions ====
==== Closed Questions ====
Ne prévoient pas des modalités de réponses spécifiques, dans les enquêtes par sondage (questionnaire) cette méthode est plus utilisée, car on peut comparer les réponses puisqu’elles sont déjà standardisées.
This method is more widely used in sample surveys (questionnaire) because it is possible to compare the responses since they are already standardised.


{| cellspacing="0" cellpadding="20" border="1"
{| cellspacing="0" cellpadding="20" border="1"
!Avantages
!Advantages
!Désavantages
!Disadvantages
|-
|-
|
|
*'''donnent à tous le même cadre de référence''' : tout le monde a le même cadre de référence.
*'''give everyone the same frame of reference''': everyone has the same frame of reference.
*'''facilitent le souvenir''' : permet de faciliter le souvenir, toutefois cela peut être vu comme un désavantage, car cela peut influencer les réponses.
*'''make it easier to remember''': makes remembering easier, but it can be seen as a disadvantage, because it can influence the answers.
*'''stimulent l'analyse et la réflexion''' : on réfléchit sur les différents systèmes de réponses.
*'''stimulate analysis and reflection''': we reflect on the different response systems.
|
|
*'''excluent toutes les alternatives de réponses que le chercheur n'a pas prévues''' : il faut faire en sorte que toutes les modalités de réponses doivent être incluses.
* '''preclude all alternative responses that the researcher did not foresee''': ensure that all response modalities are included.
*'''les alternatives proposées influencent parfois les réponses''' : on influence l’interviewé et on s’éloigne de la vraie valeur que l’on souhaite observer.
* '''the proposed alternatives sometimes influence the answers''': we influence the interviewee and move away from the true value we want to observe.
*'''les réponses n’ont pas la même signification pour tous''' : la définition doit être comprise par tous de la même manière.
* '''the answers do not have the same meaning for everyone''': the definition must be understood by everyone in the same way.
 
 
|}
|}


Ligne 147 : Ligne 148 :
*'''séquence des questions''' : la séquence des questions peut aussi influencer les réponses. Des erreurs peuvent s’infiltrer dans le fait de répondre. Il faut tenir compte de la dynamique du rapport entre l’intervieweur et l’interviewé, de la fatigue de l’interviewé qui permet une pertinence de la réponse, de la séquence de l’interview en termes de savoir ou poser les questions les plus importantes, de « l’effet contamination », car la réponse d’une question peut être influencé par une réponse immédiatement précédente. La réponse à une question ne dépend pas de la question elle-même, mais des questions posées précédemment.
*'''séquence des questions''' : la séquence des questions peut aussi influencer les réponses. Des erreurs peuvent s’infiltrer dans le fait de répondre. Il faut tenir compte de la dynamique du rapport entre l’intervieweur et l’interviewé, de la fatigue de l’interviewé qui permet une pertinence de la réponse, de la séquence de l’interview en termes de savoir ou poser les questions les plus importantes, de « l’effet contamination », car la réponse d’une question peut être influencé par une réponse immédiatement précédente. La réponse à une question ne dépend pas de la question elle-même, mais des questions posées précédemment.


== Batteries de questions ==
== Batteries of questions ==
On pose une question avec différents items de réponses :
We ask a question with different answer items:
*épargnent de l’espace et du temps.
* save space and time.
*facilitent la compréhension du mécanisme de réponse.
* facilitate understanding of the response mechanism.
*améliorent la validité de la réponse puisqu’il y a un cadre unique donné s’appliquant à un cycle de sous-questions.
* improve the validity of the response since there is a single given framework for a cycle of sub-questions.
*permettent de construire des indices synthétiques.
* allow the construction of synthetic indices.
When we do a standardized questionnaire, we have to spend a lot of time formulating the right questions that will allow us to get the right data.
Quand on fait un questionnaire standardisé, il faut passer beaucoup de temps à formuler les bonnes questions qui vont nous permettre d’obtenir les bonnes données.
 
== Methods of administering the questionnaire ==
There are three main ways of conducting a sample survey:
* face-to-face: copresence
* telephone interview
* self-administered questionnaire
* online questionnaire


== Modalités d’administration du questionnaire ==
On distingue trois grandes manières de faire une enquête par sondage :
*face à face : coprésence
*interview téléphonique
*questionnaire autoadministré
*questionnaire online
=== Interview face-à-face (CAPI : Computer-Assisted Personnal Interviewing /PAPAI : Paper And Pencil Interviewing) ===
=== Interview face-à-face (CAPI : Computer-Assisted Personnal Interviewing /PAPAI : Paper And Pencil Interviewing) ===
{| cellspacing="0" cellpadding="20" border="1"
{| cellspacing="0" cellpadding="20" border="1"

Version du 11 mars 2018 à 20:40

Languages

Two Ways to Collect Information

There are two main ways of collecting data in the social sciences:

  • Observation: directly observable behaviours such as tension. It is a relatively rare way of gathering information.
  • Questioning: The choice depends on several factors, i. e. the choices made during the research question, which depends on the question of the research question. It is the choice of how to collect the data; for example, if you are more interested in behaviours than opinions or values that are not observable.

Poll survey

Most political science research involves questioning. The preferred way in the positivist and post-positiveist paradigm is through sample surveys.

If you are interested in studying electoral behaviour, you go through data that has been collected by someone else through a sample survey or questionnaire.

Corbetta argues that the sample survey is a way of collecting information by interviewing individuals who are the objects of the research. Individuals belong to a representative sample through a standardised interrogation procedure to investigate relationships between variables.

The sample survey is based on questioning, asking people questions; it is the most commonly used and crucial instrument.

A sample survey is therefore:

  • collect information by questioning people: asking and formulating questions.
  • individuals who are the subject of the research: this makes it possible to make a distinction, because there are other methods of data collection that involve questioning and/or the individuals being questioned are not the individuals or subjects that we wish to study and in particular "key information" interviews, i. e. the questioning of people who can give us information about the subject under study.
  • representative sample: we question part of the population, if we are interested in the electoral behaviour of the Swiss, we are not going to question the seven million Swiss, that's why we only question part of the population. However, one can fall into selection errors and especially sampling errors. Therefore, the sample survey is conducted by interviewing a representative sample of the population to be studied.
  • Standardized procedure of the way of asking the question: there is a standardization of the procedure, because in quantitative research we want to standardize the information, because we want to compare the answers between them, that's why we ask the same questions to everyone and in the same way. This aims to be able to process the answers through the tools offered by statistics. The choices depend on the perspective from which you choose, the choice between a quantitative and qualitative approach is dictated not only by the research question, but also by the preferences and the tradition in which you choose. In other words, standardization allows statistical processing and comparison.
  • study the relationships between variables: we put the concepts in relation, then we have the operationalization and through this procedure we arrive at variables that allow us to study relationships between variables. This distinguishes "sample survey" from "survey". A survey is not intended to test hypotheses, whereas a sample survey can be used to test hypotheses. The survey is mainly descriptive. We want to empirically test hypotheses, not just explore and describe.

Types of data collection through interrogation

Types de recueil des données à travers l’interrogation.png

Answers: standardised/free

There is a way to classify the different types of data collection through the query. The typology is based on the degree of standardization of questions, but also of answers. We can say that when we proceed by interrogation in social science research, we can ask questions that are standardized, that is to say, the same questions for everyone.

Different questions may also be asked depending on the subject matter. For example, men and women could be asked different questions if they want to look at different roles in the family or society.

It is also possible to consider a type of question or ask different people different questions because you are not interested in standardization.

With regard to standardisation, the formalisation and sequence of questions is the same.

Questions: Standardized/Free

There is also a distinction between standardized or free questions. We can make sure that the answers are the same for everyone, or we can give everyone a degree of freedom in the answers.

The standardised response presents ways of answering the questions, we ask to choose between different ways of answering them.

Typology

  • in the questionnaire: questions and answers are standardized.
  • free interview: no standardisation of answers or questions.
  • structured interview: we have the same types of questions but everyone can answer as they please. The questions are standardised, but we don't give the answers, this obviously has advantages and disadvantages.

These are three types of procedures to test hypotheses through questioning.

Substantive problems of information gathering through interrogation

There are a number of substantive issues that need to be addressed.

Problems related to standardization

Standardization stems from the positivist paradigm, one is in an objectivist epistemological approach, one tries to standardize. This has a certain number of contraindications that give rise to problems: when we standardize we win on the one hand and lose on the other with a depersonalization between the investigator and the respondent.

For those who fall within this paradigm, it is preferable that there be differentiation, as the researcher must be separated from the subject.

This objective of trying to come closer to a neutrality of the instrument in order to obtain a comparability of people raises a number of problems, we are in the framework of epistemological reflections.

Reliability of verbal behaviour

If behaviours are observed, it is certain that they have been observed with an idea of the validity of what is observed. An entire methodological apparatus must be implemented to reduce the sources of errors related to the interviewees:

  • social desirability of responses: individuals tend to respond in a way that offers a positive self-image or in a way that does not offend the sensitivity of the person administering the question.
  • absence of opinion: linked to the question of "pseudo-opinions". When we ask individuals questions, if we ask the same question to two individuals with one who has already reflected on the question and formed an opinion and the other person is confronted for the first time with the question, in this case we form an opinion on the moment that may not be one; therefore the absence of opinion is a fundamental problem in the questioning process. If we are in more qualitative approaches, we have time to interact with the person allowing him/her to form an opinion and avoiding the problem of "pseudo-opinion".

Four aspects of the polling survey

Types of questions

Substance

There is an aspect related to the substance of the content of the question and its form.

  • Socio-demographic data: there are different aspects addressed, including the socio-demographic characteristics of respondents. It's something you should never forget. Individual characteristics affect other behaviours.
  • attitudes: this is an acquired predisposition towards a political issue. This makes it possible, for example, to study the values.
  • behaviours: we can observe them, but if we cannot observe them, we must question the individuals. Research is oriented towards people's behaviour, such as asking questions about the participation of individuals. These data are more controllable than "attitudes" because they are less subject to variation and easier to observe. A distinction is made between "factual questions" that deal with facts and "questions on motivations". The idea is that, if possible, it is preferable to ask factual and behavioural questions.

Shape

Open questions

Respondents are given the freedom to respond; they are less standardized in the response.

Advantages Disadvantages
  • allow freedom of expression: everyone can find their way around, the individual is not locked in a predefined choice.
  • depth of information: we go into the intensive rather than the extensive.
  • closer to the real data: we do not confine the person to pre-established answer modalities with the danger of "pseudo opinions", so we are closer to reality.
  • vague answers: everyone can respond in whatever way they want.
  • lack of homogeneity in the intervention of interviewers.
  • Difficulties in the interpretation and coding phase of the responses: on a sample of many people, it is difficult to classify open-ended questions, it is better to do so beforehand with closed-ended questions.
  • requires coding work to standardize.

Closed Questions

This method is more widely used in sample surveys (questionnaire) because it is possible to compare the responses since they are already standardised.

Advantages Disadvantages
  • give everyone the same frame of reference: everyone has the same frame of reference.
  • make it easier to remember: makes remembering easier, but it can be seen as a disadvantage, because it can influence the answers.
  • stimulate analysis and reflection: we reflect on the different response systems.
  • preclude all alternative responses that the researcher did not foresee: ensure that all response modalities are included.
  • the proposed alternatives sometimes influence the answers: we influence the interviewee and move away from the true value we want to observe.
  • the answers do not have the same meaning for everyone: the definition must be understood by everyone in the same way.


Mixed Questions

There is an "other" style answer item and at the same time we have the question closed with the answer modalities presented to the interviewee. In this case, we make the instrument more flexible; we have both standardisation and we avoid forgetting to offer certain response modalities, which is a fatal error, because it cannot be repaired. On the other hand, in case of doubt, this allows an answer to be left open.

Question « cafeteria »

Refers to closed questions with a longer list of answers, on the other hand the response modalities can be single or multiple.

Formulation of questions

There are no good and bad questions, however there are a number of tips and tricks to make them more relevant. We try to reduce a number of errors through different recipes.

The manner in which the question is posed affects the answer. In the United States was asked the question on freedom of speech in these terms: do you think that the United States should allow public statements against democracy? Individuals answered 75% "no". Another question was asked: Do you think that the United States should ban public statements that go against democracy? Individuals answered 54% "yes".

The results are quite different while in the first question - people agree not to let people speak against democracy; for the same question asked differently individuals answer "yes" to 54%.

Another question is: if a situation like that of Vietnam were to develop in another part of the world, do you think that the United States should send or not send troops? 18% of people agreed The same question was asked to another group, it is another experimental design by splitting the sample in another way: the United States should intervene or not by sending troops to stop a takeover of the Communists? In this case, 33% said "yes". So the way of asking the question is crucial and changes the answer; in other words, the way questions are asked can create bias.

  • simplicité du langage : on construit une question que l’on va donner aux personnes interviewées, il faut utiliser un langage simple et qui s’adapte à la personne ou au groupe interviewé.
  • longueur des questions : il faut essayer de poser des questions courtes.
  • nombre d’alternatives de réponses : dans le cadre des questions « cafeteria » il faut essayer de ne pas donner une liste trop longue de réponses, en d’autres termes limiter le nombre de réponses.
  • expressions en jargon : lorsqu’on étudie des subcultures, il faut éviter d’utiliser leur langage.
  • définitions ambigües : il faut les éviter comme, par exemple, « avez-vous un travail stable ? » ; il faut avant tout préciser ce qu’est un travail stable ; il faut être le plus spécifique possible dans la formulation de la question.
  • mots à forte connotation négative : si on fait une recherche sur les relations entre parents et enfants et les sanctions appliquées à ces derniers, une question mal posée serait « frappez-vous vos enfants ».
  • questions syntaxiquement complexes : éviter les questions négatives et notamment celles impliquant une double négation ; par exemple « êtes-vous d’accord ou pas d’accord avec l’affirmation suivante : ce n’est pas vrai que les travailleurs sont dans une si mauvaise situation comme le dise les syndicats aujourd’hui ? ». Il est préférable de poser les questions selon une forme affirmative.
  • questions avec réponse non-univoque : « vos parents sont-ils religieux ? » ; le problème étant qu’on a deux parents et qu’il y ait une distinction entre mère et père.
  • questions non-discriminantes : éviter les questions qui ne font pas de différences entre les sujets, car une question qui débouche ensuite sur une réponse presque unanime ne donne plus lieu à une variable, mais à une constante. Afin de travailler dans la recherche quantitative, il faut des variations dans les sujets. Par exemple, « auquel des groupes suivants faites-vous le plus confiance ? » tout le monde fait confiance aux proches ; il faut élargir les possibilités de réponse.
  • questions tendancieuses : éviter les questions qui suggèrent une réponse, « dans notre pays 700 prêtres ont déclaré que la bible est le message des pauvres et des exploités donc de ceux travaillant dans les usines, participant activement dans les syndicats et organisations politiques afin d’obtenir plus de droits sociaux, pensez-vous que les prêtres ont raison ? ». Il y a trop de termes tendancieux.
  • comportements présumés : éviter de donner comme acquis certains comportements, par exemple « pour quelle partie avez-vous voté lors de la dernière élection ? », avant tout il faut demander s’individu interrogé peut voter. On appelle aussi ce type de question les « questions filtres ».
  • focalisation dans le temps : en général, il faut éviter de poser des questions qui sont vagues, par exemple « combien de fois lisez-vous des journaux par mois ? ». il est toujours difficile de se souvenir et de fixer un repère. En général on trouve une question standard qui permet de spécifier le contexte et de fixer un repère temporel permettant ainsi la compatibilité des réponses.
  • questions abstraites : « pensez-vous que la peine de mort doit être appliquée dans le cas de crimes particulièrement graves ? » Le concept de « crime grave » varie selon l'individu et les groupes d’individus interrogés. Selon que la question est formulée en terme abstrait ou concret influe la réponse, la question la plus valide sera posée par la concrétisation des exemples.
  • comportements et attitudes : il est toujours mieux de se focaliser sur les comportements que sur les attitudes plus difficiles à déterminer. Par exemple plutôt que dire « êtes-vous intéressé par la politique » on dirait « lisez-vous les actualités politiques dans les journaux ?». Toutefois il n’y a pas d’unanimité. Les comportements donnent un repère factuel qui donne la réponse plus facile, valide et comparable.
  • désirabilité sociale des réponses : il y a surestimation systématique.
  • questions embarrassantes : en sociologie dans le cadre d’études notamment sexologiques certaines questions peuvent être embarrassantes.
  • absence d’opinion et « je ne sais pas » : dans le cadre de pseudo-opinions, un individu répond parce qu’il était forcé de répondre quelque chose. Il faut laisser la possibilité à la personne interviewée de dire qu’il n’a pas d’opinion. Il est possible que l’échantillon interrogé dans une grande proportion n’ait pas d’opinion. C’est un point véritablement problématique.
  • intensité des attitudes : souvent, il manque une mesure d’intensité des attitudes par rapport à des enjeux spécifiques alors on construit des échelles permettant de donner une mesure de l’intensité de la réponse.
  • acquiescence : tendance des répondants à dire « oui ». Les individus ont tendance à dire « oui », selon la manière dont on pose la question on peut avoir des réponses différentes.
  • effet mémoire : le souvenir n'est pas précis, renvoie à la question de donner des repères temporels et factuels. Si possible il faut donner des items de réponses afin de fixer la mémoire du répondant.
  • séquence des questions : la séquence des questions peut aussi influencer les réponses. Des erreurs peuvent s’infiltrer dans le fait de répondre. Il faut tenir compte de la dynamique du rapport entre l’intervieweur et l’interviewé, de la fatigue de l’interviewé qui permet une pertinence de la réponse, de la séquence de l’interview en termes de savoir ou poser les questions les plus importantes, de « l’effet contamination », car la réponse d’une question peut être influencé par une réponse immédiatement précédente. La réponse à une question ne dépend pas de la question elle-même, mais des questions posées précédemment.

Batteries of questions

We ask a question with different answer items:

  • save space and time.
  • facilitate understanding of the response mechanism.
  • improve the validity of the response since there is a single given framework for a cycle of sub-questions.
  • allow the construction of synthetic indices.

When we do a standardized questionnaire, we have to spend a lot of time formulating the right questions that will allow us to get the right data.

Methods of administering the questionnaire

There are three main ways of conducting a sample survey:

  • face-to-face: copresence
  • telephone interview
  • self-administered questionnaire
  • online questionnaire

Interview face-à-face (CAPI : Computer-Assisted Personnal Interviewing /PAPAI : Paper And Pencil Interviewing)

Avantages Désavantages
  • si on voit qu’une personne a mal comprise la question on peut lui expliquer et même lui montrer des items de réponses.
  • on peut moduler le temps de l’interview.
  • il y a une interaction entre interviewé et interviewer, il faut éviter d’influencer le répondant, il est nécessaire d’avoir un certain équilibre.
  • il faut bien préparer l’entretien afin que les interviewer soient instruits sur la manière dont ils doivent se comporter agissant tous de la même manière.
  • lorsqu’on pose des questions face à face il faut éviter une attitude passive, fatiguée et démotivée.

Interview téléphonique (Computer-Assisted Telephone Interviewing)

L’enquête par téléphone est une méthode qui assure une rapide collecte des données, c’est pourquoi c’est la méthode la plus populaire.

Avantages Désavantages
  • il y a moins de résistance des personnes interviewées avec un certain anonymat.
  • permet d'atteindre des réponses à la périphérie.
  • permet de faciliter la logistique par la centralisation des enquêteurs.
  • permet d’informatiser les données.
  • il y a moins de concentration des gens qui répondent et donc d’implication des personnes interviewées.
  • les réponses sont plus superficielles.
  • certains groupes sans téléphone ne sont pas atteignables excluant certains secteurs sociaux introduisant une erreur de sélection et notamment une erreur de couverture de la population sélectionnée.
  • il faut garder l’attention des interviewés, à partir de 20 minutes les réponses deviennent moins pertinentes.
  • on ne peut pas utiliser de la matière visuelle.
  • on ne peut pas récolter de la matière non-verbale.

Questionnaire autoadministré : (Computer-Assisted Web Interviewing)

Avantages Désavantages
  • réduction des coûts : n’implique que les coûts liés à l’impression du questionnaire et aux frais d’envois qui sont généralement beaucoup plus réduit que les coûts reliés au fait d’engager des enquêteurs. Les frais de personnels sont réduits.
  • il peut être rempli quand on veut.
  • donne des garanties d’anonymat plus importantes.
  • pas de distorsions liées à l’interface interviewée – interviewer.
  • risque d’erreur dans les réponses : on ne peut pas savoir comment la personne a répondu.
  • faible taux de réponse : c’est important, car l’erreur de non-réponse est une source d’erreur importante pouvant amener à un problème de représentativité. Si les personnes qui répondent sont égales en termes de caractéristiques alors le problème est moindre, on a moins de cas, mais il reste représentatif de la population en général, car pas diffèrent de la population qui a répondue.

Nota bene : la forme la plus rependue est le questionnaire postal. Un examen est un questionnaire autoadministré avec une contrainte de restitution.

Questionnaire online

C’est une modalité qui devient de plus en plus importante, mais qui est critiquée, car il y a un problème de couverture lié à un problème de représentativité de l’échantillon.

Le taux de pénétration d’internet est tellement élevé en occident notamment ce qui justifie que la population est suffisamment bien couverte.

D’autre part les autres types d’administration de questionnaires disposent d’autant de biais que les questionnaires onlines.

Phases qui précèdent le recueil des données

  • Étude exploratoire

C’est une étape très importante dans l’approche quantitative et dans le cadre d’une enquête par sondage ne serait-ce que pour bien définir des modalités de réponses à mettre dans le questionnaire.

Il n’est jamais aisé de définir les questions essentielles, c’est pourquoi il faut procéder à des entretiens qualitatifs qui permettent de dégager quelles sont les réponses possibles des personnes et ceci est d’autant plus important si le sujet n’a pas été exploré auparavant.

  • Prétest

C’est le fait de tester le questionnaire avant de l'utiliser dans la recherche. L’échantillon doit être semblable à la population étudiée.

  • Préparation et supervision des interviewers

Préparation des interviewers, il faut avoir une bonne préparation et une bonne supervision.

  • Contact initial

Il faut clarifier le mandataire de l’enquête, définir clairement les objectifs de l’interview, garantir l’anonymat, souligner l‘importance de la collaboration, mais aussi envoyer plusieurs rappelles afin de faire en sorte que la personne réponde et de manière fiable dans l’optique de baisser le taux de non-réponses.

  • Forme graphique du questionnaire

Il est nécessaire d’avoir une présentation soignée afin de maintenir la concentration et l’intérêt de la personne qui y répond.

Échantillonnage

On procède par échantillonnage plutôt que d’étudier toute une population dans son ensemble ce qui permet de faire des inférences sur l’ensemble de la population.

Définition

Selon Corbetta, l’échantillonnage est une procédure à travers laquelle on extrait à partir d’un ensemble d’unités qui constituent l’objet de l’étude en un nombre réduit de cas appelés « échantillon » choisit avec ou selon des critères qui permettent la généralisation à l’ensemble de la population des résultats obtenus sur l’échantillon.

L'enquête par sondage se fait sur une population. On sélectionne un certain nombre de personnes à partir d'une population que l’on souhaite étudier. Dès lors on sélectionne en fonction d’un certain nombre de critères. Pour cela il faut pouvoir inférer les résultats.

Avantages Désavantages
  • le coût du recueil des données diminue drastiquement.
  • la durée du recueil des données et du traitement des données est inférieure.
  • l’organisation de l’enquête est plus aisée.
  • la précision est l’approfondissement de l’enquête s’améliore.
  • on perd une certaine quantité d’informations : si on interview toutes les personnes qui constituent l’objet d’étude, on n’a pas de marge d’erreur possible.

La technique de l’échantillonnage n’a au fond que des avantages. Dans l‘échantillonnage on peut extraire des personnes qui permettent d’estimer la différence entre ce que l’on trouve dans l’échantillon et ce que l’on trouverait dans la population.

Principaux types d’échantillons

Principaux types d’échantillons.png

Les types d’échantillons découlent de la manière dont on extrait l’échantillon de la population. La manière de calculer et d’estimer la marge d’erreur s’applique seulement aux échantillons probabilistes.

Ce sont différents types d’extractions d’une « population mère » qui sont différentes ; la grande distinction est entre les échantillons probabilistes et non-probabilistes.

Échantillon probabiliste / aléatoires simple / systématique / stratifié

  • probabiliste

C’est un échantillon ou chaque unité est extraite avec un probabilité connue, on connait la probabilité que chaque individu de la population a d'être sélectionné. La probabilité est différente de 0.

Cela présent une avantage majeur puisqu’on peut calculer la marge d’erreur. Si on infère et généralise des résultats que l’on trouve dans l’échantillon d’une population, il y a une certaine marge d'erreur, avec l’échantillon probabiliste on peut calculer la marge d'erreur. Comme il est difficile de remplir tous les critères, on choisit parfois l’échantillonnage non-probabiliste.

  • aléatoire simple

Toutes les unités de la population ont la même probabilité d'être incluses dans l'échantillon. En d’autres termes, chaque personne à la même probabilité de tomber dans l’échantillon. À partir de la liste complète, on extrait par tirage au sort ; on s’appuie sur la loi des grands nombres et on peut démontrer statistiquement que si on extrait de manière aléatoire ces personnes seront représentatives de la population.

  • systématique

La liste est incomplète, on tire systématiquement tous les individus ; par exemple, sur une liste d’individus on tire tous les dix individus.

  • stratifié

The idea is the same as simple random sampling, but we first subdivide the population into different strata and then choose according to what we want to study (example: social classes). With simple samples within each stratum, the margin of error doing this is minimized in comparison to other ways of shooting in general, so the population is more homogenized.

However, one can make sampling errors or have a problem of non-response.

There are sources of coverage, sampling and non-response errors; however, we are lucky to be able to calculate one of the three if we did not perform a non-probability sampling: the parameter that we estimate in the population is the sum of the estimate plus the sampling error . The estimated parameter for the population includes a level of confidence on the basis of which the value can be estimated. For example, if we look at the number of smokers in the Swiss population and we find in a sample of 2000 people 30% of Swiss who smoke, we can say that 30% of the Swiss population is a smoker, but with a certain level of trust.

Going further, we can use the confidence interval, we can say that the 30% found in the sample are representative of the population according to a margin of error if we want to infer it in the population; we can not say that 30% of the Swiss population, but we can say that between 30 - 33 and 27% smoke; there is an interval in which we will find the true value of the population from the value observed in the population.

There is a notion related to the interval and a notion of confidence in this interval. If the average income of the population of Geneva is 5000.- we can say that in the population it will be between 4500 and 5500 with a probability of 95% that the parameter will be in this interval. From an estimate made in the sample, we will find the value in the population with a certain margin of error and a level of confidence.

Échantillons non-probabilistes

On ne connaît pas la probabilité de chaque individu de tomber dans l'échantillon donc on ne peut pas calculer la marge d'erreur.

  • par quota : même logique que pour la stratification, la différence est que dans les quotas on ne choisit pas les sujets de façon aléatoire.
  • dessin factoriel
  • « boule de neige »
  • sondage téléphonique
  • sondage de convenance

Sampling errors

Sampling error for an average

Erreur d’échantillonnage pour une moyenne.png

L'erreur d'échantillonnage dépend surtout de trois facteurs :

  1. N, Taille : plus l'échantillon est grand, plus la marge d'erreur est petite ; inversement proportionnel.
  2. S, Écart-type (tendance centrale en fonction de l’hétérogénéité) : dispersion du paramètre que l’on souhaite estimer ; plus il est élevé, plus la marge d'erreur est importante cependant ce n’est pas très important s’il y a beaucoup d'échantillons. On parle de variabilité des paramètres, en d’autres termes c’est un indicateur de l’homogénéité ou de l’hétérogénéité de l’échantillon. Ce qui est important est que la marge d’erreur dépend de manière proportionnelle de l’hétérogénéité de l’échantillon, mais surtout il dépend d’une manière inversement proportionnelle de la taille de l’échantillon, plus l’échantillon est grand plus la marge d’erreur est petite.
  3. Z, Niveau de confiance de l'estimation : c’est un intervalle de confiance, on ne peut pas savoir la vraie valeur, mais il est possible de s’en approcher. En d’autres termes c’est le degré de certitude qu'on accepte quand on fait une inférence. Ainsi cela représente l’intervalle de confiance, on peut montrer que pour un certain niveau de confiance, par exemple pour 95% la confiance est de 1,96, pour un seuil de confiance de 99%, z=2,58. Dans le cas d’un seuil de confiance de 95% cela signifie qu’on a 5% de se tromper.
  4. f, s’applique dans le cas de population très petite, c’est un facteur de correction entre la taille d'échantillon et la population, c’est la division de la taille de l’échantillon par rapport à la taille de la population. Si la fraction s’approche de zéro, le facteur est négligeable. De manière plus pratique, on peut dire que dans n’importe quel sondage l’échantillon est toujours beaucoup plus petit que la population alors que les échantillons dépassent rarement 10000 personnes ce qui fait qu’on peut généralement oublier ce facteur. D’autre part si la différence entre l’échantillon et la population est très petite alors on ne fait pas d’échantillonnage et on interroge tout le monde.

Dès lors, la marge d’erreur dépend :

  • de la taille de l’échantillon.
  • du degré d’hétérogénéité du paramètre.
  • du niveau de confiance que nous sommes disposés à concéder dans l’inférence statistique.

Sampling error for a proportion

Erreur d’échantillonnage pour une proportion.png

P and Q are proportions in the parameter sample we want to explain.

Basically, in order to calculate the margin of error, particular account must be taken of the sample size. This is something that may seem surprising, since the size of the "mother population" does not appear in the calculation of the sampling error formula. In other words, a sample of 1000 persons out of a population of 50,000 gives rise to the same margin of error as a sample of 1,000 persons out of a population of 350 million inhabitants. The sample size gives the same margin of error if a sample is taken for the Whitewater or Australian population.

Example

n x S
1000 1253000 311000
100 1250000 308000

Il y a deux échantillons, un de 100 et un 1000 et on veut estimer le revenu moyen. Admettons que tout le monde réponde ; on va essayer de calculer l’erreur d’échantillonnage.

Dans le premier échantillon :

  • n : 1000
  • x : 1253000
  • S: 311000
  • e : 1,96 pour 5% (seuil standard en sciences sociales)
Exemple - echantillon formule 1.png

18700 est l’erreur d’échantillonnage calculée pour un échantillon de 1000 personnes tirées sur une population de 10000 personnes. C’est une marge d’erreur pour un estimateur de la moyenne avec une variabilité qui est calculable et on va trouver une marge d’erreur de 18700.

On interprète 18700 en « plus ou moins » () ; si dans l’échantillon on a trouvé que le revenu moyen est de 1253000, dans la population on peut être sûr de se tromper à 5% si on dit que dans la population le revenu moyen est de 1253000 18700 soit

Plus on veut de sécurité dans l’inférence, plus l’intervalle devient grand.

Dans le second échantillon :

  • n : 100
  • x: 1250000
  • S: 308000
  • e : 1,96 pour 5% (seuil standard en sciences sociales)
Exemple - echantillon formule 2.png

Nota bene : lorsque les proportions sont différentes, la marge d’erreur est plus petite.

Le tableau suivant montre la taille de l’échantillon pour un échantillon aléatoire simple qui est nécessaire pour une certaine précision de la mesure. Plus l’intervalle de confiance est étroit, plus on a une mesure précise, mais il faut à nouveau tenir compte du niveau de confiance.

Si on veut une précision de l’estimateur de 5%, pour une population de 1000 personnes on a besoin d’une population de 285 personnes, etc.

Source: Corbetta, P. (2003). Social Research. Thousand Oaks, CA: Sage.

On voit entre autres que pour une population de 50000 personnes ou plus nécessite une population de 2500 personnes afin d’avoir une estimation précise.

Lorsqu’on a la possibilité de faire un échantillon probabiliste, on a la chance de pouvoir calculer la marge d’erreur et de pouvoir estimer quelle est cette erreur, chose qu’on ne peut faire avec l’erreur de couverture.

Toutefois il y a un problème. Parfois voire même souvent ce n’est pas possible d’avoir un échantillon probabiliste. Souvent l’échantillonnage aléatoire simple n’est pas applicable, car on ne dispose pas de la liste complète des personnes.

Dans ces cas on ne peut procéder à ces types de calculs, alors on procède à d’autres types d’échantillons :

  • échantillon systématique

On prend une personne à des intervalles réguliers et on peut démontrer que cela se rapproche d’un échantillon probabilité soit d’un échantillon aléatoire. Un exemple est les « exits polls », on rencontre les individus qui sortent des urnes en interviewant toutes les 20 personnes. Un échantillon systématique a la même propriété qu’un échantillon probabiliste, car chaque personne a la même probabilité de rentrer dans l’échantillon.

  • échantillon starifié

On a subdivisé la population préalablement pour une raison précise parce qu’on veut diminuer l’hétérogénéité de la population, plus c’est hétérogène plus la marge d’erreur est diminuée. Dans l’échantillon stratifié on prend une variable qui nous intéresse dont les proportions sont dans la population sont connues et on tire des échantillons aléatoires à l’intérieur de chaque catégorie selon ces variables. On a un écart type plus faible et une marge d’erreur plus petite, combinée à un échantillon on démontre que la marge d’erreur globale est inférieure que lorsqu’on tire des individus indifféremment.

  • échantillons non-probabilistes

Il y a des erreurs de non-réponses et des erreurs de couvertures de la population. De plus en plus de chercheurs faisant des sondages disent que les autres sources d’erreurs sont aussi déterminantes. Il n’est pas vraiment nécessaire de faire ces calculs, mais il faut plutôt aller vers des échantillons non-probabilistes.

Selon Corbetta, un échantillon non-probabiliste est un échantillon qui ne se base pas sur le nombre d’individus ; le plus connu est l’échantillon par quota : à l’intérieur de chaque strate, on choisit un certain nombre de personnes qui vont composer l’échantillon. Si on sait que dans la population que l’on veut étudier il y a 60% de femmes et 40% d’homme, on va faire en sorte qu’il y ait la même proportion dans l’échantillon. On va choisir selon les critères que l’on veut, mais en respectant le quota soit la proportion dans l’échantillon.

Cet échantillon devient de plus en plus fréquent, car il est moins cher et moins laborieux, mais a le désavantage de ne pas pouvoir calculer la marge d’erreur.

Qualitative techniques

We are within the framework of the interpretative paradigm:

  • there is no clear conceptual and terminological distinction.
  • there is no clear distinction in terms of application, we combine.
  • the research path does not follow separate and distinct phases.

Types of Qualitative Research

These are the three main activities that can be done as part of the research. From each of them results a method that allows us to interpret a social reality.

Types de recherche qualitative.png

Participant Observation

It is a much less widely used method in political science, but it is an original method used, in other words, it is a special case of direct observation; it is an observation with the participation of the investigator. From an epistemological point of view, it corresponds well to the interpretative paradigm whereby the researcher is part of his or her own investigation.

Définition

Selon Corbetta, l’observation participante est la compréhension par la participation de l’intérieur au phénomène étudié : c’est une stratégie de recherche dans lequel le chercheur s’insère de façon directe et pour une période de temps relativement long dans un groupe social donné pris dans son environnement naturel en instaurant un rapport d’interactions personnelles avec les membres de ce groupe ayant pour but de décrire les actions et de les comprendre moyennant un processus d’identification afin de comprendre leurs motivations.

  • observation par le chercheur : /
  • période assez longue : il ne suffit pas d’observer une seule fois.
  • habitat naturel du groupe : il faut aller observer le groupe dans son habitat naturel.
  • interaction entre chercheur et objet d’étude : cela caractérise les méthodes du paradigme interprétatif c’est pourquoi on participe au phénomène étudié.
  • but de décrire et comprendre : on essaie de se mettre à la place de l’autre, c’est une forme d’empathie.

Dans l’observation participante, on recherche une implication du chercheur, le but final est de décrire et de comprendre.

Un exemple très connu est un livre écrit par Goffman qui avait étudié les asiles psychiatriques en Écosses pendant qu’il était infirmier. À partir des observations participantes, il en a déduit que les asiles psychiatriques sont des institutions totales et totalisantes.

Objets de l’observation participante

  • contexte physique : contexte du groupe, des individus observés.
  • contexte social : phénomène et des dynamiques observe.
  • interactions formelles : constitue l’objet principal de cette méthode.
  • interactions informelles : /
  • interprétations des acteurs sociaux : on observe les interprétations que les acteurs donnent eux-mêmes de leur participation.

Quand doit-on enregistrer les observations quand fait-on des observations participantes ?

L’enregistrement d’observations doit être fait le plus près de l’environnement possible, le but de la participation est d’être dans l’évènement que l’on étudie, on observe le plus proche et le concret possible.

Il est très important d’avoir un journal dans lequel on note les différentes observations que l’on fait :

  • on décrit le « fait » qu’on observe.
  • on note l’interprétation que fait le chercher.
  • on note l’interprétation que les sujets eux-mêmes font, l’objectif est de confronter les interprétations.
  • il faut appliquer un principe de fidélité par un enregistrement précis et filtré de sa propre subjectivité.
  • il faut distinguer les faits de l’interprétation.

A participant observation was made on social movements and in particular the alterglobalization movement; it was a comparative research that looked at how controversies arise when a group has to discuss certain issues.

The purpose of the study is to examine whether what organizations are putting in place, i. e. a participatory process that is based on consensus rather than a majority vote or autonomous decisions, in order to account for representative democracy.

Traditionally the journal is used in sociology and anthropology is made up of personal notes.

In the case of these organizations, observations were systematized by creating a protocol based on variables and each variable is supposed to measure a specific aspect of these debates when there were issues ranging from organizing the next event to the strategic and ideological direction to be taken.

The researcher had to gather basic information such as the duration of interactions, controversial discussions, but also the number of people who were present and how many participated, and the degree of reciprocity of the discussion to know when participants refer to what others said when they made proposals, there were also hard power aspects, i. e. the use of one's position to influence the discussion, etc. The researcher was also asked to collect basic information on how many people were present and how many participated.

In conclusion, we can very well study qualitative matters quantitatively. The most difficult part is not collecting information, but analyzing it.

Qualitative interview

This method is much more used than participant observation; the objective is to try to gain access to the perspective of the subject under study.

Définition

Selon Corbetta, il s’agit d’une conversation provoquée par l’interviewer apprécié par des sujets choisis sur la base d‘un plan d’observations qui sont un nombre consistant ayant comme finalité la connaissance guidé par l’observateur.

  • conversation provoquée par l’interviewer : une personne conduit l’entretien.
  • sujets choisis selon un plan systématique d’observation : on interroge les individus sur la base de la manière de mener la rechercher fait préalablement.
  • nombre assez consistant d’objets : la question est de savoir dans quel mesure on a besoin de faire X entretiens plutôt que Y.
  • objectif de connaissance : objectif même de la science.
  • conversation guidée par l’interviewer : l’interviewer guide l’interaction.
  • schéma flexible et non-standardisé d’interrogation : permet de moduler l’interview.

L’entretien qualitatif se différencie d’un entretien qualitatif par :

  • l’absence de standardisation.
  • optique de la compréhension par rapport à une logique de document, on est dans le contexte de découverte plutôt que celui de la justification qui a pour objectif de justifier l’hypothèse.
  • absence d’un échantillon représentatif : on veut singulariser.
  • on est dans une approche centrée sur les sujets plutôt que sur les variables.

On peut faire une subdivision supplémentaire, car il y a différentes manières de mener une interview qualitative, on distingue :

  • entretien structuré

On pose les mêmes questions à toutes les personnes interviewées dans la même formulation et dans la même séquence. Les personnes interviewées ont la liberté complète de réponse, c’est un entretien fait par des questions ouvertes, il y a un souci de comparabilité derrière ce type d’enquêtes.

C’est un type d’interview qui n’est pas très répandu, car on peut standardiser un minimum, mais pas suffisamment.

  • entretien semi-structuré

L’interviewer n’a qu’une trace de ce qu’il veut toucher et des arguments qu’il veut aborder, mais on peut poser ces arguments dans des ordres différents, on n’est plus dans le contexte de l’interaction. Cette trace peut varier dans la décision et le détail, l’idée est qu’on ne pose pas la même question à tout le monde, mais on ajuste les arguments.

  • entretien non-structuré

Ni la forme ni le contenu des questions est préétablie, cette forme et ce contenu peut varier d’un sujet à l’autre donc il y a une individualité des arguments et un itinéraire variable de l’entretien,on a seulement un itinéraire, tout le reste est ouvert.

  • méthode des « histoires de vie »

Narration de la vie de l’individu, c’est un cas extrême.

  • entretien non-directif

La finalité est différente que celle de la recherche scientifique, il peut y avoir des entretiens thérapeutiques ou cliniques.

  • entretiens faits par des observateurs privilégiés / key informers

On fait des entretiens, mais les personnes interviewées ne sont pas l’objet de la recherche, on interroge ces personnes parce qu’elles sont bien informées sur un certain phénomène.

  • entretien de groupe / collectif

On interview plusieurs personnes en même temps, ce sont des « focus groups » à savoir des groupes focalisés c’est-à-dire qu’il y a un aspect lié à l’interaction entre les personnes interviewées qui devient crucial.

Conduct of the interview: Suggestions for "good practice"

  • Preliminary explanations: explain why we are here, what is the purpose of the research, put the individual in context.
  • primary questions: these are questions that introduce new topics into an interview, usually these are the questions that are put in his interview guide.
  • secondary questions: allow to deepen or articulate the primary question.
  • questions of stimulus: all the ability of the investigator is to master them.
    • repetition of the question: repeat the question.
    • repetition of the answer or a synthesis of the last answers: repeat the answer given by the interviewee or do some sort of synthesis of what the respondent said.
    • encouragement, expression of interest: we must see the person remembering something.
    • pause: time delay.
    • request for further information: obtain additional or more precise details.
  • language: care must be taken to ensure that one's language is correct, and care must be taken not to misuse or abuse sectoral or subculture-specific language.
  • interviewer's role: the role is crucial when it involves a qualitative interview, much more so than in the case of a sample survey, where you can pay someone who carries out the interview. It is difficult to send someone else to conduct the interview because they were not involved in the research development process.

The strength and weakness of this method is the absence of standardization, which makes it possible to go into certain subjects in greater depth, but at the same time it makes it more difficult to compare and compare the responses of the interviewees.

With regard to the analysis of data based on qualitative interviews, it should be noted that:

  • Data analysis is focused primarily on cases and not on variables, with exceptions through standardized protocols for participating observations.
  • The presentation of the results is based on a narrative perspective, episodes are told, cases are described, often through the words of interviewees, extracts can be taken and used for analysis.
  • we proceed through classifications, typologies as part of a technical approach, we aim to bring out profiles.

Reading - Documents

This is the kind of affinity that one makes when one enters into a qualitative approach.

Definition

According to Corbetta, a document is an informative material on a given social phenomenon that exists independently of the researcher's action.

  • informative material.
  • on a given social phenomenon.
  • exists independently of the researcher's action.

Types of documents

A distinction is made between primary data constructed by the researcher from secondary data that are the existing data.

  • Personal documents:
    • autobiographies
    • diaries
    • letters
    • oral testimonies
  • Institutional documents: in political science, it is mainly these documents that interest us.
    • mass media: a privileged source of information for political scientists.
    • narration, pedagogical texts, narratives of popular culture: rather sociological approach.
    • court material
    • policy documents
    • business and administrative documents
    • physical traces

Annexes

References