Graphiques

De Baripedia
La version imprimable n’est plus prise en charge et peut comporter des erreurs de génération. Veuillez mettre à jour les signets de votre navigateur et utiliser à la place la fonction d’impression par défaut de celui-ci.


Généralités

Un graphique statistique doit représenter le plus fidèlement possible la distribution d’une variable. Principe de proportionnalité : chaque modalité est représentée par une surface proportionnelle à la fréquence (relative) de cette modalité (si on augmente la taille, il faut prendre garde à mettre en rapport la proportionnalité). Pour qu’un graphique soit de bonne qualité, les points suivants doivent être considérées :

-       Clarté

-       Précision

-       Bien documenté (titre, légende)

-       Respect du principe de proportionnalité

Principaux types de graphiques

Graphiques pour données catégorielles :

  • Graphique en barres
  • Graphique circulaire

Graphiques pour données numériques :

  • Histogramme
  • Diagramme en ligne (pour série temporelle)
  • Box-plot (basé sur des résumés numérisés)

Graphiques pour la relation entre deux variables :

  • Carré unitaire (variables catégorielles)
  • Diagramme de dispersion (variables numériques)

Graphique en barres

Chaque modalité est représentée par une barre dont la hauteur est proportionnelle à la fréquence (relative) de la modalité. Chaque barre a la même largeur et est souvent séparée des autres barres par un espace. Dans le cas d’une variable ordinale, les modalités doivent être placés dans l’ordre sur le graphique. C’est le graphique à tout faire de la statistique. Il peut s’adapter pratiquement à n’importe quelle variable (salaire médian, taux de chômage, violence domestique…)

Graphique circulaire

Un cercle ou un demi-cercle est découpé en autant de secteurs qu’il y a de modalités à représenter. La surface de chaque secteur est proportionnelle à la fréquence (relative) de la modalité qu’il représente. Ce type de graphique est particulièrement adapté à la représentation de distributions de pourcentages (répartition des travailleurs étrangers en Suisse…).

Histogramme

L’histogramme est le graphique type pour les variables numériques. Les modalités de la variable sont au préalable réparties en nombre fini de classes. Il n’y pas d’écart entre les classes : la valeur finale d’une classe est la même que la valeur initiale de la classe suivant. La classe à laquelle appartiennent réellement ces valeurs limites est choisie arbitrairement. Les différentes classes sont placés sur l’axe horizontal du graphique et un rectangle dont la surface est proportionnelle à la fréquence (relative) de la classe est construit au-dessus de chaque classe.

Classes de l’histogramme

De manière générale, le nombre de classe ne devrait pas être plus grand que () où n est le nombre d’observations. Il y a 2 grandes principes pour déterminer les classes :

  • On divise l’étendue des données par le nombre de classe désiré.
  • Toutes les classes ont la même fréquence
  • Toutes les classers ont la même apmplitude (largeur)
  • On ajuste les limites des classes pour que le nombre d’observations soit assez similaire d’une classe à l’autre.
  • Un histogramme s’interprète en termes de surfaces et non de hauteurs !

Diagramme en ligne

Le diagramme en ligne permet de représenter l’évolution au fil du temps d’une variable numérique. La référence temporelle est placée sur un axe (généralement l’axe horizontal) et les valeurs observées sont placées sur l’autre axe. Les points représentants chaque observation sont reliés de manière à mettre en évidence l’évolution dans le temps.