Graphiques

De Baripedia
Révision datée du 5 mai 2020 à 14:43 par Blob (discussion | contributions)
(diff) ◂ Version précédente | Voir la version actuelle (diff) | Version suivante ▸ (diff)


Généralités[modifier | modifier le wikicode]

Un graphique statistique doit représenter le plus fidèlement possible la distribution d’une variable. Principe de proportionnalité : chaque modalité est représentée par une surface proportionnelle à la fréquence (relative) de cette modalité (si on augmente la taille, il faut prendre garde à mettre en rapport la proportionnalité). Pour qu’un graphique soit de bonne qualité, les points suivants doivent être considérées :

-       Clarté

-       Précision

-       Bien documenté (titre, légende)

-       Respect du principe de proportionnalité

Principaux types de graphiques[modifier | modifier le wikicode]

Graphiques pour données catégorielles :

  • Graphique en barres
  • Graphique circulaire

Graphiques pour données numériques :

  • Histogramme
  • Diagramme en ligne (pour série temporelle)
  • Box-plot (basé sur des résumés numérisés)

Graphiques pour la relation entre deux variables :

  • Carré unitaire (variables catégorielles)
  • Diagramme de dispersion (variables numériques)

Graphique en barres[modifier | modifier le wikicode]

Chaque modalité est représentée par une barre dont la hauteur est proportionnelle à la fréquence (relative) de la modalité. Chaque barre a la même largeur et est souvent séparée des autres barres par un espace. Dans le cas d’une variable ordinale, les modalités doivent être placés dans l’ordre sur le graphique. C’est le graphique à tout faire de la statistique. Il peut s’adapter pratiquement à n’importe quelle variable (salaire médian, taux de chômage, violence domestique…)

Graphique circulaire[modifier | modifier le wikicode]

Un cercle ou un demi-cercle est découpé en autant de secteurs qu’il y a de modalités à représenter. La surface de chaque secteur est proportionnelle à la fréquence (relative) de la modalité qu’il représente. Ce type de graphique est particulièrement adapté à la représentation de distributions de pourcentages (répartition des travailleurs étrangers en Suisse…).

Histogramme[modifier | modifier le wikicode]

L’histogramme est le graphique type pour les variables numériques. Les modalités de la variable sont au préalable réparties en nombre fini de classes. Il n’y pas d’écart entre les classes : la valeur finale d’une classe est la même que la valeur initiale de la classe suivant. La classe à laquelle appartiennent réellement ces valeurs limites est choisie arbitrairement. Les différentes classes sont placés sur l’axe horizontal du graphique et un rectangle dont la surface est proportionnelle à la fréquence (relative) de la classe est construit au-dessus de chaque classe.

Classes de l’histogramme[modifier | modifier le wikicode]

De manière générale, le nombre de classe ne devrait pas être plus grand que () où n est le nombre d’observations. Il y a 2 grandes principes pour déterminer les classes :

  • On divise l’étendue des données par le nombre de classe désiré.
  • Toutes les classes ont la même fréquence
  • Toutes les classers ont la même apmplitude (largeur)
  • On ajuste les limites des classes pour que le nombre d’observations soit assez similaire d’une classe à l’autre.
  • Un histogramme s’interprète en termes de surfaces et non de hauteurs !

Diagramme en ligne[modifier | modifier le wikicode]

Le diagramme en ligne permet de représenter l’évolution au fil du temps d’une variable numérique. La référence temporelle est placée sur un axe (généralement l’axe horizontal) et les valeurs observées sont placées sur l’autre axe. Les points représentants chaque observation sont reliés de manière à mettre en évidence l’évolution dans le temps.