Comment faire un boxplot

01 de 06

introduction

Boxplots tirent leur nom de ce à quoi ils ressemblent. Ils sont parfois appelés des parcelles à boîte et à moustaches. Ces types de graphiques sont utilisés pour afficher la plage, la médiane et les quartiles. Quand ils sont complétés, une boîte contient les premier et troisième quartiles . Les Whiskers s'étendent de la boîte aux valeurs minimum et maximum des données.

Les pages suivantes montreront comment faire un boxplot pour un ensemble de données avec un minimum de 20, un premier quartile 25, un médian 32, un troisième quartile 35 et un maximum de 43.

02 de 06

Ligne de nombre

CKTaylor

Commencez par une ligne numérique qui correspondra à vos données. Assurez-vous d'étiqueter votre numéro avec les numéros appropriés afin que les autres personnes qui le regardent sachent quelle échelle vous utilisez.

03 de 06

Médiane, quartiles, maximum et minimum

CKTaylor

Dessinez cinq lignes verticales au-dessus de la droite numérique, une pour chacune des valeurs du minimum, du premier quartile , de la médiane, du troisième quartile et du maximum. Généralement, les lignes pour le minimum et le maximum sont plus courtes que les lignes pour les quartiles et la médiane.

Pour nos données, le minimum est de 20, le premier quartile est de 25, la médiane est de 32, le troisième quartile est de 35 et le maximum de 43. Les lignes correspondant à ces valeurs sont dessinées ci-dessus.

04 de 06

Dessiner une boîte

CKTaylor

Ensuite, nous dessinons une boîte et utilisons certaines des lignes pour nous guider. Le premier quartile est le côté gauche de notre boîte. Le troisième quartile est le côté droit de notre boîte. La médiane tombe n'importe où à l'intérieur de la boîte.

Par la définition des premier et troisième quartiles, la moitié de toutes les valeurs de données sont contenues dans la boîte.

05 de 06

Dessinez deux moustaches

CKTaylor

Maintenant, nous voyons comment un graphique de boîte et de moustaches obtient la deuxième partie de son nom. Les moustaches sont dessinés pour démontrer l'étendue des données. Tracez une ligne horizontale à partir de la ligne pour le minimum au côté gauche de la boîte au premier quartile. Ceci est l'un de nos moustaches. Dessinez une deuxième ligne horizontale du côté droits de la boîte au troisième quartile à la ligne représentant le maximum des données. Ceci est notre deuxième moustache.

Notre graphique à boîte et à moustaches, ou boîte à moustaches, est maintenant terminé. En un coup d'œil, nous pouvons déterminer l'étendue des valeurs des données et le degré de regroupement de toutes les données. L'étape suivante montre comment nous pouvons comparer et contraster deux boîtes à moustaches.

06 de 06

Comparaison des données

CKTaylor

Les graphiques en boîte et en moustaches affichent le résumé en cinq chiffres d'un ensemble de données. Deux ensembles de données différents peuvent ainsi être comparés en examinant ensemble leurs boîtes à moustaches. Au-dessus d'un deuxième boxplot a été dessiné au-dessus de celui que nous avons construit.

Il y a quelques caractéristiques qui méritent d'être mentionnées. La première est que les médianes des deux ensembles de données sont identiques. La ligne verticale à l'intérieur des deux boîtes est au même endroit sur la ligne numérique. La deuxième chose à noter à propos des graphiques à deux boîtes et moustaches est que le graphique du haut n'est pas aussi répandu dans le graphique du bas. La boîte supérieure est plus petite et les moustaches ne s'étendent pas aussi loin.

Dessiner deux boxplots au-dessus de la même ligne numérique suppose que les données qui se cachent derrière chacune d'elles méritent d'être comparées. Il ne serait pas logique de comparer un boxplot de hauteurs de troisième année avec des poids de chiens dans un refuge local. Bien que les deux contiennent des données au niveau de mesure du ratio, il n'y a aucune raison de comparer les données.

D'autre part, il serait logique de comparer les boîtes à moustaches des élèves de troisième année si une parcelle représentait les données des garçons dans une école, et l'autre parcelle représentait les données des filles de l'école.