Image par auteur | À mi-parcours et Canva
Le site sœur de KDnuggets, Statology, propose une vaste collection de contenus sur les statistiques, rédigés par des experts. En quelques années seulement, ce site est devenu une ressource incontournable pour les passionnés de statistiques, mathématiques, science des données et programmation. Nous souhaitons faire découvrir cette ressource précieuse à nos lecteurs en partageant certains de ses excellents didacticiels avec la communauté KDnuggets.
L’apprentissage des statistiques peut être difficile, frustrant et souvent déroutant. C’est pourquoi Statology est là pour vous aider.
Cette collection de didacticiels se concentre sur la visualisation des données. Aucune analyse statistique n’est complète sans une bonne visualisation des données. Divers outils permettent de mieux comprendre nos données grâce à la visualisation, et ces didacticiels vous guideront dans leur utilisation. Apprenez ces techniques et explorez les archives de Statology pour découvrir d’autres trésors.
Boîtes à moustaches
Un boxplot, ou diagramme en boîte et moustaches, montre le résumé en cinq nombres d’un ensemble de données :
- Le minimum
- Le premier quartile
- La médiane
- Le troisième quartile
- Le maximum
Un boxplot permet de visualiser facilement la distribution des valeurs dans un ensemble de données.
Parcelles à tiges et feuilles : définition et exemples
Un diagramme à tiges et à feuilles affiche les données en divisant chaque valeur en une « tige » et une « feuille ». Ce didacticiel explique comment créer et interpréter ces tracés.
Nuages de points
Les nuages de points montrent la relation entre deux variables. Par exemple, considérons un ensemble de données affichant le poids et la taille des joueurs d’une équipe de basket-ball :
Pour créer un nuage de points, placez la hauteur sur l’axe des x et le poids sur l’axe des y. Chaque joueur est représenté par un point :
Les nuages de points aident à visualiser les relations entre deux variables. Ici, on voit une relation positive entre la taille et le poids : à mesure que la taille augmente, le poids tend également à augmenter.
Histogramme de fréquence relative : définition + exemple
Les tableaux de fréquence montrent combien de fois un certain événement s’est produit. Par exemple, le tableau suivant indique le nombre d’articles vendus par un magasin en une semaine, en fonction du prix :
Ce type de tableau est appelé tableau de fréquence. Une colonne montre la « classe » et l’autre la fréquence. Les histogrammes de fréquence sont souvent utilisés pour visualiser ces valeurs, facilitant ainsi la compréhension des données.
Que sont les courbes de densité ? (Explication et exemples)
Une courbe de densité représente la distribution des valeurs dans un ensemble de données. Elle est utile pour :
- Comprendre la « forme » d’une distribution, notamment ses pics et son asymétrie.
- Voir visuellement où se situent la moyenne et la médiane.
- Visualiser le pourcentage d’observations entre différentes valeurs.
Pour plus de contenu comme celui-ci, continuez à consulter Statology et abonnez-vous à leur newsletter hebdomadaire pour ne rien manquer.
Matthew Mayo (@mattmayo13) est titulaire d’une maîtrise en informatique et d’un diplôme d’études supérieures en exploration de données. En tant que rédacteur en chef de KDnuggets & Statology et rédacteur collaborateur à Maîtrise de l’apprentissage automatique, Matthew vise à rendre accessibles les concepts complexes de la science des données. Ses intérêts professionnels incluent le traitement du langage naturel, les modèles de langage, les algorithmes d’apprentissage automatique et l’exploration de l’IA émergente. Il est animé par la mission de démocratiser les connaissances dans la communauté de la science des données. Matthew code depuis l’âge de 6 ans.