Introducció
Els diagrames de caixa i bigots, també coneguts com a box plots, són eines gràfiques utilitzades per representar la distribució d'un conjunt de dades. Aquests diagrames permeten visualitzar la mediana, els quartils i els valors atípics, proporcionant una visió clara de la dispersió i la simetria de les dades.
Conceptes Clau
- Mediana: El valor central que divideix el conjunt de dades en dues meitats iguals.
- Quartils:
- Q1 (Primer Quartil): El valor que separa el 25% inferior de les dades.
- Q2 (Segon Quartil): La mediana, que separa el 50% de les dades.
- Q3 (Tercer Quartil): El valor que separa el 25% superior de les dades.
- Rang Interquartílic (IQR): La diferència entre el tercer i el primer quartil (Q3 - Q1).
- Bigots: Les línies que s'estenen des dels quartils fins als valors màxims i mínims dins d'1.5 vegades l'IQR.
- Valors Atípics: Dades que es troben fora del rang dels bigots.
Estructura d'un Diagrama de Caixa i Bigots
Un diagrama de caixa i bigots es compon de les següents parts:
- Caixa: Representa el rang interquartílic (IQR) i conté el 50% central de les dades.
- Línia dins de la caixa: Indica la mediana del conjunt de dades.
- Bigots: S'estenen des dels límits de la caixa fins als valors màxims i mínims dins d'1.5 vegades l'IQR.
- Punts fora dels bigots: Representen els valors atípics.
Exemple Pràctic amb Python
A continuació, es mostra un exemple de com crear un diagrama de caixa i bigots utilitzant Python amb la biblioteca Matplotlib.
import matplotlib.pyplot as plt import numpy as np # Generar dades aleatòries np.random.seed(10) data = np.random.normal(100, 20, 200) # Crear el diagrama de caixa i bigots plt.boxplot(data) # Afegir títol i etiquetes plt.title('Diagrama de Caixa i Bigots') plt.ylabel('Valors') # Mostrar el gràfic plt.show()
Explicació del Codi
- Importar Biblioteques: Importem
matplotlib.pyplot
per crear el gràfic inumpy
per generar dades aleatòries. - Generar Dades: Utilitzem
np.random.normal
per generar un conjunt de dades amb una distribució normal. - Crear el Diagrama: Utilitzem
plt.boxplot
per crear el diagrama de caixa i bigots. - Afegir Títol i Etiquetes: Utilitzem
plt.title
iplt.ylabel
per afegir un títol i etiquetes al gràfic. - Mostrar el Gràfic: Utilitzem
plt.show
per mostrar el gràfic.
Exercici Pràctic
Exercici
Genera un diagrama de caixa i bigots per un conjunt de dades que representi les temperatures diàries d'una ciutat durant un mes. Utilitza Python i Matplotlib per crear el gràfic.
Solució
import matplotlib.pyplot as plt import numpy as np # Generar dades de temperatures diàries np.random.seed(42) temperatures = np.random.normal(20, 5, 30) # 30 dies de temperatures # Crear el diagrama de caixa i bigots plt.boxplot(temperatures) # Afegir títol i etiquetes plt.title('Diagrama de Caixa i Bigots de Temperatures Diàries') plt.ylabel('Temperatura (°C)') # Mostrar el gràfic plt.show()
Explicació de la Solució
- Generar Dades: Utilitzem
np.random.normal
per generar un conjunt de dades que representen les temperatures diàries durant un mes. - Crear el Diagrama: Utilitzem
plt.boxplot
per crear el diagrama de caixa i bigots. - Afegir Títol i Etiquetes: Afegim un títol i etiquetes per clarificar el contingut del gràfic.
- Mostrar el Gràfic: Utilitzem
plt.show
per mostrar el gràfic.
Errors Comuns i Consells
- No Normalitzar les Dades: Assegura't que les dades estiguin en la mateixa escala abans de crear el diagrama.
- Interpretació Incorrecta dels Bigots: Recorda que els bigots no representen els valors màxims i mínims absoluts, sinó els valors dins d'1.5 vegades l'IQR.
- No Identificar Valors Atípics: Els punts fora dels bigots són valors atípics i poden proporcionar informació valuosa sobre el conjunt de dades.
Conclusió
Els diagrames de caixa i bigots són eines poderoses per visualitzar la distribució d'un conjunt de dades. Proporcionen informació clara sobre la mediana, els quartils i els valors atípics, facilitant la interpretació i l'anàlisi de les dades. En el següent tema, explorarem els gràfics de bombolla, una altra tècnica útil per representar dades multidimensionals.
Visualització de Dades
Mòdul 1: Introducció a la Visualització de Dades
- Conceptes Bàsics de Visualització de Dades
- Importància de la Visualització de Dades
- Tipus de Dades i Gràfics
Mòdul 2: Eines de Visualització de Dades
- Introducció a Eines de Visualització
- Ús de Microsoft Excel per a Visualització
- Introducció a Tableau
- Ús de Power BI
- Visualització amb Python: Matplotlib i Seaborn
- Visualització amb R: ggplot2
Mòdul 3: Tècniques de Visualització de Dades
- Gràfics de Barres i Columnes
- Gràfics de Línies
- Gràfics de Dispersió
- Gràfics de Pastís
- Mapes de Calor
- Gràfics d'Àrea
- Diagrames de Caixa i Bigots
- Gràfics de Bombolla
Mòdul 4: Principis de Disseny en Visualització de Dades
- Principis de Percepció Visual
- Ús del Color en Visualització
- Disseny de Gràfics Efectius
- Evitar Errors Comuns en Visualització
Mòdul 5: Casos Pràctics i Projectes
- Anàlisi de Dades de Vendes
- Visualització de Dades de Màrqueting
- Projectes de Visualització de Dades en Salut
- Visualització de Dades Financeres