Introducció

Els diagrames de caixa i bigots, també coneguts com a box plots, són eines gràfiques utilitzades per representar la distribució d'un conjunt de dades. Aquests diagrames permeten visualitzar la mediana, els quartils i els valors atípics, proporcionant una visió clara de la dispersió i la simetria de les dades.

Conceptes Clau

  1. Mediana: El valor central que divideix el conjunt de dades en dues meitats iguals.
  2. Quartils:
    • Q1 (Primer Quartil): El valor que separa el 25% inferior de les dades.
    • Q2 (Segon Quartil): La mediana, que separa el 50% de les dades.
    • Q3 (Tercer Quartil): El valor que separa el 25% superior de les dades.
  3. Rang Interquartílic (IQR): La diferència entre el tercer i el primer quartil (Q3 - Q1).
  4. Bigots: Les línies que s'estenen des dels quartils fins als valors màxims i mínims dins d'1.5 vegades l'IQR.
  5. Valors Atípics: Dades que es troben fora del rang dels bigots.

Estructura d'un Diagrama de Caixa i Bigots

Un diagrama de caixa i bigots es compon de les següents parts:

  • Caixa: Representa el rang interquartílic (IQR) i conté el 50% central de les dades.
  • Línia dins de la caixa: Indica la mediana del conjunt de dades.
  • Bigots: S'estenen des dels límits de la caixa fins als valors màxims i mínims dins d'1.5 vegades l'IQR.
  • Punts fora dels bigots: Representen els valors atípics.

Exemple Pràctic amb Python

A continuació, es mostra un exemple de com crear un diagrama de caixa i bigots utilitzant Python amb la biblioteca Matplotlib.

import matplotlib.pyplot as plt
import numpy as np

# Generar dades aleatòries
np.random.seed(10)
data = np.random.normal(100, 20, 200)

# Crear el diagrama de caixa i bigots
plt.boxplot(data)

# Afegir títol i etiquetes
plt.title('Diagrama de Caixa i Bigots')
plt.ylabel('Valors')

# Mostrar el gràfic
plt.show()

Explicació del Codi

  1. Importar Biblioteques: Importem matplotlib.pyplot per crear el gràfic i numpy per generar dades aleatòries.
  2. Generar Dades: Utilitzem np.random.normal per generar un conjunt de dades amb una distribució normal.
  3. Crear el Diagrama: Utilitzem plt.boxplot per crear el diagrama de caixa i bigots.
  4. Afegir Títol i Etiquetes: Utilitzem plt.title i plt.ylabel per afegir un títol i etiquetes al gràfic.
  5. Mostrar el Gràfic: Utilitzem plt.show per mostrar el gràfic.

Exercici Pràctic

Exercici

Genera un diagrama de caixa i bigots per un conjunt de dades que representi les temperatures diàries d'una ciutat durant un mes. Utilitza Python i Matplotlib per crear el gràfic.

Solució

import matplotlib.pyplot as plt
import numpy as np

# Generar dades de temperatures diàries
np.random.seed(42)
temperatures = np.random.normal(20, 5, 30)  # 30 dies de temperatures

# Crear el diagrama de caixa i bigots
plt.boxplot(temperatures)

# Afegir títol i etiquetes
plt.title('Diagrama de Caixa i Bigots de Temperatures Diàries')
plt.ylabel('Temperatura (°C)')

# Mostrar el gràfic
plt.show()

Explicació de la Solució

  1. Generar Dades: Utilitzem np.random.normal per generar un conjunt de dades que representen les temperatures diàries durant un mes.
  2. Crear el Diagrama: Utilitzem plt.boxplot per crear el diagrama de caixa i bigots.
  3. Afegir Títol i Etiquetes: Afegim un títol i etiquetes per clarificar el contingut del gràfic.
  4. Mostrar el Gràfic: Utilitzem plt.show per mostrar el gràfic.

Errors Comuns i Consells

  • No Normalitzar les Dades: Assegura't que les dades estiguin en la mateixa escala abans de crear el diagrama.
  • Interpretació Incorrecta dels Bigots: Recorda que els bigots no representen els valors màxims i mínims absoluts, sinó els valors dins d'1.5 vegades l'IQR.
  • No Identificar Valors Atípics: Els punts fora dels bigots són valors atípics i poden proporcionar informació valuosa sobre el conjunt de dades.

Conclusió

Els diagrames de caixa i bigots són eines poderoses per visualitzar la distribució d'un conjunt de dades. Proporcionen informació clara sobre la mediana, els quartils i els valors atípics, facilitant la interpretació i l'anàlisi de les dades. En el següent tema, explorarem els gràfics de bombolla, una altra tècnica útil per representar dades multidimensionals.

© Copyright 2024. Tots els drets reservats