Introducció

Els gràfics de bombolla són una extensió dels gràfics de dispersió que permeten representar tres dimensions de dades en un sol gràfic. En lloc de només utilitzar els eixos X i Y per mostrar dades, els gràfics de bombolla utilitzen la mida de les bombolles per representar una tercera variable. Això els fa especialment útils per a visualitzar conjunts de dades complexos i identificar relacions entre tres variables.

Conceptes Clau

  1. Eix X i Eix Y: Representen dues de les variables del conjunt de dades.
  2. Mida de la Bombolla: Representa la tercera variable, sovint una mètrica quantitativa.
  3. Color de la Bombolla: Pot utilitzar-se per afegir una quarta dimensió, com ara una categoria o una altra mètrica.

Exemples d'Ús

  • Anàlisi de Vendes: Comparar les vendes (eix X), el benefici (eix Y) i el nombre d'unitats venudes (mida de la bombolla) per a diferents productes.
  • Estudis Demogràfics: Visualitzar la població (eix X), l'esperança de vida (eix Y) i el PIB per càpita (mida de la bombolla) de diferents països.
  • Anàlisi de Màrqueting: Comparar el cost per clic (eix X), la taxa de conversió (eix Y) i el pressupost de la campanya (mida de la bombolla) per a diferents campanyes publicitàries.

Creació d'un Gràfic de Bombolla amb Python (Matplotlib i Seaborn)

Pas 1: Instal·lació de les Llibreries Necessàries

pip install matplotlib seaborn pandas

Pas 2: Importació de les Llibreries

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

Pas 3: Preparació del Conjunt de Dades

# Exemple de conjunt de dades
data = {
    'Producte': ['A', 'B', 'C', 'D', 'E'],
    'Vendes': [100, 150, 200, 250, 300],
    'Benefici': [20, 30, 50, 70, 90],
    'Unitats Venudes': [1000, 1500, 2000, 2500, 3000]
}

df = pd.DataFrame(data)

Pas 4: Creació del Gràfic de Bombolla

plt.figure(figsize=(10, 6))

# Crear el gràfic de bombolla
sns.scatterplot(data=df, x='Vendes', y='Benefici', size='Unitats Venudes', hue='Producte', sizes=(100, 2000), alpha=0.5, palette='viridis')

# Afegir títol i etiquetes
plt.title('Gràfic de Bombolla de Vendes i Benefici')
plt.xlabel('Vendes')
plt.ylabel('Benefici')

# Mostrar el gràfic
plt.show()

Explicació del Codi

  • sns.scatterplot: Utilitzem aquesta funció de Seaborn per crear el gràfic de bombolla.
  • data=df: Especifica el DataFrame que conté les dades.
  • x='Vendes' i y='Benefici': Defineixen les variables per als eixos X i Y.
  • size='Unitats Venudes': Defineix la variable que determina la mida de les bombolles.
  • hue='Producte': Utilitza el color per diferenciar els productes.
  • sizes=(100, 2000): Defineix l'escala de mides per a les bombolles.
  • alpha=0.5: Ajusta la transparència de les bombolles.
  • palette='viridis': Defineix la paleta de colors utilitzada.

Exercici Pràctic

Exercici

Utilitza el següent conjunt de dades per crear un gràfic de bombolla que mostri la relació entre la població, l'esperança de vida i el PIB per càpita de diferents països.

data = {
    'País': ['País A', 'País B', 'País C', 'País D', 'País E'],
    'Població': [50, 80, 120, 200, 300],
    'Esperança de Vida': [70, 75, 80, 65, 60],
    'PIB per Càpita': [10000, 20000, 15000, 5000, 8000]
}

df = pd.DataFrame(data)

Solució

plt.figure(figsize=(10, 6))

# Crear el gràfic de bombolla
sns.scatterplot(data=df, x='Població', y='Esperança de Vida', size='PIB per Càpita', hue='País', sizes=(100, 2000), alpha=0.5, palette='coolwarm')

# Afegir títol i etiquetes
plt.title('Gràfic de Bombolla de Població, Esperança de Vida i PIB per Càpita')
plt.xlabel('Població (milions)')
plt.ylabel('Esperança de Vida (anys)')

# Mostrar el gràfic
plt.show()

Errors Comuns i Consells

  • Escala de Mides: Assegura't que l'escala de mides de les bombolles sigui adequada per a les dades. Bombolles massa petites o massa grans poden dificultar la interpretació del gràfic.
  • Superposició de Bombolles: Si les bombolles es superposen massa, considera ajustar la transparència (alpha) o utilitzar una tècnica de separació.
  • Color: Utilitza una paleta de colors que sigui fàcil de distingir per a les diferents categories.

Conclusió

Els gràfics de bombolla són una eina poderosa per visualitzar relacions complexes entre tres o més variables. Amb les eines adequades, com Matplotlib i Seaborn, és possible crear gràfics de bombolla informatius i visualment atractius que poden ajudar a identificar patrons i tendències en les dades.

© Copyright 2024. Tots els drets reservats