Introducció
Els gràfics de bombolla són una extensió dels gràfics de dispersió que permeten representar tres dimensions de dades en un sol gràfic. En lloc de només utilitzar els eixos X i Y per mostrar dades, els gràfics de bombolla utilitzen la mida de les bombolles per representar una tercera variable. Això els fa especialment útils per a visualitzar conjunts de dades complexos i identificar relacions entre tres variables.
Conceptes Clau
- Eix X i Eix Y: Representen dues de les variables del conjunt de dades.
- Mida de la Bombolla: Representa la tercera variable, sovint una mètrica quantitativa.
- Color de la Bombolla: Pot utilitzar-se per afegir una quarta dimensió, com ara una categoria o una altra mètrica.
Exemples d'Ús
- Anàlisi de Vendes: Comparar les vendes (eix X), el benefici (eix Y) i el nombre d'unitats venudes (mida de la bombolla) per a diferents productes.
- Estudis Demogràfics: Visualitzar la població (eix X), l'esperança de vida (eix Y) i el PIB per càpita (mida de la bombolla) de diferents països.
- Anàlisi de Màrqueting: Comparar el cost per clic (eix X), la taxa de conversió (eix Y) i el pressupost de la campanya (mida de la bombolla) per a diferents campanyes publicitàries.
Creació d'un Gràfic de Bombolla amb Python (Matplotlib i Seaborn)
Pas 1: Instal·lació de les Llibreries Necessàries
Pas 2: Importació de les Llibreries
Pas 3: Preparació del Conjunt de Dades
# Exemple de conjunt de dades data = { 'Producte': ['A', 'B', 'C', 'D', 'E'], 'Vendes': [100, 150, 200, 250, 300], 'Benefici': [20, 30, 50, 70, 90], 'Unitats Venudes': [1000, 1500, 2000, 2500, 3000] } df = pd.DataFrame(data)
Pas 4: Creació del Gràfic de Bombolla
plt.figure(figsize=(10, 6)) # Crear el gràfic de bombolla sns.scatterplot(data=df, x='Vendes', y='Benefici', size='Unitats Venudes', hue='Producte', sizes=(100, 2000), alpha=0.5, palette='viridis') # Afegir títol i etiquetes plt.title('Gràfic de Bombolla de Vendes i Benefici') plt.xlabel('Vendes') plt.ylabel('Benefici') # Mostrar el gràfic plt.show()
Explicació del Codi
sns.scatterplot
: Utilitzem aquesta funció de Seaborn per crear el gràfic de bombolla.data=df
: Especifica el DataFrame que conté les dades.x='Vendes'
iy='Benefici'
: Defineixen les variables per als eixos X i Y.size='Unitats Venudes'
: Defineix la variable que determina la mida de les bombolles.hue='Producte'
: Utilitza el color per diferenciar els productes.sizes=(100, 2000)
: Defineix l'escala de mides per a les bombolles.alpha=0.5
: Ajusta la transparència de les bombolles.palette='viridis'
: Defineix la paleta de colors utilitzada.
Exercici Pràctic
Exercici
Utilitza el següent conjunt de dades per crear un gràfic de bombolla que mostri la relació entre la població, l'esperança de vida i el PIB per càpita de diferents països.
data = { 'País': ['País A', 'País B', 'País C', 'País D', 'País E'], 'Població': [50, 80, 120, 200, 300], 'Esperança de Vida': [70, 75, 80, 65, 60], 'PIB per Càpita': [10000, 20000, 15000, 5000, 8000] } df = pd.DataFrame(data)
Solució
plt.figure(figsize=(10, 6)) # Crear el gràfic de bombolla sns.scatterplot(data=df, x='Població', y='Esperança de Vida', size='PIB per Càpita', hue='País', sizes=(100, 2000), alpha=0.5, palette='coolwarm') # Afegir títol i etiquetes plt.title('Gràfic de Bombolla de Població, Esperança de Vida i PIB per Càpita') plt.xlabel('Població (milions)') plt.ylabel('Esperança de Vida (anys)') # Mostrar el gràfic plt.show()
Errors Comuns i Consells
- Escala de Mides: Assegura't que l'escala de mides de les bombolles sigui adequada per a les dades. Bombolles massa petites o massa grans poden dificultar la interpretació del gràfic.
- Superposició de Bombolles: Si les bombolles es superposen massa, considera ajustar la transparència (
alpha
) o utilitzar una tècnica de separació. - Color: Utilitza una paleta de colors que sigui fàcil de distingir per a les diferents categories.
Conclusió
Els gràfics de bombolla són una eina poderosa per visualitzar relacions complexes entre tres o més variables. Amb les eines adequades, com Matplotlib i Seaborn, és possible crear gràfics de bombolla informatius i visualment atractius que poden ajudar a identificar patrons i tendències en les dades.
Visualització de Dades
Mòdul 1: Introducció a la Visualització de Dades
- Conceptes Bàsics de Visualització de Dades
- Importància de la Visualització de Dades
- Tipus de Dades i Gràfics
Mòdul 2: Eines de Visualització de Dades
- Introducció a Eines de Visualització
- Ús de Microsoft Excel per a Visualització
- Introducció a Tableau
- Ús de Power BI
- Visualització amb Python: Matplotlib i Seaborn
- Visualització amb R: ggplot2
Mòdul 3: Tècniques de Visualització de Dades
- Gràfics de Barres i Columnes
- Gràfics de Línies
- Gràfics de Dispersió
- Gràfics de Pastís
- Mapes de Calor
- Gràfics d'Àrea
- Diagrames de Caixa i Bigots
- Gràfics de Bombolla
Mòdul 4: Principis de Disseny en Visualització de Dades
- Principis de Percepció Visual
- Ús del Color en Visualització
- Disseny de Gràfics Efectius
- Evitar Errors Comuns en Visualització
Mòdul 5: Casos Pràctics i Projectes
- Anàlisi de Dades de Vendes
- Visualització de Dades de Màrqueting
- Projectes de Visualització de Dades en Salut
- Visualització de Dades Financeres