Els gràfics de dispersió són una eina poderosa per visualitzar la relació entre dues variables quantitatives. En aquest tema, aprendrem què són els gràfics de dispersió, com interpretar-los, i com crear-los utilitzant diferents eines de visualització de dades.
Què és un Gràfic de Dispersió?
Un gràfic de dispersió, també conegut com a diagrama de dispersió, és una representació gràfica que mostra la relació entre dues variables mitjançant punts en un pla cartesiano. Cada punt en el gràfic representa un parell de valors de les dues variables.
Característiques Clau:
- Eixos X i Y: Representen les dues variables quantitatives.
- Punts: Cada punt representa un parell de valors (x, y).
- Patró de Distribució: Pot revelar correlacions, tendències i anomalies.
Importància dels Gràfics de Dispersió
Els gràfics de dispersió són útils per:
- Identificar Relacions: Permeten veure si hi ha una relació positiva, negativa o nul·la entre dues variables.
- Detectar Anomalies: Faciliten la identificació de punts fora del patró general.
- Visualitzar Tendències: Ajuda a veure tendències lineals o no lineals.
Creació de Gràfics de Dispersió
Amb Microsoft Excel
- Inserir Dades: Introduïu les dades en dues columnes.
- Seleccionar Dades: Seleccioneu les dades que voleu representar.
- Inserir Gràfic: Aneu a la pestanya "Inserir" i seleccioneu "Gràfic de Dispersió".
- Personalitzar: Afegiu títols, etiquetes i ajusteu el format segons sigui necessari.
Amb Python (Matplotlib i Seaborn)
Exemple amb Matplotlib
import matplotlib.pyplot as plt # Dades d'exemple x = [1, 2, 3, 4, 5] y = [2, 3, 5, 7, 11] # Crear el gràfic de dispersió plt.scatter(x, y) # Afegir títols i etiquetes plt.title('Gràfic de Dispersió') plt.xlabel('Variable X') plt.ylabel('Variable Y') # Mostrar el gràfic plt.show()
Exemple amb Seaborn
import seaborn as sns import matplotlib.pyplot as plt # Dades d'exemple data = { 'x': [1, 2, 3, 4, 5], 'y': [2, 3, 5, 7, 11] } # Crear el gràfic de dispersió sns.scatterplot(x='x', y='y', data=data) # Afegir títols i etiquetes plt.title('Gràfic de Dispersió') plt.xlabel('Variable X') plt.ylabel('Variable Y') # Mostrar el gràfic plt.show()
Amb R (ggplot2)
library(ggplot2) # Dades d'exemple data <- data.frame( x = c(1, 2, 3, 4, 5), y = c(2, 3, 5, 7, 11) ) # Crear el gràfic de dispersió ggplot(data, aes(x = x, y = y)) + geom_point() + ggtitle('Gràfic de Dispersió') + xlab('Variable X') + ylab('Variable Y')
Exercicis Pràctics
Exercici 1: Creació d'un Gràfic de Dispersió amb Excel
- Introduïu les següents dades en dues columnes d'un full de càlcul d'Excel:
- Columna A (Variable X): 1, 2, 3, 4, 5
- Columna B (Variable Y): 2, 4, 6, 8, 10
- Creeu un gràfic de dispersió utilitzant aquestes dades.
- Afegiu títols i etiquetes als eixos.
Exercici 2: Creació d'un Gràfic de Dispersió amb Python
Utilitzeu Matplotlib o Seaborn per crear un gràfic de dispersió amb les següents dades:
- Variable X: [10, 20, 30, 40, 50]
- Variable Y: [15, 25, 35, 45, 55]
Solució de l'Exercici 2
Amb Matplotlib
import matplotlib.pyplot as plt # Dades d'exemple x = [10, 20, 30, 40, 50] y = [15, 25, 35, 45, 55] # Crear el gràfic de dispersió plt.scatter(x, y) # Afegir títols i etiquetes plt.title('Gràfic de Dispersió') plt.xlabel('Variable X') plt.ylabel('Variable Y') # Mostrar el gràfic plt.show()
Amb Seaborn
import seaborn as sns import matplotlib.pyplot as plt # Dades d'exemple data = { 'x': [10, 20, 30, 40, 50], 'y': [15, 25, 35, 45, 55] } # Crear el gràfic de dispersió sns.scatterplot(x='x', y='y', data=data) # Afegir títols i etiquetes plt.title('Gràfic de Dispersió') plt.xlabel('Variable X') plt.ylabel('Variable Y') # Mostrar el gràfic plt.show()
Resum
En aquesta secció, hem après què són els gràfics de dispersió, la seva importància i com crear-los utilitzant diferents eines com Excel, Python (Matplotlib i Seaborn) i R (ggplot2). Hem vist exemples pràctics i hem realitzat exercicis per reforçar els conceptes apresos. Ara estem preparats per avançar cap a altres tipus de gràfics i tècniques de visualització de dades.
Visualització de Dades
Mòdul 1: Introducció a la Visualització de Dades
- Conceptes Bàsics de Visualització de Dades
- Importància de la Visualització de Dades
- Tipus de Dades i Gràfics
Mòdul 2: Eines de Visualització de Dades
- Introducció a Eines de Visualització
- Ús de Microsoft Excel per a Visualització
- Introducció a Tableau
- Ús de Power BI
- Visualització amb Python: Matplotlib i Seaborn
- Visualització amb R: ggplot2
Mòdul 3: Tècniques de Visualització de Dades
- Gràfics de Barres i Columnes
- Gràfics de Línies
- Gràfics de Dispersió
- Gràfics de Pastís
- Mapes de Calor
- Gràfics d'Àrea
- Diagrames de Caixa i Bigots
- Gràfics de Bombolla
Mòdul 4: Principis de Disseny en Visualització de Dades
- Principis de Percepció Visual
- Ús del Color en Visualització
- Disseny de Gràfics Efectius
- Evitar Errors Comuns en Visualització
Mòdul 5: Casos Pràctics i Projectes
- Anàlisi de Dades de Vendes
- Visualització de Dades de Màrqueting
- Projectes de Visualització de Dades en Salut
- Visualització de Dades Financeres