Els gràfics de dispersió són una eina poderosa per visualitzar la relació entre dues variables quantitatives. En aquest tema, aprendrem què són els gràfics de dispersió, com interpretar-los, i com crear-los utilitzant diferents eines de visualització de dades.

Què és un Gràfic de Dispersió?

Un gràfic de dispersió, també conegut com a diagrama de dispersió, és una representació gràfica que mostra la relació entre dues variables mitjançant punts en un pla cartesiano. Cada punt en el gràfic representa un parell de valors de les dues variables.

Característiques Clau:

  • Eixos X i Y: Representen les dues variables quantitatives.
  • Punts: Cada punt representa un parell de valors (x, y).
  • Patró de Distribució: Pot revelar correlacions, tendències i anomalies.

Importància dels Gràfics de Dispersió

Els gràfics de dispersió són útils per:

  • Identificar Relacions: Permeten veure si hi ha una relació positiva, negativa o nul·la entre dues variables.
  • Detectar Anomalies: Faciliten la identificació de punts fora del patró general.
  • Visualitzar Tendències: Ajuda a veure tendències lineals o no lineals.

Creació de Gràfics de Dispersió

Amb Microsoft Excel

  1. Inserir Dades: Introduïu les dades en dues columnes.
  2. Seleccionar Dades: Seleccioneu les dades que voleu representar.
  3. Inserir Gràfic: Aneu a la pestanya "Inserir" i seleccioneu "Gràfic de Dispersió".
  4. Personalitzar: Afegiu títols, etiquetes i ajusteu el format segons sigui necessari.

Amb Python (Matplotlib i Seaborn)

Exemple amb Matplotlib

import matplotlib.pyplot as plt

# Dades d'exemple
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# Crear el gràfic de dispersió
plt.scatter(x, y)

# Afegir títols i etiquetes
plt.title('Gràfic de Dispersió')
plt.xlabel('Variable X')
plt.ylabel('Variable Y')

# Mostrar el gràfic
plt.show()

Exemple amb Seaborn

import seaborn as sns
import matplotlib.pyplot as plt

# Dades d'exemple
data = {
    'x': [1, 2, 3, 4, 5],
    'y': [2, 3, 5, 7, 11]
}

# Crear el gràfic de dispersió
sns.scatterplot(x='x', y='y', data=data)

# Afegir títols i etiquetes
plt.title('Gràfic de Dispersió')
plt.xlabel('Variable X')
plt.ylabel('Variable Y')

# Mostrar el gràfic
plt.show()

Amb R (ggplot2)

library(ggplot2)

# Dades d'exemple
data <- data.frame(
  x = c(1, 2, 3, 4, 5),
  y = c(2, 3, 5, 7, 11)
)

# Crear el gràfic de dispersió
ggplot(data, aes(x = x, y = y)) +
  geom_point() +
  ggtitle('Gràfic de Dispersió') +
  xlab('Variable X') +
  ylab('Variable Y')

Exercicis Pràctics

Exercici 1: Creació d'un Gràfic de Dispersió amb Excel

  1. Introduïu les següents dades en dues columnes d'un full de càlcul d'Excel:
    • Columna A (Variable X): 1, 2, 3, 4, 5
    • Columna B (Variable Y): 2, 4, 6, 8, 10
  2. Creeu un gràfic de dispersió utilitzant aquestes dades.
  3. Afegiu títols i etiquetes als eixos.

Exercici 2: Creació d'un Gràfic de Dispersió amb Python

Utilitzeu Matplotlib o Seaborn per crear un gràfic de dispersió amb les següents dades:

  • Variable X: [10, 20, 30, 40, 50]
  • Variable Y: [15, 25, 35, 45, 55]

Solució de l'Exercici 2

Amb Matplotlib

import matplotlib.pyplot as plt

# Dades d'exemple
x = [10, 20, 30, 40, 50]
y = [15, 25, 35, 45, 55]

# Crear el gràfic de dispersió
plt.scatter(x, y)

# Afegir títols i etiquetes
plt.title('Gràfic de Dispersió')
plt.xlabel('Variable X')
plt.ylabel('Variable Y')

# Mostrar el gràfic
plt.show()

Amb Seaborn

import seaborn as sns
import matplotlib.pyplot as plt

# Dades d'exemple
data = {
    'x': [10, 20, 30, 40, 50],
    'y': [15, 25, 35, 45, 55]
}

# Crear el gràfic de dispersió
sns.scatterplot(x='x', y='y', data=data)

# Afegir títols i etiquetes
plt.title('Gràfic de Dispersió')
plt.xlabel('Variable X')
plt.ylabel('Variable Y')

# Mostrar el gràfic
plt.show()

Resum

En aquesta secció, hem après què són els gràfics de dispersió, la seva importància i com crear-los utilitzant diferents eines com Excel, Python (Matplotlib i Seaborn) i R (ggplot2). Hem vist exemples pràctics i hem realitzat exercicis per reforçar els conceptes apresos. Ara estem preparats per avançar cap a altres tipus de gràfics i tècniques de visualització de dades.

© Copyright 2024. Tots els drets reservats