Introducció

ggplot2 és una de les biblioteques més populars per a la visualització de dades en R. Desenvolupada per Hadley Wickham, ggplot2 es basa en la gramàtica dels gràfics, que proporciona una manera coherent de descriure i construir gràfics. Aquesta biblioteca permet crear visualitzacions complexes de manera relativament senzilla i és molt flexible.

Conceptes Bàsics de ggplot2

Gramàtica dels Gràfics

La gramàtica dels gràfics es basa en la idea que qualsevol gràfic es pot descompondre en components bàsics, com ara:

  • Dades: El conjunt de dades que es vol visualitzar.
  • Estètica (aes): Mapeja les variables de les dades a propietats visuals (com ara l'eix x, l'eix y, el color, etc.).
  • Geometries (geom): Defineixen el tipus de gràfic (com ara punts, línies, barres, etc.).
  • Facetes: Permeten dividir el gràfic en subgràfics basats en una o més variables.
  • Escales: Controlen com es mapegen les dades a propietats visuals.
  • Coordenades: Defineixen el sistema de coordenades utilitzat.
  • Temes: Controlen l'aparença general del gràfic.

Instal·lació i Carregament de ggplot2

Abans de començar a utilitzar ggplot2, cal instal·lar-lo i carregar-lo en la sessió d'R.

install.packages("ggplot2")
library(ggplot2)

Creació de Gràfics amb ggplot2

Gràfic de Punts (Scatter Plot)

Un gràfic de punts és útil per visualitzar la relació entre dues variables numèriques.

# Exemple de dades
data(mtcars)

# Creació del gràfic de punts
ggplot(data = mtcars, aes(x = wt, y = mpg)) +
  geom_point() +
  labs(title = "Relació entre Pes i Milles per Galó",
       x = "Pes (1000 lbs)",
       y = "Milles per Galó")

Explicació del Codi

  • ggplot(data = mtcars, aes(x = wt, y = mpg)): Inicialitza el gràfic amb el conjunt de dades mtcars i mapeja wt a l'eix x i mpg a l'eix y.
  • geom_point(): Afegeix punts al gràfic.
  • labs(): Afegeix títol i etiquetes als eixos.

Gràfic de Barres

Un gràfic de barres és útil per visualitzar la distribució d'una variable categòrica.

# Exemple de dades
data(diamonds)

# Creació del gràfic de barres
ggplot(data = diamonds, aes(x = cut)) +
  geom_bar() +
  labs(title = "Distribució de la Qualitat del Tall dels Diamants",
       x = "Qualitat del Tall",
       y = "Compte")

Explicació del Codi

  • ggplot(data = diamonds, aes(x = cut)): Inicialitza el gràfic amb el conjunt de dades diamonds i mapeja cut a l'eix x.
  • geom_bar(): Afegeix barres al gràfic.
  • labs(): Afegeix títol i etiquetes als eixos.

Gràfic de Línies

Un gràfic de línies és útil per visualitzar tendències al llarg del temps.

# Exemple de dades
data(economics)

# Creació del gràfic de línies
ggplot(data = economics, aes(x = date, y = unemploy)) +
  geom_line() +
  labs(title = "Tendència de l'Atur als EUA",
       x = "Data",
       y = "Nombre d'Aturats")

Explicació del Codi

  • ggplot(data = economics, aes(x = date, y = unemploy)): Inicialitza el gràfic amb el conjunt de dades economics i mapeja date a l'eix x i unemploy a l'eix y.
  • geom_line(): Afegeix línies al gràfic.
  • labs(): Afegeix títol i etiquetes als eixos.

Exercicis Pràctics

Exercici 1: Gràfic de Punts amb Color

Crea un gràfic de punts utilitzant el conjunt de dades mtcars, on els punts estiguin acolorits segons la variable cyl (nombre de cilindres).

Solució

ggplot(data = mtcars, aes(x = wt, y = mpg, color = factor(cyl))) +
  geom_point() +
  labs(title = "Relació entre Pes i Milles per Galó amb Color per Cilindres",
       x = "Pes (1000 lbs)",
       y = "Milles per Galó",
       color = "Nombre de Cilindres")

Exercici 2: Gràfic de Barres Apilat

Crea un gràfic de barres apilat utilitzant el conjunt de dades diamonds, on les barres estiguin apilades segons la variable color.

Solució

ggplot(data = diamonds, aes(x = cut, fill = color)) +
  geom_bar(position = "stack") +
  labs(title = "Distribució de la Qualitat del Tall dels Diamants amb Color",
       x = "Qualitat del Tall",
       y = "Compte",
       fill = "Color")

Resum

En aquesta secció, hem après els conceptes bàsics de ggplot2 i com utilitzar-lo per crear diferents tipus de gràfics, com ara gràfics de punts, barres i línies. També hem vist com personalitzar aquests gràfics amb títols, etiquetes i colors. Els exercicis pràctics proporcionats ajuden a consolidar aquests conceptes i a desenvolupar habilitats en la creació de visualitzacions amb ggplot2.

En el següent mòdul, explorarem tècniques específiques de visualització de dades, com ara gràfics de barres i columnes, gràfics de línies, gràfics de dispersió, i més.

© Copyright 2024. Tots els drets reservats