Introducció

ggplot2 és una de les biblioteques més populars per a la visualització de dades en R. Proporciona una manera coherent i poderosa de crear gràfics complexos de manera senzilla. En aquest tema, aprendrem els conceptes bàsics de ggplot2 i com utilitzar-lo per crear visualitzacions efectives.

Instal·lació i Càrrega de ggplot2

Abans de començar, assegura't de tenir instal·lat ggplot2. Si no el tens, pots instal·lar-lo amb la següent comanda:

install.packages("ggplot2")

Després, carrega la biblioteca:

library(ggplot2)

Estructura Bàsica d'un Gràfic en ggplot2

Un gràfic en ggplot2 es construeix en capes. La funció principal és ggplot(), que crea un objecte gràfic buit. A partir d'aquí, afegim capes utilitzant el símbol +.

Components Principals

  1. Dades: El conjunt de dades que vols visualitzar.
  2. Estètica (aes): Defineix com es mapegen les variables de les dades als atributs visuals (com ara l'eix x, l'eix y, el color, etc.).
  3. Geometria (geom): Defineix el tipus de gràfic (com ara punts, línies, barres, etc.).

Exemple Bàsic

Vegem un exemple bàsic utilitzant el conjunt de dades mtcars:

# Carregar el conjunt de dades mtcars
data(mtcars)

# Crear un gràfic de dispersió bàsic
ggplot(data = mtcars, aes(x = wt, y = mpg)) +
  geom_point()

En aquest exemple:

  • data = mtcars: Especifica el conjunt de dades.
  • aes(x = wt, y = mpg): Defineix que la variable wt (pes) es mapeja a l'eix x i mpg (milles per galó) a l'eix y.
  • geom_point(): Afegeix una capa de punts (gràfic de dispersió).

Personalització de Gràfics

Afegir Títols i Etiquetes

Pots afegir títols i etiquetes als eixos utilitzant la funció labs():

ggplot(data = mtcars, aes(x = wt, y = mpg)) +
  geom_point() +
  labs(title = "Relació entre Pes i Milles per Galó",
       x = "Pes (1000 lbs)",
       y = "Milles per Galó")

Canviar l'Aparença dels Punts

Pots personalitzar l'aparença dels punts utilitzant arguments dins de geom_point():

ggplot(data = mtcars, aes(x = wt, y = mpg)) +
  geom_point(color = "blue", size = 3, shape = 16) +
  labs(title = "Relació entre Pes i Milles per Galó",
       x = "Pes (1000 lbs)",
       y = "Milles per Galó")

Afegir Capes Addicionals

Pots afegir capes addicionals per enriquir el gràfic. Per exemple, afegir una línia de regressió:

ggplot(data = mtcars, aes(x = wt, y = mpg)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  labs(title = "Relació entre Pes i Milles per Galó amb Línia de Regressió",
       x = "Pes (1000 lbs)",
       y = "Milles per Galó")

En aquest exemple, geom_smooth(method = "lm", se = FALSE, color = "red") afegeix una línia de regressió lineal (lm) sense la banda d'error (se = FALSE) i de color vermell.

Exercicis Pràctics

Exercici 1: Gràfic de Dispersió amb Personalització

Crea un gràfic de dispersió utilitzant el conjunt de dades mtcars on es mostri la relació entre hp (potència) i mpg (milles per galó). Personalitza els punts perquè siguin de color verd i de mida 4. Afegeix un títol i etiquetes als eixos.

Solució

ggplot(data = mtcars, aes(x = hp, y = mpg)) +
  geom_point(color = "green", size = 4) +
  labs(title = "Relació entre Potència i Milles per Galó",
       x = "Potència (hp)",
       y = "Milles per Galó")

Exercici 2: Gràfic de Barres

Utilitza el conjunt de dades mtcars per crear un gràfic de barres que mostri el nombre de cotxes per cada nombre de cilindres (cyl). Afegeix un títol i etiquetes als eixos.

Solució

ggplot(data = mtcars, aes(x = factor(cyl))) +
  geom_bar(fill = "skyblue") +
  labs(title = "Nombre de Cotxes per Nombre de Cilindres",
       x = "Nombre de Cilindres",
       y = "Nombre de Cotxes")

Resum

En aquesta secció, hem après els conceptes bàsics de ggplot2, incloent-hi com crear gràfics de dispersió, personalitzar-los i afegir capes addicionals. També hem vist com crear gràfics de barres. Aquests coneixements bàsics et permetran començar a explorar les capacitats de ggplot2 per a la visualització de dades.

En el següent tema, aprofundirem en les funcionalitats avançades de ggplot2 per crear visualitzacions més complexes i informatives.

Programació en R: De Principiant a Avançat

Mòdul 1: Introducció a R

Mòdul 2: Manipulació de Dades

Mòdul 3: Visualització de Dades

Mòdul 4: Anàlisi Estadística

Mòdul 5: Gestió Avançada de Dades

Mòdul 6: Conceptes Avançats de Programació

Mòdul 7: Aprenentatge Automàtic amb R

Mòdul 8: Temes Especialitzats

Mòdul 9: Projecte i Estudis de Cas

© Copyright 2024. Tots els drets reservats