Introducció
ggplot2
és una de les biblioteques més populars per a la visualització de dades en R. Desenvolupada per Hadley Wickham, ggplot2
es basa en la gramàtica dels gràfics, que proporciona una manera coherent de descriure i construir gràfics. Aquesta biblioteca permet crear visualitzacions complexes de manera relativament senzilla i és molt flexible.
Conceptes Bàsics de ggplot2
Gramàtica dels Gràfics
La gramàtica dels gràfics es basa en la idea que qualsevol gràfic es pot descompondre en components bàsics, com ara:
- Dades: El conjunt de dades que es vol visualitzar.
- Estètica (aes): Mapeja les variables de les dades a propietats visuals (com ara l'eix x, l'eix y, el color, etc.).
- Geometries (geom): Defineixen el tipus de gràfic (com ara punts, línies, barres, etc.).
- Facetes: Permeten dividir el gràfic en subgràfics basats en una o més variables.
- Escales: Controlen com es mapegen les dades a propietats visuals.
- Coordenades: Defineixen el sistema de coordenades utilitzat.
- Temes: Controlen l'aparença general del gràfic.
Instal·lació i Carregament de ggplot2
Abans de començar a utilitzar ggplot2
, cal instal·lar-lo i carregar-lo en la sessió d'R.
Creació de Gràfics amb ggplot2
Gràfic de Punts (Scatter Plot)
Un gràfic de punts és útil per visualitzar la relació entre dues variables numèriques.
# Exemple de dades data(mtcars) # Creació del gràfic de punts ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point() + labs(title = "Relació entre Pes i Milles per Galó", x = "Pes (1000 lbs)", y = "Milles per Galó")
Explicació del Codi
ggplot(data = mtcars, aes(x = wt, y = mpg))
: Inicialitza el gràfic amb el conjunt de dadesmtcars
i mapejawt
a l'eix x impg
a l'eix y.geom_point()
: Afegeix punts al gràfic.labs()
: Afegeix títol i etiquetes als eixos.
Gràfic de Barres
Un gràfic de barres és útil per visualitzar la distribució d'una variable categòrica.
# Exemple de dades data(diamonds) # Creació del gràfic de barres ggplot(data = diamonds, aes(x = cut)) + geom_bar() + labs(title = "Distribució de la Qualitat del Tall dels Diamants", x = "Qualitat del Tall", y = "Compte")
Explicació del Codi
ggplot(data = diamonds, aes(x = cut))
: Inicialitza el gràfic amb el conjunt de dadesdiamonds
i mapejacut
a l'eix x.geom_bar()
: Afegeix barres al gràfic.labs()
: Afegeix títol i etiquetes als eixos.
Gràfic de Línies
Un gràfic de línies és útil per visualitzar tendències al llarg del temps.
# Exemple de dades data(economics) # Creació del gràfic de línies ggplot(data = economics, aes(x = date, y = unemploy)) + geom_line() + labs(title = "Tendència de l'Atur als EUA", x = "Data", y = "Nombre d'Aturats")
Explicació del Codi
ggplot(data = economics, aes(x = date, y = unemploy))
: Inicialitza el gràfic amb el conjunt de dadeseconomics
i mapejadate
a l'eix x iunemploy
a l'eix y.geom_line()
: Afegeix línies al gràfic.labs()
: Afegeix títol i etiquetes als eixos.
Exercicis Pràctics
Exercici 1: Gràfic de Punts amb Color
Crea un gràfic de punts utilitzant el conjunt de dades mtcars
, on els punts estiguin acolorits segons la variable cyl
(nombre de cilindres).
Solució
ggplot(data = mtcars, aes(x = wt, y = mpg, color = factor(cyl))) + geom_point() + labs(title = "Relació entre Pes i Milles per Galó amb Color per Cilindres", x = "Pes (1000 lbs)", y = "Milles per Galó", color = "Nombre de Cilindres")
Exercici 2: Gràfic de Barres Apilat
Crea un gràfic de barres apilat utilitzant el conjunt de dades diamonds
, on les barres estiguin apilades segons la variable color
.
Solució
ggplot(data = diamonds, aes(x = cut, fill = color)) + geom_bar(position = "stack") + labs(title = "Distribució de la Qualitat del Tall dels Diamants amb Color", x = "Qualitat del Tall", y = "Compte", fill = "Color")
Resum
En aquesta secció, hem après els conceptes bàsics de ggplot2
i com utilitzar-lo per crear diferents tipus de gràfics, com ara gràfics de punts, barres i línies. També hem vist com personalitzar aquests gràfics amb títols, etiquetes i colors. Els exercicis pràctics proporcionats ajuden a consolidar aquests conceptes i a desenvolupar habilitats en la creació de visualitzacions amb ggplot2
.
En el següent mòdul, explorarem tècniques específiques de visualització de dades, com ara gràfics de barres i columnes, gràfics de línies, gràfics de dispersió, i més.
Visualització de Dades
Mòdul 1: Introducció a la Visualització de Dades
- Conceptes Bàsics de Visualització de Dades
- Importància de la Visualització de Dades
- Tipus de Dades i Gràfics
Mòdul 2: Eines de Visualització de Dades
- Introducció a Eines de Visualització
- Ús de Microsoft Excel per a Visualització
- Introducció a Tableau
- Ús de Power BI
- Visualització amb Python: Matplotlib i Seaborn
- Visualització amb R: ggplot2
Mòdul 3: Tècniques de Visualització de Dades
- Gràfics de Barres i Columnes
- Gràfics de Línies
- Gràfics de Dispersió
- Gràfics de Pastís
- Mapes de Calor
- Gràfics d'Àrea
- Diagrames de Caixa i Bigots
- Gràfics de Bombolla
Mòdul 4: Principis de Disseny en Visualització de Dades
- Principis de Percepció Visual
- Ús del Color en Visualització
- Disseny de Gràfics Efectius
- Evitar Errors Comuns en Visualització
Mòdul 5: Casos Pràctics i Projectes
- Anàlisi de Dades de Vendes
- Visualització de Dades de Màrqueting
- Projectes de Visualització de Dades en Salut
- Visualització de Dades Financeres