Introducció
ggplot2
és una de les biblioteques més populars per a la visualització de dades en R. Proporciona una manera coherent i poderosa de crear gràfics complexos de manera senzilla. En aquest tema, aprendrem els conceptes bàsics de ggplot2
i com utilitzar-lo per crear visualitzacions efectives.
Instal·lació i Càrrega de ggplot2
Abans de començar, assegura't de tenir instal·lat ggplot2
. Si no el tens, pots instal·lar-lo amb la següent comanda:
Després, carrega la biblioteca:
Estructura Bàsica d'un Gràfic en ggplot2
Un gràfic en ggplot2
es construeix en capes. La funció principal és ggplot()
, que crea un objecte gràfic buit. A partir d'aquí, afegim capes utilitzant el símbol +
.
Components Principals
- Dades: El conjunt de dades que vols visualitzar.
- Estètica (aes): Defineix com es mapegen les variables de les dades als atributs visuals (com ara l'eix x, l'eix y, el color, etc.).
- Geometria (geom): Defineix el tipus de gràfic (com ara punts, línies, barres, etc.).
Exemple Bàsic
Vegem un exemple bàsic utilitzant el conjunt de dades mtcars
:
# Carregar el conjunt de dades mtcars data(mtcars) # Crear un gràfic de dispersió bàsic ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()
En aquest exemple:
data = mtcars
: Especifica el conjunt de dades.aes(x = wt, y = mpg)
: Defineix que la variablewt
(pes) es mapeja a l'eix x impg
(milles per galó) a l'eix y.geom_point()
: Afegeix una capa de punts (gràfic de dispersió).
Personalització de Gràfics
Afegir Títols i Etiquetes
Pots afegir títols i etiquetes als eixos utilitzant la funció labs()
:
ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point() + labs(title = "Relació entre Pes i Milles per Galó", x = "Pes (1000 lbs)", y = "Milles per Galó")
Canviar l'Aparença dels Punts
Pots personalitzar l'aparença dels punts utilitzant arguments dins de geom_point()
:
ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point(color = "blue", size = 3, shape = 16) + labs(title = "Relació entre Pes i Milles per Galó", x = "Pes (1000 lbs)", y = "Milles per Galó")
Afegir Capes Addicionals
Pots afegir capes addicionals per enriquir el gràfic. Per exemple, afegir una línia de regressió:
ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point() + geom_smooth(method = "lm", se = FALSE, color = "red") + labs(title = "Relació entre Pes i Milles per Galó amb Línia de Regressió", x = "Pes (1000 lbs)", y = "Milles per Galó")
En aquest exemple, geom_smooth(method = "lm", se = FALSE, color = "red")
afegeix una línia de regressió lineal (lm) sense la banda d'error (se = FALSE) i de color vermell.
Exercicis Pràctics
Exercici 1: Gràfic de Dispersió amb Personalització
Crea un gràfic de dispersió utilitzant el conjunt de dades mtcars
on es mostri la relació entre hp
(potència) i mpg
(milles per galó). Personalitza els punts perquè siguin de color verd i de mida 4. Afegeix un títol i etiquetes als eixos.
Solució
ggplot(data = mtcars, aes(x = hp, y = mpg)) + geom_point(color = "green", size = 4) + labs(title = "Relació entre Potència i Milles per Galó", x = "Potència (hp)", y = "Milles per Galó")
Exercici 2: Gràfic de Barres
Utilitza el conjunt de dades mtcars
per crear un gràfic de barres que mostri el nombre de cotxes per cada nombre de cilindres (cyl
). Afegeix un títol i etiquetes als eixos.
Solució
ggplot(data = mtcars, aes(x = factor(cyl))) + geom_bar(fill = "skyblue") + labs(title = "Nombre de Cotxes per Nombre de Cilindres", x = "Nombre de Cilindres", y = "Nombre de Cotxes")
Resum
En aquesta secció, hem après els conceptes bàsics de ggplot2
, incloent-hi com crear gràfics de dispersió, personalitzar-los i afegir capes addicionals. També hem vist com crear gràfics de barres. Aquests coneixements bàsics et permetran començar a explorar les capacitats de ggplot2
per a la visualització de dades.
En el següent tema, aprofundirem en les funcionalitats avançades de ggplot2
per crear visualitzacions més complexes i informatives.
Programació en R: De Principiant a Avançat
Mòdul 1: Introducció a R
- Introducció a R i RStudio
- Sintaxi Bàsica de R
- Tipus de Dades i Estructures
- Operacions i Funcions Bàsiques
- Importació i Exportació de Dades
Mòdul 2: Manipulació de Dades
- Vectors i Llistes
- Matrius i Arrays
- Data Frames
- Factors
- Manipulació de Dades amb dplyr
- Manipulació de Cadenes
Mòdul 3: Visualització de Dades
- Introducció a la Visualització de Dades
- Gràfics Base de R
- Conceptes Bàsics de ggplot2
- ggplot2 Avançat
- Visualitzacions Interactives amb plotly
Mòdul 4: Anàlisi Estadística
- Estadístiques Descriptives
- Distribucions de Probabilitat
- Proves d'Hipòtesi
- Correlació i Regressió
- ANOVA i Proves de Chi-Cuadrat
Mòdul 5: Gestió Avançada de Dades
- Gestió de Dates i Hores
- Reestructuració de Dades
- Treballant amb Grans Conjunts de Dades
- Web Scraping
- APIs i JSON
Mòdul 6: Conceptes Avançats de Programació
- Escriure Funcions
- Depuració i Gestió d'Errors
- Programació Orientada a Objectes en R
- Programació Funcional
- Computació Paral·lela
Mòdul 7: Aprenentatge Automàtic amb R
- Introducció a l'Aprenentatge Automàtic
- Preprocessament de Dades
- Aprenentatge Supervisat
- Aprenentatge No Supervisat
- Avaluació i Ajust de Models
Mòdul 8: Temes Especialitzats
- Anàlisi de Sèries Temporals
- Anàlisi de Dades Espacials
- Mineria de Text i Processament del Llenguatge Natural
- Bioinformàtica amb R
- Anàlisi de Dades Financeres