En aquest tema, explorarem els diferents tipus de dades i estructures que ofereix R. Comprendre aquests conceptes és fonamental per treballar eficaçment amb R, ja que cada tipus de dada i estructura té les seves pròpies característiques i usos.
Tipus de Dades en R
R suporta diversos tipus de dades bàsics. A continuació, es presenten els més comuns:
-
Numèrics: Inclouen tant enters com números de punt flotant.
enter <- 5 flotant <- 5.5
-
Caràcters: Cadenes de text.
text <- "Hola, món!"
-
Lògics: Valors booleans (TRUE o FALSE).
veritat <- TRUE fals <- FALSE
-
Factors: Utilitzats per representar dades categòriques.
colors <- factor(c("vermell", "blau", "verd"))
-
Complexos: Nombres complexos.
complex <- 1 + 2i
Estructures de Dades en R
R proporciona diverses estructures de dades per emmagatzemar i manipular col·leccions de dades. Les més importants són:
-
Vectors: Col·leccions d'elements del mateix tipus.
vector_numeric <- c(1, 2, 3, 4, 5) vector_caracter <- c("a", "b", "c")
-
Llistes: Col·leccions d'elements de diferents tipus.
llista <- list(nom = "Anna", edat = 25, puntuacions = c(90, 85, 88))
-
Matrius: Vectors bidimensionals amb elements del mateix tipus.
matriu <- matrix(1:9, nrow = 3, ncol = 3)
-
Arrays: Vectors multidimensionals amb elements del mateix tipus.
array_3d <- array(1:8, dim = c(2, 2, 2))
-
Data Frames: Taules de dades on cada columna pot contenir elements de diferents tipus.
data_frame <- data.frame( nom = c("Anna", "Joan", "Maria"), edat = c(25, 30, 22), puntuacions = c(90, 85, 88) )
-
Factors: Utilitzats per representar dades categòriques amb un nombre limitat de valors únics.
factors <- factor(c("alt", "baix", "mitjà", "alt"))
Exemples Pràctics
Exemple 1: Creació i Manipulació de Vectors
# Creació d'un vector numèric vector_numeric <- c(1, 2, 3, 4, 5) print(vector_numeric) # Accés a elements del vector primer_element <- vector_numeric[1] print(primer_element) # Modificació d'un element del vector vector_numeric[2] <- 10 print(vector_numeric)
Exemple 2: Creació i Manipulació de Data Frames
# Creació d'un data frame data_frame <- data.frame( nom = c("Anna", "Joan", "Maria"), edat = c(25, 30, 22), puntuacions = c(90, 85, 88) ) print(data_frame) # Accés a una columna noms <- data_frame$nom print(noms) # Afegir una nova columna data_frame$ciutat <- c("Barcelona", "Madrid", "València") print(data_frame)
Exercicis Pràctics
Exercici 1: Creació i Manipulació de Vectors
- Crea un vector numèric amb els valors 10, 20, 30, 40, 50.
- Accedeix al tercer element del vector.
- Modifica el cinquè element del vector per 100.
Solució
# Creació del vector vector_numeric <- c(10, 20, 30, 40, 50) print(vector_numeric) # Accés al tercer element tercer_element <- vector_numeric[3] print(tercer_element) # Modificació del cinquè element vector_numeric[5] <- 100 print(vector_numeric)
Exercici 2: Creació i Manipulació de Data Frames
- Crea un data frame amb les següents dades:
- Noms: "Pere", "Marta", "Lluís"
- Edats: 28, 34, 29
- Puntuacions: 75, 80, 90
- Accedeix a la columna de les edats.
- Afegeix una nova columna anomenada "gènere" amb els valors "M", "F", "M".
Solució
# Creació del data frame data_frame <- data.frame( nom = c("Pere", "Marta", "Lluís"), edat = c(28, 34, 29), puntuacions = c(75, 80, 90) ) print(data_frame) # Accés a la columna de les edats edats <- data_frame$edat print(edats) # Afegir una nova columna data_frame$genere <- c("M", "F", "M") print(data_frame)
Conclusió
En aquesta secció, hem explorat els tipus de dades bàsics i les estructures de dades en R. Hem après a crear i manipular vectors, llistes, matrius, arrays, data frames i factors. Aquests conceptes són fonamentals per treballar amb R i ens proporcionen les eines necessàries per gestionar i analitzar dades de manera eficient. En el proper tema, aprofundirem en les operacions i funcions bàsiques en R.
Programació en R: De Principiant a Avançat
Mòdul 1: Introducció a R
- Introducció a R i RStudio
- Sintaxi Bàsica de R
- Tipus de Dades i Estructures
- Operacions i Funcions Bàsiques
- Importació i Exportació de Dades
Mòdul 2: Manipulació de Dades
- Vectors i Llistes
- Matrius i Arrays
- Data Frames
- Factors
- Manipulació de Dades amb dplyr
- Manipulació de Cadenes
Mòdul 3: Visualització de Dades
- Introducció a la Visualització de Dades
- Gràfics Base de R
- Conceptes Bàsics de ggplot2
- ggplot2 Avançat
- Visualitzacions Interactives amb plotly
Mòdul 4: Anàlisi Estadística
- Estadístiques Descriptives
- Distribucions de Probabilitat
- Proves d'Hipòtesi
- Correlació i Regressió
- ANOVA i Proves de Chi-Cuadrat
Mòdul 5: Gestió Avançada de Dades
- Gestió de Dates i Hores
- Reestructuració de Dades
- Treballant amb Grans Conjunts de Dades
- Web Scraping
- APIs i JSON
Mòdul 6: Conceptes Avançats de Programació
- Escriure Funcions
- Depuració i Gestió d'Errors
- Programació Orientada a Objectes en R
- Programació Funcional
- Computació Paral·lela
Mòdul 7: Aprenentatge Automàtic amb R
- Introducció a l'Aprenentatge Automàtic
- Preprocessament de Dades
- Aprenentatge Supervisat
- Aprenentatge No Supervisat
- Avaluació i Ajust de Models
Mòdul 8: Temes Especialitzats
- Anàlisi de Sèries Temporals
- Anàlisi de Dades Espacials
- Mineria de Text i Processament del Llenguatge Natural
- Bioinformàtica amb R
- Anàlisi de Dades Financeres