La manipulació de cadenes és una habilitat fonamental en la programació amb R, especialment quan es treballa amb dades textuals. En aquest tema, aprendrem a treballar amb cadenes de text utilitzant funcions bàsiques i paquets especialitzats com stringr
.
Continguts
Introducció a les Cadenes en R
En R, les cadenes de text es representen com a vectors de caràcters. Podem crear cadenes utilitzant cometes simples o dobles.
Funcions Bàsiques per Manipular Cadenes
Concatenació de Cadenes
La funció paste()
i paste0()
s'utilitzen per concatenar cadenes.
# Concatenació amb espai cadena3 <- paste("Hola", "món") print(cadena3) # "Hola món" # Concatenació sense espai cadena4 <- paste0("Hola", "món") print(cadena4) # "Holamón"
Longitud de la Cadena
La funció nchar()
retorna la longitud d'una cadena.
Subcadenes
La funció substr()
s'utilitza per extreure subcadenes.
Substitució de Text
La funció sub()
i gsub()
s'utilitzen per substituir text dins d'una cadena.
# Substituir la primera ocurrència cadena5 <- sub("món", "R", cadena1) print(cadena5) # "Hola, R!" # Substituir totes les ocurrències cadena6 <- gsub("o", "0", cadena1) print(cadena6) # "H0la, m0n!"
Manipulació Avançada amb stringr
El paquet stringr
proporciona funcions més avançades i fàcils d'utilitzar per a la manipulació de cadenes.
Instal·lació i Càrrega del Paquet
Funcions Principals de stringr
str_length()
Retorna la longitud de la cadena.
str_sub()
Extreu subcadenes.
str_replace() i str_replace_all()
Substitueix text dins d'una cadena.
# Substituir la primera ocurrència cadena7 <- str_replace(cadena1, "món", "R") print(cadena7) # "Hola, R!" # Substituir totes les ocurrències cadena8 <- str_replace_all(cadena1, "o", "0") print(cadena8) # "H0la, m0n!"
str_c()
Concatena cadenes.
Exercicis Pràctics
- Concatenació de Cadenes: Utilitza
paste()
per concatenar les cadenes"Aprendre"
i"R"
amb un espai entre elles. - Longitud de la Cadena: Troba la longitud de la cadena
"Manipulació de cadenes en R"
. - Subcadena: Extreu la subcadena
"cadenes"
de la cadena"Manipulació de cadenes en R"
. - Substitució de Text: Substitueix totes les ocurrències de la lletra
"a"
per"@"
en la cadena"Manipulació de cadenes en R"
. - Manipulació amb stringr: Utilitza
str_replace_all()
per substituir totes les ocurrències de"e"
per"3"
en la cadena"Manipulació de cadenes en R"
.
Solucions
- Concatenació de Cadenes
- Longitud de la Cadena
- Subcadena
- Substitució de Text
- Manipulació amb stringr
library(stringr) resultat5 <- str_replace_all(cadena, "e", "3") print(resultat5) # "Manipulació d3 cad3n3s 3n R"
Conclusió
En aquesta secció, hem après a manipular cadenes de text en R utilitzant funcions bàsiques i el paquet stringr
. Aquestes habilitats són essencials per treballar amb dades textuals i preparar-les per a anàlisis més avançades. En el següent mòdul, explorarem la visualització de dades, una part crucial per comunicar els resultats de les nostres anàlisis.
Programació en R: De Principiant a Avançat
Mòdul 1: Introducció a R
- Introducció a R i RStudio
- Sintaxi Bàsica de R
- Tipus de Dades i Estructures
- Operacions i Funcions Bàsiques
- Importació i Exportació de Dades
Mòdul 2: Manipulació de Dades
- Vectors i Llistes
- Matrius i Arrays
- Data Frames
- Factors
- Manipulació de Dades amb dplyr
- Manipulació de Cadenes
Mòdul 3: Visualització de Dades
- Introducció a la Visualització de Dades
- Gràfics Base de R
- Conceptes Bàsics de ggplot2
- ggplot2 Avançat
- Visualitzacions Interactives amb plotly
Mòdul 4: Anàlisi Estadística
- Estadístiques Descriptives
- Distribucions de Probabilitat
- Proves d'Hipòtesi
- Correlació i Regressió
- ANOVA i Proves de Chi-Cuadrat
Mòdul 5: Gestió Avançada de Dades
- Gestió de Dates i Hores
- Reestructuració de Dades
- Treballant amb Grans Conjunts de Dades
- Web Scraping
- APIs i JSON
Mòdul 6: Conceptes Avançats de Programació
- Escriure Funcions
- Depuració i Gestió d'Errors
- Programació Orientada a Objectes en R
- Programació Funcional
- Computació Paral·lela
Mòdul 7: Aprenentatge Automàtic amb R
- Introducció a l'Aprenentatge Automàtic
- Preprocessament de Dades
- Aprenentatge Supervisat
- Aprenentatge No Supervisat
- Avaluació i Ajust de Models
Mòdul 8: Temes Especialitzats
- Anàlisi de Sèries Temporals
- Anàlisi de Dades Espacials
- Mineria de Text i Processament del Llenguatge Natural
- Bioinformàtica amb R
- Anàlisi de Dades Financeres