La manipulació de cadenes és una habilitat fonamental en la programació amb R, especialment quan es treballa amb dades textuals. En aquest tema, aprendrem a treballar amb cadenes de text utilitzant funcions bàsiques i paquets especialitzats com stringr.

Continguts

Introducció a les Cadenes en R

En R, les cadenes de text es representen com a vectors de caràcters. Podem crear cadenes utilitzant cometes simples o dobles.

# Creació de cadenes
cadena1 <- "Hola, món!"
cadena2 <- 'Això és una cadena en R'

Funcions Bàsiques per Manipular Cadenes

Concatenació de Cadenes

La funció paste() i paste0() s'utilitzen per concatenar cadenes.

# Concatenació amb espai
cadena3 <- paste("Hola", "món")
print(cadena3)  # "Hola món"

# Concatenació sense espai
cadena4 <- paste0("Hola", "món")
print(cadena4)  # "Holamón"

Longitud de la Cadena

La funció nchar() retorna la longitud d'una cadena.

# Longitud de la cadena
longitud <- nchar(cadena1)
print(longitud)  # 10

Subcadenes

La funció substr() s'utilitza per extreure subcadenes.

# Extreure subcadena
subcadena <- substr(cadena1, 1, 4)
print(subcadena)  # "Hola"

Substitució de Text

La funció sub() i gsub() s'utilitzen per substituir text dins d'una cadena.

# Substituir la primera ocurrència
cadena5 <- sub("món", "R", cadena1)
print(cadena5)  # "Hola, R!"

# Substituir totes les ocurrències
cadena6 <- gsub("o", "0", cadena1)
print(cadena6)  # "H0la, m0n!"

Manipulació Avançada amb stringr

El paquet stringr proporciona funcions més avançades i fàcils d'utilitzar per a la manipulació de cadenes.

Instal·lació i Càrrega del Paquet

# Instal·lació del paquet stringr
install.packages("stringr")

# Càrrega del paquet
library(stringr)

Funcions Principals de stringr

str_length()

Retorna la longitud de la cadena.

# Longitud de la cadena
longitud <- str_length(cadena1)
print(longitud)  # 10

str_sub()

Extreu subcadenes.

# Extreure subcadena
subcadena <- str_sub(cadena1, 1, 4)
print(subcadena)  # "Hola"

str_replace() i str_replace_all()

Substitueix text dins d'una cadena.

# Substituir la primera ocurrència
cadena7 <- str_replace(cadena1, "món", "R")
print(cadena7)  # "Hola, R!"

# Substituir totes les ocurrències
cadena8 <- str_replace_all(cadena1, "o", "0")
print(cadena8)  # "H0la, m0n!"

str_c()

Concatena cadenes.

# Concatenació de cadenes
cadena9 <- str_c("Hola", "món", sep = " ")
print(cadena9)  # "Hola món"

Exercicis Pràctics

  1. Concatenació de Cadenes: Utilitza paste() per concatenar les cadenes "Aprendre" i "R" amb un espai entre elles.
  2. Longitud de la Cadena: Troba la longitud de la cadena "Manipulació de cadenes en R".
  3. Subcadena: Extreu la subcadena "cadenes" de la cadena "Manipulació de cadenes en R".
  4. Substitució de Text: Substitueix totes les ocurrències de la lletra "a" per "@" en la cadena "Manipulació de cadenes en R".
  5. Manipulació amb stringr: Utilitza str_replace_all() per substituir totes les ocurrències de "e" per "3" en la cadena "Manipulació de cadenes en R".

Solucions

  1. Concatenació de Cadenes
resultat1 <- paste("Aprendre", "R")
print(resultat1)  # "Aprendre R"
  1. Longitud de la Cadena
cadena <- "Manipulació de cadenes en R"
resultat2 <- nchar(cadena)
print(resultat2)  # 27
  1. Subcadena
resultat3 <- substr(cadena, 14, 20)
print(resultat3)  # "cadenes"
  1. Substitució de Text
resultat4 <- gsub("a", "@", cadena)
print(resultat4)  # "M@nipu1@ció de c@denes en R"
  1. Manipulació amb stringr
library(stringr)
resultat5 <- str_replace_all(cadena, "e", "3")
print(resultat5)  # "Manipulació d3 cad3n3s 3n R"

Conclusió

En aquesta secció, hem après a manipular cadenes de text en R utilitzant funcions bàsiques i el paquet stringr. Aquestes habilitats són essencials per treballar amb dades textuals i preparar-les per a anàlisis més avançades. En el següent mòdul, explorarem la visualització de dades, una part crucial per comunicar els resultats de les nostres anàlisis.

Programació en R: De Principiant a Avançat

Mòdul 1: Introducció a R

Mòdul 2: Manipulació de Dades

Mòdul 3: Visualització de Dades

Mòdul 4: Anàlisi Estadística

Mòdul 5: Gestió Avançada de Dades

Mòdul 6: Conceptes Avançats de Programació

Mòdul 7: Aprenentatge Automàtic amb R

Mòdul 8: Temes Especialitzats

Mòdul 9: Projecte i Estudis de Cas

© Copyright 2024. Tots els drets reservats