Els factors són una estructura de dades molt important en R, especialment útil per treballar amb dades categòriques. Els factors permeten representar dades qualitatives, com ara colors, gèneres, o categories de productes, de manera eficient i amb menys errors.

Conceptes Clau

  1. Definició de Factors: Els factors són vectors que emmagatzemen dades categòriques i poden tenir un nombre limitat de valors únics, anomenats nivells.
  2. Creació de Factors: Utilitzem la funció factor() per crear factors a partir de vectors.
  3. Nivells de Factors: Els nivells són els valors únics que un factor pot prendre.
  4. Factors Ordenats: Els factors poden ser ordenats o no ordenats. Els factors ordenats tenen una relació d'ordre entre els seus nivells.

Creació de Factors

Exemple Bàsic

# Creació d'un vector de caràcters
colors <- c("vermell", "blau", "verd", "blau", "vermell", "verd")

# Convertir el vector de caràcters en un factor
colors_factor <- factor(colors)

# Mostrar el factor
print(colors_factor)

Explicació:

  • Hem creat un vector de caràcters anomenat colors.
  • Hem utilitzat la funció factor() per convertir aquest vector en un factor.
  • El resultat és un factor amb nivells "vermell", "blau" i "verd".

Especificar Nivells

# Especificar nivells en un ordre particular
colors_factor <- factor(colors, levels = c("blau", "verd", "vermell"))

# Mostrar el factor amb nivells especificats
print(colors_factor)

Explicació:

  • Hem especificat els nivells en un ordre particular utilitzant l'argument levels.

Factors Ordenats

# Creació d'un factor ordenat
sizes <- c("petit", "gran", "mitjà", "gran", "petit")
sizes_factor <- factor(sizes, levels = c("petit", "mitjà", "gran"), ordered = TRUE)

# Mostrar el factor ordenat
print(sizes_factor)

Explicació:

  • Hem creat un factor ordenat utilitzant l'argument ordered = TRUE.
  • Els nivells estan ordenats de "petit" a "gran".

Operacions amb Factors

Canviar Nivells

# Canviar els nivells d'un factor
levels(colors_factor) <- c("blau", "verd", "roig")

# Mostrar el factor amb els nivells canviats
print(colors_factor)

Explicació:

  • Hem canviat el nivell "vermell" a "roig" utilitzant l'assignació directa a levels().

Afegir Nivells

# Afegir un nou nivell a un factor
colors_factor <- factor(colors_factor, levels = c("blau", "verd", "roig", "groc"))

# Mostrar el factor amb el nou nivell afegit
print(colors_factor)

Explicació:

  • Hem afegit un nou nivell "groc" al factor utilitzant l'argument levels.

Exercicis Pràctics

Exercici 1: Creació de Factors

Enunciat: Crea un factor a partir del següent vector de caràcters que representa diferents tipus de fruites: c("poma", "plàtan", "taronja", "poma", "taronja", "plàtan"). Mostra el factor i els seus nivells.

Solució:

# Vector de caràcters
fruites <- c("poma", "plàtan", "taronja", "poma", "taronja", "plàtan")

# Convertir el vector en un factor
fruites_factor <- factor(fruites)

# Mostrar el factor i els seus nivells
print(fruites_factor)
print(levels(fruites_factor))

Exercici 2: Factors Ordenats

Enunciat: Crea un factor ordenat a partir del següent vector de caràcters que representa diferents nivells d'educació: c("primària", "secundària", "universitat", "primària", "universitat"). Els nivells han d'estar ordenats de "primària" a "universitat".

Solució:

# Vector de caràcters
educacio <- c("primària", "secundària", "universitat", "primària", "universitat")

# Convertir el vector en un factor ordenat
educacio_factor <- factor(educacio, levels = c("primària", "secundària", "universitat"), ordered = TRUE)

# Mostrar el factor ordenat
print(educacio_factor)

Errors Comuns i Consells

  1. Oblidar especificar els nivells: Si no especifiques els nivells, R els ordenarà alfabèticament per defecte, cosa que pot no ser el que vols.
  2. No utilitzar factors ordenats quan cal: Si les dades tenen un ordre inherent (com ara "petit", "mitjà", "gran"), assegura't de crear factors ordenats.
  3. Canviar nivells incorrectament: Quan canvies els nivells, assegura't que els nous nivells tinguin el mateix nombre d'elements que els nivells originals.

Resum

En aquesta secció, hem après què són els factors, com crear-los, com especificar i canviar els seus nivells, i com treballar amb factors ordenats. Els factors són essencials per treballar amb dades categòriques en R, i comprendre'ls bé és fonamental per a l'anàlisi de dades eficient.

Programació en R: De Principiant a Avançat

Mòdul 1: Introducció a R

Mòdul 2: Manipulació de Dades

Mòdul 3: Visualització de Dades

Mòdul 4: Anàlisi Estadística

Mòdul 5: Gestió Avançada de Dades

Mòdul 6: Conceptes Avançats de Programació

Mòdul 7: Aprenentatge Automàtic amb R

Mòdul 8: Temes Especialitzats

Mòdul 9: Projecte i Estudis de Cas

© Copyright 2024. Tots els drets reservats