La neteja de dades és un pas crucial en l'anàlisi de dades, ja que garanteix que les dades utilitzades siguin precises, coherents i útils per a la visualització i l'anàlisi. En aquest tema, aprendrem diverses tècniques per netejar dades utilitzant Tableau.

Objectius d'aprenentatge

  • Comprendre la importància de la neteja de dades.
  • Aprendre a identificar i corregir dades mancants o incorrectes.
  • Utilitzar funcions de Tableau per transformar i netejar dades.

  1. Importància de la neteja de dades

Abans de començar amb les tècniques específiques, és important entendre per què la neteja de dades és essencial:

  • Precisió: Dades netes garanteixen que les anàlisis i visualitzacions siguin precises.
  • Coherència: Dades coherents permeten comparacions i anàlisis més fàcils.
  • Utilitat: Dades ben netejades són més fàcils d'interpretar i utilitzar.

  1. Identificació de dades mancants o incorrectes

Dades mancants

Les dades mancants poden aparèixer com a cel·les buides o valors nuls. Per identificar-les:

  • Visualització de dades: Utilitza gràfics i taules per identificar fàcilment les cel·les buides.
  • Filtres: Aplica filtres per mostrar només les files amb valors nuls.

Dades incorrectes

Les dades incorrectes poden incloure valors fora de rang, errors tipogràfics o formats inconsistents. Per identificar-les:

  • Resums estadístics: Utilitza resums estadístics per detectar valors fora de rang.
  • Visualització de distribucions: Utilitza histogrames o gràfics de dispersió per identificar valors anòmals.

  1. Neteja de dades en Tableau

3.1. Reemplaçar valors nuls

Per reemplaçar valors nuls amb un valor específic:

  1. Crea un camp calculat:
    IFNULL([Camp], "Valor de reemplaçament")
    
  2. Aplica el camp calculat a la teva visualització.

3.2. Filtrar valors nuls

Per eliminar files amb valors nuls:

  1. Afegeix un filtre al camp que conté valors nuls.
  2. Selecciona "No és nul" per eliminar les files amb valors nuls.

3.3. Corregir dades incorrectes

Per corregir dades incorrectes, pots utilitzar camps calculats per transformar els valors:

  1. Crea un camp calculat per corregir errors tipogràfics:
    IF [Camp] = "Error" THEN "Correcte" ELSE [Camp] END
    
  2. Aplica el camp calculat a la teva visualització.

3.4. Unificar formats

Per unificar formats de dades, pots utilitzar funcions de Tableau:

  • Funcions de text: Per exemple, UPPER([Camp]) per convertir tot el text a majúscules.
  • Funcions de data: Per exemple, DATEPARSE("dd/MM/yyyy", [Camp]) per convertir una cadena a una data.

  1. Exercicis pràctics

Exercici 1: Reemplaçar valors nuls

  1. Crea un camp calculat que reemplaça els valors nuls del camp Vendes amb 0.
    IFNULL([Vendes], 0)
    
  2. Aplica el camp calculat a una taula per veure els resultats.

Exercici 2: Corregir errors tipogràfics

  1. Crea un camp calculat que corregeix els errors tipogràfics en el camp Categoria:
    IF [Categoria] = "Electrònica" THEN "Electrònica" ELSE [Categoria] END
    
  2. Aplica el camp calculat a una visualització de barres per veure els resultats.

Exercici 3: Unificar formats de data

  1. Crea un camp calculat que converteix el camp Data al format dd/MM/yyyy:
    DATEPARSE("dd/MM/yyyy", [Data])
    
  2. Aplica el camp calculat a una visualització de línies per veure els resultats.

  1. Resum

En aquesta secció, hem après la importància de la neteja de dades i diverses tècniques per identificar i corregir dades mancants o incorrectes utilitzant Tableau. Hem vist com reemplaçar valors nuls, corregir errors tipogràfics i unificar formats de dades. Aquestes tècniques són essencials per garantir que les nostres anàlisis i visualitzacions siguin precises i útils.

En el següent mòdul, explorarem tècniques avançades d'anàlisi, incloent predicció i anàlisi estadística.

Curs de Tableau

Mòdul 1: Introducció a Tableau

Mòdul 2: Tècniques bàsiques de visualització

Mòdul 3: Tècniques de visualització intermèdies

Mòdul 4: Tècniques avançades de visualització

Mòdul 5: Preparació i transformació de dades

Mòdul 6: Anàlisi avançada

Mòdul 7: Optimització del rendiment

Mòdul 8: Tableau Server i Online

Mòdul 9: Projectes del món real

© Copyright 2024. Tots els drets reservats