La neteja de dades és un pas crucial en l'anàlisi de dades, ja que garanteix que les dades utilitzades siguin precises, coherents i útils per a la visualització i l'anàlisi. En aquest tema, aprendrem diverses tècniques per netejar dades utilitzant Tableau.
Objectius d'aprenentatge
- Comprendre la importància de la neteja de dades.
- Aprendre a identificar i corregir dades mancants o incorrectes.
- Utilitzar funcions de Tableau per transformar i netejar dades.
- Importància de la neteja de dades
Abans de començar amb les tècniques específiques, és important entendre per què la neteja de dades és essencial:
- Precisió: Dades netes garanteixen que les anàlisis i visualitzacions siguin precises.
- Coherència: Dades coherents permeten comparacions i anàlisis més fàcils.
- Utilitat: Dades ben netejades són més fàcils d'interpretar i utilitzar.
- Identificació de dades mancants o incorrectes
Dades mancants
Les dades mancants poden aparèixer com a cel·les buides o valors nuls. Per identificar-les:
- Visualització de dades: Utilitza gràfics i taules per identificar fàcilment les cel·les buides.
- Filtres: Aplica filtres per mostrar només les files amb valors nuls.
Dades incorrectes
Les dades incorrectes poden incloure valors fora de rang, errors tipogràfics o formats inconsistents. Per identificar-les:
- Resums estadístics: Utilitza resums estadístics per detectar valors fora de rang.
- Visualització de distribucions: Utilitza histogrames o gràfics de dispersió per identificar valors anòmals.
- Neteja de dades en Tableau
3.1. Reemplaçar valors nuls
Per reemplaçar valors nuls amb un valor específic:
- Crea un camp calculat:
IFNULL([Camp], "Valor de reemplaçament")
- Aplica el camp calculat a la teva visualització.
3.2. Filtrar valors nuls
Per eliminar files amb valors nuls:
- Afegeix un filtre al camp que conté valors nuls.
- Selecciona "No és nul" per eliminar les files amb valors nuls.
3.3. Corregir dades incorrectes
Per corregir dades incorrectes, pots utilitzar camps calculats per transformar els valors:
- Crea un camp calculat per corregir errors tipogràfics:
IF [Camp] = "Error" THEN "Correcte" ELSE [Camp] END
- Aplica el camp calculat a la teva visualització.
3.4. Unificar formats
Per unificar formats de dades, pots utilitzar funcions de Tableau:
- Funcions de text: Per exemple,
UPPER([Camp])
per convertir tot el text a majúscules. - Funcions de data: Per exemple,
DATEPARSE("dd/MM/yyyy", [Camp])
per convertir una cadena a una data.
- Exercicis pràctics
Exercici 1: Reemplaçar valors nuls
- Crea un camp calculat que reemplaça els valors nuls del camp
Vendes
amb 0.IFNULL([Vendes], 0)
- Aplica el camp calculat a una taula per veure els resultats.
Exercici 2: Corregir errors tipogràfics
- Crea un camp calculat que corregeix els errors tipogràfics en el camp
Categoria
:IF [Categoria] = "Electrònica" THEN "Electrònica" ELSE [Categoria] END
- Aplica el camp calculat a una visualització de barres per veure els resultats.
Exercici 3: Unificar formats de data
- Crea un camp calculat que converteix el camp
Data
al formatdd/MM/yyyy
:DATEPARSE("dd/MM/yyyy", [Data])
- Aplica el camp calculat a una visualització de línies per veure els resultats.
- Resum
En aquesta secció, hem après la importància de la neteja de dades i diverses tècniques per identificar i corregir dades mancants o incorrectes utilitzant Tableau. Hem vist com reemplaçar valors nuls, corregir errors tipogràfics i unificar formats de dades. Aquestes tècniques són essencials per garantir que les nostres anàlisis i visualitzacions siguin precises i útils.
En el següent mòdul, explorarem tècniques avançades d'anàlisi, incloent predicció i anàlisi estadística.
Curs de Tableau
Mòdul 1: Introducció a Tableau
- Què és Tableau?
- Instal·lant Tableau
- Visió general de la interfície de Tableau
- Connectant-se a fonts de dades
- Tipus i estructures de dades bàsiques
Mòdul 2: Tècniques bàsiques de visualització
- Creant la teva primera visualització
- Utilitzant marques i targetes
- Construint gràfics bàsics
- Filtrant dades
- Ordenant i agrupant dades
Mòdul 3: Tècniques de visualització intermèdies
- Utilitzant camps calculats
- Creant gràfics de doble eix
- Utilitzant paràmetres
- Creant mapes
- Utilitzant càlculs de taula
Mòdul 4: Tècniques avançades de visualització
- Tipus de gràfics avançats
- Utilitzant expressions LOD
- Creant quadres de comandament
- Accions de quadre de comandament
- Explicant històries amb dades
Mòdul 5: Preparació i transformació de dades
Mòdul 6: Anàlisi avançada
Mòdul 7: Optimització del rendiment
- Optimitzant el rendiment del llibre de treball
- Extractes vs Connexions en viu
- Reduint els temps de càrrega
- Gravació del rendiment
- Millors pràctiques per al rendiment
Mòdul 8: Tableau Server i Online
- Introducció a Tableau Server
- Publicant llibres de treball
- Gestionant permisos
- Programant extractes
- Col·laborant amb Tableau Online