En aquest tema, aprendrem com netejar i transformar dades utilitzant Power Query a Power BI. La neteja i transformació de dades és una part crucial del procés d'anàlisi de dades, ja que assegura que les dades siguin precises, coherents i adequades per a l'anàlisi.

Objectius del tema

  • Comprendre la importància de la neteja i transformació de dades.
  • Aprendre a utilitzar Power Query per netejar i transformar dades.
  • Aplicar tècniques comunes de neteja de dades.
  • Realitzar transformacions de dades per preparar-les per a l'anàlisi.

  1. Introducció a Power Query

Power Query és una eina de Power BI que permet connectar-se a diverses fonts de dades, netejar i transformar aquestes dades abans de carregar-les al model de dades de Power BI.

Característiques clau de Power Query

  • Interfície intuïtiva: Permet realitzar transformacions de dades mitjançant una interfície gràfica d'usuari.
  • Automatització: Les transformacions es poden automatitzar i repetir cada vegada que es refresquen les dades.
  • Compatibilitat: Pot connectar-se a una àmplia varietat de fonts de dades, incloent-hi bases de dades, fitxers Excel, serveis web, etc.

  1. Neteja de dades

La neteja de dades implica identificar i corregir errors o inconsistències en les dades. A continuació, es presenten algunes tècniques comunes de neteja de dades.

2.1. Eliminació de valors nuls

Els valors nuls poden afectar l'anàlisi de dades. És important identificar i gestionar aquests valors.

Exemple pràctic

Suposem que tenim una taula amb dades de vendes i alguns registres tenen valors nuls a la columna "Quantitat".

Pas a pas

  1. Obre Power Query: A Power BI Desktop, fes clic a "Transformar dades" per obrir l'editor de Power Query.
  2. Selecciona la columna: Selecciona la columna "Quantitat".
  3. Elimina valors nuls: A la pestanya "Inici", fes clic a "Eliminar files" i selecciona "Eliminar files amb errors".

2.2. Substitució de valors

De vegades, és necessari substituir valors incorrectes o inconsistents per valors correctes.

Exemple pràctic

Suposem que tenim una taula amb dades de clients i alguns registres tenen "N/A" a la columna "País".

Pas a pas

  1. Selecciona la columna: Selecciona la columna "País".
  2. Substitueix valors: A la pestanya "Transformar", fes clic a "Substituir valors". Introdueix "N/A" com a valor a substituir i el valor correcte (per exemple, "Desconegut").

  1. Transformació de dades

La transformació de dades implica modificar les dades per adaptar-les a les necessitats de l'anàlisi. A continuació, es presenten algunes tècniques comunes de transformació de dades.

3.1. Filtratge de dades

El filtratge permet incloure o excloure registres basats en criteris específics.

Exemple pràctic

Suposem que tenim una taula amb dades de vendes i volem analitzar només les vendes realitzades el 2022.

Pas a pas

  1. Selecciona la columna: Selecciona la columna "Data de venda".
  2. Aplica un filtre: A la pestanya "Inici", fes clic a "Filtre de data" i selecciona "És igual a" i introdueix "2022".

3.2. Agrupació de dades

L'agrupació permet resumir dades agrupant registres basats en una o més columnes.

Exemple pràctic

Suposem que tenim una taula amb dades de vendes i volem calcular el total de vendes per cada producte.

Pas a pas

  1. Selecciona la columna: Selecciona la columna "Producte".
  2. Agrupa per columna: A la pestanya "Transformar", fes clic a "Agrupar per". Selecciona "Producte" com a columna d'agrupació i "Total de vendes" com a operació d'agregació (suma).

Exercicis pràctics

Exercici 1: Neteja de dades

  1. Importa una taula amb dades de clients que conté valors nuls a la columna "Edat".
  2. Elimina els registres amb valors nuls a la columna "Edat".

Exercici 2: Transformació de dades

  1. Importa una taula amb dades de vendes que conté una columna "Data de venda".
  2. Filtra les dades per incloure només les vendes realitzades el 2021.
  3. Agrupa les dades per "Producte" i calcula el total de vendes per cada producte.

Solucions als exercicis

Solució a l'Exercici 1

  1. Importa la taula: A Power BI Desktop, fes clic a "Obtenir dades" i selecciona la font de dades.
  2. Elimina valors nuls: A Power Query, selecciona la columna "Edat", fes clic a "Eliminar files" i selecciona "Eliminar files amb errors".

Solució a l'Exercici 2

  1. Importa la taula: A Power BI Desktop, fes clic a "Obtenir dades" i selecciona la font de dades.
  2. Filtra les dades: A Power Query, selecciona la columna "Data de venda", fes clic a "Filtre de data" i selecciona "És igual a" i introdueix "2021".
  3. Agrupa les dades: A Power Query, selecciona la columna "Producte", fes clic a "Agrupar per" i selecciona "Producte" com a columna d'agrupació i "Total de vendes" com a operació d'agregació (suma).

Resum

En aquest tema, hem après la importància de la neteja i transformació de dades i com utilitzar Power Query per realitzar aquestes tasques. Hem explorat tècniques comunes de neteja de dades, com l'eliminació de valors nuls i la substitució de valors, així com tècniques de transformació de dades, com el filtratge i l'agrupació. A més, hem practicat aquestes tècniques amb exercicis pràctics per reforçar els conceptes apresos.

© Copyright 2024. Tots els drets reservats