En aquest tema, aprendrem com netejar i transformar dades utilitzant Power Query a Power BI. La neteja i transformació de dades és una part crucial del procés d'anàlisi de dades, ja que assegura que les dades siguin precises, coherents i adequades per a l'anàlisi.
Objectius del tema
- Comprendre la importància de la neteja i transformació de dades.
- Aprendre a utilitzar Power Query per netejar i transformar dades.
- Aplicar tècniques comunes de neteja de dades.
- Realitzar transformacions de dades per preparar-les per a l'anàlisi.
- Introducció a Power Query
Power Query és una eina de Power BI que permet connectar-se a diverses fonts de dades, netejar i transformar aquestes dades abans de carregar-les al model de dades de Power BI.
Característiques clau de Power Query
- Interfície intuïtiva: Permet realitzar transformacions de dades mitjançant una interfície gràfica d'usuari.
- Automatització: Les transformacions es poden automatitzar i repetir cada vegada que es refresquen les dades.
- Compatibilitat: Pot connectar-se a una àmplia varietat de fonts de dades, incloent-hi bases de dades, fitxers Excel, serveis web, etc.
- Neteja de dades
La neteja de dades implica identificar i corregir errors o inconsistències en les dades. A continuació, es presenten algunes tècniques comunes de neteja de dades.
2.1. Eliminació de valors nuls
Els valors nuls poden afectar l'anàlisi de dades. És important identificar i gestionar aquests valors.
Exemple pràctic
Suposem que tenim una taula amb dades de vendes i alguns registres tenen valors nuls a la columna "Quantitat".
Pas a pas
- Obre Power Query: A Power BI Desktop, fes clic a "Transformar dades" per obrir l'editor de Power Query.
- Selecciona la columna: Selecciona la columna "Quantitat".
- Elimina valors nuls: A la pestanya "Inici", fes clic a "Eliminar files" i selecciona "Eliminar files amb errors".
2.2. Substitució de valors
De vegades, és necessari substituir valors incorrectes o inconsistents per valors correctes.
Exemple pràctic
Suposem que tenim una taula amb dades de clients i alguns registres tenen "N/A" a la columna "País".
Pas a pas
- Selecciona la columna: Selecciona la columna "País".
- Substitueix valors: A la pestanya "Transformar", fes clic a "Substituir valors". Introdueix "N/A" com a valor a substituir i el valor correcte (per exemple, "Desconegut").
- Transformació de dades
La transformació de dades implica modificar les dades per adaptar-les a les necessitats de l'anàlisi. A continuació, es presenten algunes tècniques comunes de transformació de dades.
3.1. Filtratge de dades
El filtratge permet incloure o excloure registres basats en criteris específics.
Exemple pràctic
Suposem que tenim una taula amb dades de vendes i volem analitzar només les vendes realitzades el 2022.
Pas a pas
- Selecciona la columna: Selecciona la columna "Data de venda".
- Aplica un filtre: A la pestanya "Inici", fes clic a "Filtre de data" i selecciona "És igual a" i introdueix "2022".
3.2. Agrupació de dades
L'agrupació permet resumir dades agrupant registres basats en una o més columnes.
Exemple pràctic
Suposem que tenim una taula amb dades de vendes i volem calcular el total de vendes per cada producte.
Pas a pas
- Selecciona la columna: Selecciona la columna "Producte".
- Agrupa per columna: A la pestanya "Transformar", fes clic a "Agrupar per". Selecciona "Producte" com a columna d'agrupació i "Total de vendes" com a operació d'agregació (suma).
Exercicis pràctics
Exercici 1: Neteja de dades
- Importa una taula amb dades de clients que conté valors nuls a la columna "Edat".
- Elimina els registres amb valors nuls a la columna "Edat".
Exercici 2: Transformació de dades
- Importa una taula amb dades de vendes que conté una columna "Data de venda".
- Filtra les dades per incloure només les vendes realitzades el 2021.
- Agrupa les dades per "Producte" i calcula el total de vendes per cada producte.
Solucions als exercicis
Solució a l'Exercici 1
- Importa la taula: A Power BI Desktop, fes clic a "Obtenir dades" i selecciona la font de dades.
- Elimina valors nuls: A Power Query, selecciona la columna "Edat", fes clic a "Eliminar files" i selecciona "Eliminar files amb errors".
Solució a l'Exercici 2
- Importa la taula: A Power BI Desktop, fes clic a "Obtenir dades" i selecciona la font de dades.
- Filtra les dades: A Power Query, selecciona la columna "Data de venda", fes clic a "Filtre de data" i selecciona "És igual a" i introdueix "2021".
- Agrupa les dades: A Power Query, selecciona la columna "Producte", fes clic a "Agrupar per" i selecciona "Producte" com a columna d'agrupació i "Total de vendes" com a operació d'agregació (suma).
Resum
En aquest tema, hem après la importància de la neteja i transformació de dades i com utilitzar Power Query per realitzar aquestes tasques. Hem explorat tècniques comunes de neteja de dades, com l'eliminació de valors nuls i la substitució de valors, així com tècniques de transformació de dades, com el filtratge i l'agrupació. A més, hem practicat aquestes tècniques amb exercicis pràctics per reforçar els conceptes apresos.
Curs de Power BI
Mòdul 1: Introducció a Power BI
- Què és Power BI?
- Instal·lant Power BI Desktop
- Visió general de la interfície de Power BI
- Connectant-se a fonts de dades
Mòdul 2: Transformació i modelatge de dades
- Introducció a Power Query
- Neteja i transformació de dades
- Creant relacions entre taules
- Millors pràctiques de modelatge de dades
Mòdul 3: Visualització de dades
- Creant visualitzacions bàsiques
- Utilitzant filtres i segmentadors
- Personalitzant visuals
- Creant i utilitzant jerarquies
Mòdul 4: Anàlisi avançada de dades
- Introducció a DAX
- Creant columnes calculades i mesures
- Funcions d'intel·ligència temporal
- Funcions avançades de DAX
Mòdul 5: Informes i quadres de comandament
- Dissenyant informes efectius
- Creant quadres de comandament interactius
- Utilitzant marcadors i botons
- Publicant i compartint informes
Mòdul 6: Servei de Power BI
- Introducció al servei de Power BI
- Treballant amb espais de treball
- Creant i gestionant fluxos de dades
- Programant l'actualització de dades
Mòdul 7: Administració i seguretat de Power BI
- Gestionant permisos i rols
- Millors pràctiques de seguretat de dades
- Monitorització i auditoria
- Governança de Power BI