Introducció
L'anàlisi estadística és una part fonamental de la ciència de dades i la visualització de dades. En aquest mòdul, aprendrem a utilitzar les eines estadístiques que ofereix Tableau per analitzar i interpretar dades de manera més profunda. Això inclou l'ús de mesures estadístiques bàsiques, així com tècniques més avançades com la regressió i l'anàlisi de correlació.
Conceptes clau
-
Mesures estadístiques bàsiques:
- Mitjana
- Mediana
- Moda
- Desviació estàndard
- Variància
-
Anàlisi de distribució:
- Histogrames
- Box plots
-
Correlació i regressió:
- Coeficient de correlació
- Regressió lineal
-
Proves estadístiques:
- Prova t
- ANOVA
Mesures estadístiques bàsiques
Mitjana, Mediana i Moda
Mitjana: La mitjana és el valor promig d'un conjunt de dades. Es calcula sumant tots els valors i dividint pel nombre de valors.
Mediana: La mediana és el valor central d'un conjunt de dades ordenades. Si el nombre de valors és parell, la mediana és la mitjana dels dos valors centrals.
Moda: La moda és el valor que apareix amb més freqüència en un conjunt de dades.
Desviació estàndard i Variància
Desviació estàndard: Mesura la quantitat de variació o dispersió d'un conjunt de dades. Una desviació estàndard baixa indica que els valors tendeixen a estar prop de la mitjana, mentre que una desviació estàndard alta indica que els valors estan més dispersos.
Variància: És el quadrat de la desviació estàndard i proporciona una mesura de la dispersió dels valors.
Anàlisi de distribució
Histogrames
Els histogrames són gràfics que mostren la distribució de dades contínues. En Tableau, podem crear un histograma seguint aquests passos:
- Connecta't a la teva font de dades.
- Arrossega el camp que vols analitzar a la prestatgeria de columnes.
- Selecciona "Histogram" des del menú de gràfics.
Box Plots
Els box plots són útils per visualitzar la distribució de dades i identificar valors atípics. Per crear un box plot en Tableau:
- Arrossega el camp que vols analitzar a la prestatgeria de files.
- Selecciona "Box Plot" des del menú de gràfics.
Correlació i regressió
Coeficient de correlació
El coeficient de correlació mesura la força i la direcció de la relació lineal entre dues variables. En Tableau, podem calcular el coeficient de correlació utilitzant càlculs de taula.
Regressió lineal
La regressió lineal és una tècnica per modelar la relació entre una variable dependent i una o més variables independents. En Tableau, podem afegir una línia de regressió a un gràfic de dispersió:
- Crea un gràfic de dispersió amb les variables que vols analitzar.
- Fes clic amb el botó dret a la gràfica i selecciona "Add Trend Line".
Proves estadístiques
Prova t
La prova t s'utilitza per determinar si hi ha una diferència significativa entre les mitjanes de dos grups. En Tableau, podem utilitzar càlculs personalitzats per realitzar una prova t.
ANOVA
L'ANOVA (Anàlisi de Variància) s'utilitza per comparar les mitjanes de tres o més grups. En Tableau, podem utilitzar càlculs personalitzats per realitzar una ANOVA.
Exercicis pràctics
Exercici 1: Creació d'un histograma
- Connecta't a la teva font de dades.
- Arrossega el camp "Sales" a la prestatgeria de columnes.
- Selecciona "Histogram" des del menú de gràfics.
- Interpreta la distribució de les vendes.
Exercici 2: Anàlisi de correlació
- Crea un gràfic de dispersió amb les variables "Sales" i "Profit".
- Afegeix una línia de regressió.
- Calcula el coeficient de correlació utilitzant càlculs de taula.
- Interpreta la relació entre les vendes i els beneficis.
Solucions
Solució a l'Exercici 1
- Connecta't a la teva font de dades.
- Arrossega el camp "Sales" a la prestatgeria de columnes.
- Selecciona "Histogram" des del menú de gràfics.
- La distribució de les vendes es pot interpretar observant la forma del histograma. Si la majoria de les vendes es concentren en un rang específic, això indica que les vendes són consistents en aquest rang.
Solució a l'Exercici 2
- Crea un gràfic de dispersió amb les variables "Sales" i "Profit".
- Afegeix una línia de regressió fent clic amb el botó dret a la gràfica i seleccionant "Add Trend Line".
- Calcula el coeficient de correlació utilitzant càlculs de taula:
WINDOW_CORR(SUM([Sales]), SUM([Profit]))
. - Interpreta la relació: Un coeficient de correlació proper a 1 indica una forta relació positiva, mentre que un coeficient proper a -1 indica una forta relació negativa.
Conclusió
En aquest mòdul, hem après a utilitzar diverses tècniques d'anàlisi estadística en Tableau per interpretar dades de manera més profunda. Hem cobert mesures estadístiques bàsiques, anàlisi de distribució, correlació i regressió, així com proves estadístiques. Aquestes eines ens permeten obtenir insights valuosos i prendre decisions informades basades en dades.
Curs de Tableau
Mòdul 1: Introducció a Tableau
- Què és Tableau?
- Instal·lant Tableau
- Visió general de la interfície de Tableau
- Connectant-se a fonts de dades
- Tipus i estructures de dades bàsiques
Mòdul 2: Tècniques bàsiques de visualització
- Creant la teva primera visualització
- Utilitzant marques i targetes
- Construint gràfics bàsics
- Filtrant dades
- Ordenant i agrupant dades
Mòdul 3: Tècniques de visualització intermèdies
- Utilitzant camps calculats
- Creant gràfics de doble eix
- Utilitzant paràmetres
- Creant mapes
- Utilitzant càlculs de taula
Mòdul 4: Tècniques avançades de visualització
- Tipus de gràfics avançats
- Utilitzant expressions LOD
- Creant quadres de comandament
- Accions de quadre de comandament
- Explicant històries amb dades
Mòdul 5: Preparació i transformació de dades
Mòdul 6: Anàlisi avançada
Mòdul 7: Optimització del rendiment
- Optimitzant el rendiment del llibre de treball
- Extractes vs Connexions en viu
- Reduint els temps de càrrega
- Gravació del rendiment
- Millors pràctiques per al rendiment
Mòdul 8: Tableau Server i Online
- Introducció a Tableau Server
- Publicant llibres de treball
- Gestionant permisos
- Programant extractes
- Col·laborant amb Tableau Online