Introducció

L'anàlisi estadística és una part fonamental de la ciència de dades i la visualització de dades. En aquest mòdul, aprendrem a utilitzar les eines estadístiques que ofereix Tableau per analitzar i interpretar dades de manera més profunda. Això inclou l'ús de mesures estadístiques bàsiques, així com tècniques més avançades com la regressió i l'anàlisi de correlació.

Conceptes clau

  1. Mesures estadístiques bàsiques:

    • Mitjana
    • Mediana
    • Moda
    • Desviació estàndard
    • Variància
  2. Anàlisi de distribució:

    • Histogrames
    • Box plots
  3. Correlació i regressió:

    • Coeficient de correlació
    • Regressió lineal
  4. Proves estadístiques:

    • Prova t
    • ANOVA

Mesures estadístiques bàsiques

Mitjana, Mediana i Moda

Mitjana: La mitjana és el valor promig d'un conjunt de dades. Es calcula sumant tots els valors i dividint pel nombre de valors.

Mitjana = (Sumatori de tots els valors) / (Nombre de valors)

Mediana: La mediana és el valor central d'un conjunt de dades ordenades. Si el nombre de valors és parell, la mediana és la mitjana dels dos valors centrals.

Moda: La moda és el valor que apareix amb més freqüència en un conjunt de dades.

Desviació estàndard i Variància

Desviació estàndard: Mesura la quantitat de variació o dispersió d'un conjunt de dades. Una desviació estàndard baixa indica que els valors tendeixen a estar prop de la mitjana, mentre que una desviació estàndard alta indica que els valors estan més dispersos.

Variància: És el quadrat de la desviació estàndard i proporciona una mesura de la dispersió dels valors.

Anàlisi de distribució

Histogrames

Els histogrames són gràfics que mostren la distribució de dades contínues. En Tableau, podem crear un histograma seguint aquests passos:

  1. Connecta't a la teva font de dades.
  2. Arrossega el camp que vols analitzar a la prestatgeria de columnes.
  3. Selecciona "Histogram" des del menú de gràfics.

Box Plots

Els box plots són útils per visualitzar la distribució de dades i identificar valors atípics. Per crear un box plot en Tableau:

  1. Arrossega el camp que vols analitzar a la prestatgeria de files.
  2. Selecciona "Box Plot" des del menú de gràfics.

Correlació i regressió

Coeficient de correlació

El coeficient de correlació mesura la força i la direcció de la relació lineal entre dues variables. En Tableau, podem calcular el coeficient de correlació utilitzant càlculs de taula.

Regressió lineal

La regressió lineal és una tècnica per modelar la relació entre una variable dependent i una o més variables independents. En Tableau, podem afegir una línia de regressió a un gràfic de dispersió:

  1. Crea un gràfic de dispersió amb les variables que vols analitzar.
  2. Fes clic amb el botó dret a la gràfica i selecciona "Add Trend Line".

Proves estadístiques

Prova t

La prova t s'utilitza per determinar si hi ha una diferència significativa entre les mitjanes de dos grups. En Tableau, podem utilitzar càlculs personalitzats per realitzar una prova t.

ANOVA

L'ANOVA (Anàlisi de Variància) s'utilitza per comparar les mitjanes de tres o més grups. En Tableau, podem utilitzar càlculs personalitzats per realitzar una ANOVA.

Exercicis pràctics

Exercici 1: Creació d'un histograma

  1. Connecta't a la teva font de dades.
  2. Arrossega el camp "Sales" a la prestatgeria de columnes.
  3. Selecciona "Histogram" des del menú de gràfics.
  4. Interpreta la distribució de les vendes.

Exercici 2: Anàlisi de correlació

  1. Crea un gràfic de dispersió amb les variables "Sales" i "Profit".
  2. Afegeix una línia de regressió.
  3. Calcula el coeficient de correlació utilitzant càlculs de taula.
  4. Interpreta la relació entre les vendes i els beneficis.

Solucions

Solució a l'Exercici 1

  1. Connecta't a la teva font de dades.
  2. Arrossega el camp "Sales" a la prestatgeria de columnes.
  3. Selecciona "Histogram" des del menú de gràfics.
  4. La distribució de les vendes es pot interpretar observant la forma del histograma. Si la majoria de les vendes es concentren en un rang específic, això indica que les vendes són consistents en aquest rang.

Solució a l'Exercici 2

  1. Crea un gràfic de dispersió amb les variables "Sales" i "Profit".
  2. Afegeix una línia de regressió fent clic amb el botó dret a la gràfica i seleccionant "Add Trend Line".
  3. Calcula el coeficient de correlació utilitzant càlculs de taula: WINDOW_CORR(SUM([Sales]), SUM([Profit])).
  4. Interpreta la relació: Un coeficient de correlació proper a 1 indica una forta relació positiva, mentre que un coeficient proper a -1 indica una forta relació negativa.

Conclusió

En aquest mòdul, hem après a utilitzar diverses tècniques d'anàlisi estadística en Tableau per interpretar dades de manera més profunda. Hem cobert mesures estadístiques bàsiques, anàlisi de distribució, correlació i regressió, així com proves estadístiques. Aquestes eines ens permeten obtenir insights valuosos i prendre decisions informades basades en dades.

Curs de Tableau

Mòdul 1: Introducció a Tableau

Mòdul 2: Tècniques bàsiques de visualització

Mòdul 3: Tècniques de visualització intermèdies

Mòdul 4: Tècniques avançades de visualització

Mòdul 5: Preparació i transformació de dades

Mòdul 6: Anàlisi avançada

Mòdul 7: Optimització del rendiment

Mòdul 8: Tableau Server i Online

Mòdul 9: Projectes del món real

© Copyright 2024. Tots els drets reservats