Introducció

L'anàlisi descriptiu és el primer pas en el procés d'analítica de dades. Es tracta de resumir i visualitzar les dades per comprendre millor el seu comportament i identificar patrons. Aquest tipus d'anàlisi és fonamental per a la presa de decisions informades i per establir una base sòlida per a anàlisis més complexes, com l'anàlisi predictiu i prescriptiu.

Objectius de l'Anàlisi Descriptiu

  1. Resumir les dades: Proporcionar una visió general de les dades mitjançant estadístiques descriptives com la mitjana, la mediana, la moda, la desviació estàndard, etc.
  2. Identificar patrons: Detectar tendències, patrons i anomalies en les dades.
  3. Visualitzar les dades: Utilitzar gràfics i taules per representar les dades de manera clara i comprensible.
  4. Facilitar la presa de decisions: Proporcionar informació rellevant per a la presa de decisions basada en dades.

Estadístiques Descriptives

Mesures de Tendència Central

  • Mitjana: La suma de tots els valors dividida pel nombre de valors.
  • Mediana: El valor central en un conjunt de dades ordenat.
  • Moda: El valor que apareix amb més freqüència en un conjunt de dades.

Mesures de Dispersió

  • Rang: La diferència entre el valor màxim i el valor mínim.
  • Desviació Estàndard: Mesura de la quantitat de variació o dispersió dels valors.
  • Variança: La mitjana dels quadrats de les diferències entre cada valor i la mitjana.

Mesures de Posició

  • Percentils: Valors que divideixen un conjunt de dades en cent parts iguals.
  • Quartils: Valors que divideixen un conjunt de dades en quatre parts iguals.

Visualització de Dades

Tipus de Gràfics

  1. Gràfic de Barres: Utilitzat per comparar diferents categories.
  2. Histograma: Utilitzat per mostrar la distribució d'un conjunt de dades.
  3. Gràfic de Línies: Utilitzat per mostrar tendències al llarg del temps.
  4. Gràfic de Dispersió: Utilitzat per mostrar la relació entre dues variables.
  5. Gràfic de Pastís: Utilitzat per mostrar la proporció de cada categoria respecte al total.

Eines per a la Visualització de Dades

  • Microsoft Excel: Ofereix una àmplia gamma de gràfics i eines de visualització.
  • Tableau: Eina potent per a la creació de visualitzacions interactives.
  • Power BI: Eina de Microsoft per a la visualització i anàlisi de dades.
  • Google Data Studio: Eina gratuïta de Google per a la creació de dashboards interactius.

Exemple Pràctic

Dataset: Vendes de Productes

| Producte | Vendes | Mes |
|----------|--------|-----|
| A        | 100    | Jan |
| B        | 150    | Jan |
| A        | 120    | Feb |
| B        | 130    | Feb |
| A        | 140    | Mar |
| B        | 160    | Mar |

Pas 1: Càlcul de les Estadístiques Descriptives

  • Mitjana de Vendes per Producte:

    • Producte A: (100 + 120 + 140) / 3 = 120
    • Producte B: (150 + 130 + 160) / 3 = 146.67
  • Desviació Estàndard de Vendes per Producte:

    • Producte A: sqrt(((100-120)^2 + (120-120)^2 + (140-120)^2) / 3) = 16.33
    • Producte B: sqrt(((150-146.67)^2 + (130-146.67)^2 + (160-146.67)^2) / 3) = 12.47

Pas 2: Creació de Gràfics

Gràfic de Barres: Vendes per Producte

Producte | Vendes
---------|-------
A        | 360
B        | 440

Gràfic de Barres

Gràfic de Línies: Vendes Mensuals per Producte

Gràfic de Línies

Exercici Pràctic

Exercici 1: Càlcul de les Estadístiques Descriptives

Utilitzant el següent conjunt de dades, calcula la mitjana, la mediana, la moda, la desviació estàndard i el rang per a cada producte.

| Producte | Vendes | Mes |
|----------|--------|-----|
| C        | 200    | Jan |
| D        | 250    | Jan |
| C        | 220    | Feb |
| D        | 230    | Feb |
| C        | 240    | Mar |
| D        | 260    | Mar |

Solució

  • Mitjana de Vendes per Producte:

    • Producte C: (200 + 220 + 240) / 3 = 220
    • Producte D: (250 + 230 + 260) / 3 = 246.67
  • Mediana de Vendes per Producte:

    • Producte C: 220
    • Producte D: 250
  • Moda de Vendes per Producte:

    • Producte C: No hi ha moda (tots els valors són únics)
    • Producte D: No hi ha moda (tots els valors són únics)
  • Desviació Estàndard de Vendes per Producte:

    • Producte C: sqrt(((200-220)^2 + (220-220)^2 + (240-220)^2) / 3) = 16.33
    • Producte D: sqrt(((250-246.67)^2 + (230-246.67)^2 + (260-246.67)^2) / 3) = 12.47
  • Rang de Vendes per Producte:

    • Producte C: 240 - 200 = 40
    • Producte D: 260 - 230 = 30

Conclusió

L'anàlisi descriptiu és una eina poderosa per comprendre les dades i identificar patrons i tendències. Mitjançant l'ús d'estadístiques descriptives i visualitzacions, podem obtenir una visió clara i concisa de les dades, la qual cosa facilita la presa de decisions informades. En el proper mòdul, explorarem l'anàlisi predictiu, que ens permetrà fer prediccions basades en les dades històriques.

© Copyright 2024. Tots els drets reservats