L'anàlisi estadística és una part fonamental de la investigació de mercat, ja que permet transformar les dades recollides en informació útil per a la presa de decisions. Aquest tema cobreix els conceptes bàsics d'anàlisi estadística, les tècniques més utilitzades i exemples pràctics per aplicar aquests coneixements.

Objectius d'Aprenentatge

Al final d'aquest tema, els estudiants seran capaços de:

  1. Comprendre els conceptes bàsics d'estadística descriptiva i inferencial.
  2. Aplicar tècniques estadístiques per analitzar dades de mercat.
  3. Interpretar els resultats de l'anàlisi estadística per prendre decisions informades.

Conceptes Bàsics d'Estadística

Estadística Descriptiva

L'estadística descriptiva s'utilitza per resumir i descriure les característiques principals d'un conjunt de dades. Els conceptes clau inclouen:

  • Mitjana: La suma de tots els valors dividida pel nombre de valors.
  • Mediana: El valor central quan els valors estan ordenats.
  • Moda: El valor que apareix amb més freqüència.
  • Desviació Estàndard: Una mesura de la dispersió dels valors respecte a la mitjana.
  • Rang: La diferència entre el valor màxim i el valor mínim.

Exemple:

import numpy as np

dades = [10, 20, 20, 40, 50]
mitjana = np.mean(dades)
mediana = np.median(dades)
moda = max(set(dades), key=dades.count)
desviacio_estandard = np.std(dades)
rang = np.ptp(dades)

print(f"Mitjana: {mitjana}")
print(f"Mediana: {mediana}")
print(f"Moda: {moda}")
print(f"Desviació Estàndard: {desviacio_estandard}")
print(f"Rang: {rang}")

Estadística Inferencial

L'estadística inferencial permet fer prediccions o inferències sobre una població a partir d'una mostra. Els conceptes clau inclouen:

  • Estimació: Utilitzar dades de la mostra per estimar paràmetres de la població.
  • Prova d'Hipòtesis: Determinar si hi ha suficient evidència per acceptar o rebutjar una hipòtesi.
  • Interval de Confiança: Un rang de valors dins del qual es troba un paràmetre de la població amb una certa probabilitat.

Exemple:

import scipy.stats as stats

# Dades de la mostra
mostra = [10, 20, 20, 40, 50]
mitjana_mostra = np.mean(mostra)
desviacio_estandard_mostra = np.std(mostra, ddof=1)
n = len(mostra)

# Interval de confiança del 95%
interval_confiança = stats.t.interval(0.95, n-1, loc=mitjana_mostra, scale=desviacio_estandard_mostra/np.sqrt(n))

print(f"Interval de Confiança del 95%: {interval_confiança}")

Tècniques d'Anàlisi Estadística

Anàlisi de Regressió

L'anàlisi de regressió s'utilitza per comprendre la relació entre una variable dependent i una o més variables independents.

Exemple de Regressió Lineal:

import statsmodels.api as sm

# Dades d'exemple
X = [1, 2, 3, 4, 5]
Y = [2, 4, 5, 4, 5]

# Afegir una constant per al terme independent
X = sm.add_constant(X)

# Ajustar el model de regressió
model = sm.OLS(Y, X).fit()
resultats = model.summary()

print(resultats)

Anàlisi de Correlació

L'anàlisi de correlació mesura la força i la direcció de la relació lineal entre dues variables.

Exemple:

from scipy.stats import pearsonr

# Dades d'exemple
X = [1, 2, 3, 4, 5]
Y = [2, 4, 5, 4, 5]

# Coeficient de correlació de Pearson
coeficient_correlacio, p_valor = pearsonr(X, Y)

print(f"Coeficient de Correlació: {coeficient_correlacio}")
print(f"P-valor: {p_valor}")

Exercicis Pràctics

Exercici 1: Estadística Descriptiva

Utilitza el següent conjunt de dades per calcular la mitjana, la mediana, la moda, la desviació estàndard i el rang:

dades = [12, 15, 12, 18, 19, 20, 21, 22, 23, 24]

Solució:

dades = [12, 15, 12, 18, 19, 20, 21, 22, 23, 24]
mitjana = np.mean(dades)
mediana = np.median(dades)
moda = max(set(dades), key=dades.count)
desviacio_estandard = np.std(dades)
rang = np.ptp(dades)

print(f"Mitjana: {mitjana}")
print(f"Mediana: {mediana}")
print(f"Moda: {moda}")
print(f"Desviació Estàndard: {desviacio_estandard}")
print(f"Rang: {rang}")

Exercici 2: Anàlisi de Regressió

Utilitza les següents dades per ajustar un model de regressió lineal i interpretar els resultats:

X = [1, 2, 3, 4, 5]
Y = [3, 4, 2, 5, 6]

Solució:

X = [1, 2, 3, 4, 5]
Y = [3, 4, 2, 5, 6]

X = sm.add_constant(X)
model = sm.OLS(Y, X).fit()
resultats = model.summary()

print(resultats)

Errors Comuns i Consells

  • No comprovar les assumpcions del model: Assegura't que les dades compleixen les assumpcions del model estadístic que estàs utilitzant.
  • Confondre correlació amb causalitat: Una correlació entre dues variables no implica necessàriament que una causi l'altra.
  • No considerar la mida de la mostra: Les conclusions basades en mostres petites poden no ser fiables.

Resum

En aquesta secció, hem cobert els conceptes bàsics d'estadística descriptiva i inferencial, així com tècniques específiques com l'anàlisi de regressió i la correlació. Hem proporcionat exemples pràctics i exercicis per reforçar els conceptes apresos. Ara estàs preparat per aplicar aquestes tècniques en la teva pròpia investigació de mercat i prendre decisions informades basades en dades.

© Copyright 2024. Tots els drets reservats