L'anàlisi estadística és una part fonamental de la investigació de mercat, ja que permet transformar les dades recollides en informació útil per a la presa de decisions. Aquest tema cobreix els conceptes bàsics d'anàlisi estadística, les tècniques més utilitzades i exemples pràctics per aplicar aquests coneixements.
Objectius d'Aprenentatge
Al final d'aquest tema, els estudiants seran capaços de:
- Comprendre els conceptes bàsics d'estadística descriptiva i inferencial.
- Aplicar tècniques estadístiques per analitzar dades de mercat.
- Interpretar els resultats de l'anàlisi estadística per prendre decisions informades.
Conceptes Bàsics d'Estadística
Estadística Descriptiva
L'estadística descriptiva s'utilitza per resumir i descriure les característiques principals d'un conjunt de dades. Els conceptes clau inclouen:
- Mitjana: La suma de tots els valors dividida pel nombre de valors.
- Mediana: El valor central quan els valors estan ordenats.
- Moda: El valor que apareix amb més freqüència.
- Desviació Estàndard: Una mesura de la dispersió dels valors respecte a la mitjana.
- Rang: La diferència entre el valor màxim i el valor mínim.
Exemple:
import numpy as np dades = [10, 20, 20, 40, 50] mitjana = np.mean(dades) mediana = np.median(dades) moda = max(set(dades), key=dades.count) desviacio_estandard = np.std(dades) rang = np.ptp(dades) print(f"Mitjana: {mitjana}") print(f"Mediana: {mediana}") print(f"Moda: {moda}") print(f"Desviació Estàndard: {desviacio_estandard}") print(f"Rang: {rang}")
Estadística Inferencial
L'estadística inferencial permet fer prediccions o inferències sobre una població a partir d'una mostra. Els conceptes clau inclouen:
- Estimació: Utilitzar dades de la mostra per estimar paràmetres de la població.
- Prova d'Hipòtesis: Determinar si hi ha suficient evidència per acceptar o rebutjar una hipòtesi.
- Interval de Confiança: Un rang de valors dins del qual es troba un paràmetre de la població amb una certa probabilitat.
Exemple:
import scipy.stats as stats # Dades de la mostra mostra = [10, 20, 20, 40, 50] mitjana_mostra = np.mean(mostra) desviacio_estandard_mostra = np.std(mostra, ddof=1) n = len(mostra) # Interval de confiança del 95% interval_confiança = stats.t.interval(0.95, n-1, loc=mitjana_mostra, scale=desviacio_estandard_mostra/np.sqrt(n)) print(f"Interval de Confiança del 95%: {interval_confiança}")
Tècniques d'Anàlisi Estadística
Anàlisi de Regressió
L'anàlisi de regressió s'utilitza per comprendre la relació entre una variable dependent i una o més variables independents.
Exemple de Regressió Lineal:
import statsmodels.api as sm # Dades d'exemple X = [1, 2, 3, 4, 5] Y = [2, 4, 5, 4, 5] # Afegir una constant per al terme independent X = sm.add_constant(X) # Ajustar el model de regressió model = sm.OLS(Y, X).fit() resultats = model.summary() print(resultats)
Anàlisi de Correlació
L'anàlisi de correlació mesura la força i la direcció de la relació lineal entre dues variables.
Exemple:
from scipy.stats import pearsonr # Dades d'exemple X = [1, 2, 3, 4, 5] Y = [2, 4, 5, 4, 5] # Coeficient de correlació de Pearson coeficient_correlacio, p_valor = pearsonr(X, Y) print(f"Coeficient de Correlació: {coeficient_correlacio}") print(f"P-valor: {p_valor}")
Exercicis Pràctics
Exercici 1: Estadística Descriptiva
Utilitza el següent conjunt de dades per calcular la mitjana, la mediana, la moda, la desviació estàndard i el rang:
Solució:
dades = [12, 15, 12, 18, 19, 20, 21, 22, 23, 24] mitjana = np.mean(dades) mediana = np.median(dades) moda = max(set(dades), key=dades.count) desviacio_estandard = np.std(dades) rang = np.ptp(dades) print(f"Mitjana: {mitjana}") print(f"Mediana: {mediana}") print(f"Moda: {moda}") print(f"Desviació Estàndard: {desviacio_estandard}") print(f"Rang: {rang}")
Exercici 2: Anàlisi de Regressió
Utilitza les següents dades per ajustar un model de regressió lineal i interpretar els resultats:
Solució:
X = [1, 2, 3, 4, 5] Y = [3, 4, 2, 5, 6] X = sm.add_constant(X) model = sm.OLS(Y, X).fit() resultats = model.summary() print(resultats)
Errors Comuns i Consells
- No comprovar les assumpcions del model: Assegura't que les dades compleixen les assumpcions del model estadístic que estàs utilitzant.
- Confondre correlació amb causalitat: Una correlació entre dues variables no implica necessàriament que una causi l'altra.
- No considerar la mida de la mostra: Les conclusions basades en mostres petites poden no ser fiables.
Resum
En aquesta secció, hem cobert els conceptes bàsics d'estadística descriptiva i inferencial, així com tècniques específiques com l'anàlisi de regressió i la correlació. Hem proporcionat exemples pràctics i exercicis per reforçar els conceptes apresos. Ara estàs preparat per aplicar aquestes tècniques en la teva pròpia investigació de mercat i prendre decisions informades basades en dades.
Curs d'Investigació de Mercat
Mòdul 1: Introducció a la Investigació de Mercat
Mòdul 2: Disseny de la Investigació
Mòdul 3: Recollida de Dades
- Fonts de Dades Primàries i Secundàries
- Tècniques de Recollida de Dades
- Mostreig i Selecció de la Mostra