Introducció
Les proves d'hipòtesis són una eina fonamental en l'estadística inferencial que permeten als investigadors prendre decisions sobre poblacions basant-se en mostres de dades. Aquest procés implica formular una hipòtesi nul·la i una hipòtesi alternativa, i utilitzar dades mostral per determinar quina hipòtesi és més probable.
Conceptes Clau
Hipòtesi Nul·la (H0)
- Definició: És una afirmació que no hi ha efecte o diferència. És la hipòtesi que es vol posar a prova.
- Exemple: "El nou medicament no té efecte sobre la pressió arterial."
Hipòtesi Alternativa (H1)
- Definició: És una afirmació que hi ha un efecte o diferència. És la hipòtesi que es considera si es rebutja la hipòtesi nul·la.
- Exemple: "El nou medicament redueix la pressió arterial."
Nivell de Significació (α)
- Definició: És la probabilitat de rebutjar la hipòtesi nul·la quan és certa. És un llindar predefinit per a la decisió.
- Valor Comú: 0.05 (5%)
Estadístic de Prova
- Definició: És una mesura calculada a partir de les dades mostral que s'utilitza per decidir si es rebutja la hipòtesi nul·la.
- Exemple: z, t, χ², F
Valor p
- Definició: És la probabilitat de trobar un valor de l'estadístic de prova igual o més extrem que el valor observat, assumint que la hipòtesi nul·la és certa.
- Decisió: Si el valor p és menor que α, es rebutja la hipòtesi nul·la.
Procediment de Prova d'Hipòtesis
-
Formular les Hipòtesis:
- H0: Hipòtesi nul·la
- H1: Hipòtesi alternativa
-
Seleccionar el Nivell de Significació (α):
- Comunament 0.05, però pot variar segons el context.
-
Recollir i Analitzar les Dades:
- Calcular l'estadístic de prova corresponent.
-
Determinar el Valor p:
- Comparar el valor p amb α.
-
Prendre una Decisió:
- Si valor p ≤ α, rebutjar H0.
- Si valor p > α, no rebutjar H0.
-
Interpretar els Resultats:
- Explicar el significat de la decisió en el context de l'estudi.
Exemple Pràctic
Exemple 1: Prova z per a la Mitjana
Situació: Una empresa de begudes vol saber si la mitjana de contingut de sucre en les seves ampolles és diferent de 10 grams.
-
Formular les Hipòtesis:
- H0: μ = 10 grams
- H1: μ ≠ 10 grams
-
Seleccionar el Nivell de Significació (α):
- α = 0.05
-
Recollir i Analitzar les Dades:
- Mostra de 30 ampolles, mitjana mostral = 10.5 grams, desviació estàndard = 1 gram.
-
Calcular l'Estadístic de Prova:
import scipy.stats as stats import math mu = 10 x_bar = 10.5 s = 1 n = 30 z = (x_bar - mu) / (s / math.sqrt(n)) p_value = 2 * (1 - stats.norm.cdf(abs(z))) print(f'Estadístic de prova z: {z}') print(f'Valor p: {p_value}')
Resultat:
- Estadístic de prova z: 2.74
- Valor p: 0.0062
-
Prendre una Decisió:
- Com que el valor p (0.0062) és menor que α (0.05), rebutgem H0.
-
Interpretar els Resultats:
- Hi ha evidència suficient per afirmar que la mitjana de contingut de sucre en les ampolles és diferent de 10 grams.
Exercicis Pràctics
Exercici 1: Prova t per a la Mitjana
Situació: Un investigador vol saber si la mitjana de temps de resposta d'un nou sistema és menor que 5 segons. Es recullen dades de 25 proves amb una mitjana mostral de 4.8 segons i una desviació estàndard de 0.3 segons.
- Formular les hipòtesis.
- Seleccionar el nivell de significació (α).
- Calcular l'estadístic de prova t.
- Determinar el valor p.
- Prendre una decisió.
- Interpretar els resultats.
Solució:
-
H0: μ = 5 segons, H1: μ < 5 segons
-
α = 0.05
-
Estadístic de prova t:
import scipy.stats as stats import math mu = 5 x_bar = 4.8 s = 0.3 n = 25 t = (x_bar - mu) / (s / math.sqrt(n)) p_value = stats.t.cdf(t, df=n-1) print(f'Estadístic de prova t: {t}') print(f'Valor p: {p_value}')
Resultat:
- Estadístic de prova t: -3.33
- Valor p: 0.0013
-
Com que el valor p (0.0013) és menor que α (0.05), rebutgem H0.
-
Hi ha evidència suficient per afirmar que la mitjana de temps de resposta del nou sistema és menor que 5 segons.
Errors Comuns i Consells
-
Error Comú: Confondre la hipòtesi nul·la amb la hipòtesi alternativa.
- Consell: Recorda que la hipòtesi nul·la és l'afirmació que es vol posar a prova i que normalment representa l'absència d'efecte o diferència.
-
Error Comú: No calcular correctament l'estadístic de prova.
- Consell: Assegura't d'utilitzar la fórmula correcta per a l'estadístic de prova segons el tipus de dades i la distribució.
-
Error Comú: Interpretar incorrectament el valor p.
- Consell: Recorda que el valor p és la probabilitat de trobar un valor de l'estadístic de prova igual o més extrem que el valor observat, assumint que la hipòtesi nul·la és certa.
Resum
En aquesta secció, hem après sobre les proves d'hipòtesis, incloent la formulació de les hipòtesi nul·la i alternativa, la selecció del nivell de significació, el càlcul de l'estadístic de prova i el valor p, i la presa de decisions basades en aquests valors. També hem vist un exemple pràctic i hem realitzat un exercici per reforçar els conceptes apresos.