Els mètodes no paramètrics són tècniques estadístiques que no assumeixen una distribució específica per a les dades. Aquests mètodes són útils quan les dades no compleixen les assumpcions necessàries per als mètodes paramètrics, com la normalitat o la homogeneïtat de variàncies. En aquest tema, explorarem els conceptes clau, exemples i exercicis pràctics relacionats amb els mètodes no paramètrics.
Conceptes Clau
-
Definició de Mètodes No Paramètrics:
- Mètodes estadístics que no requereixen assumpcions sobre la distribució de les dades.
- Són útils per a dades ordinals, categòriques o quan les dades no compleixen les assumpcions de normalitat.
-
Avantatges dels Mètodes No Paramètrics:
- Flexibilitat en l'anàlisi de dades.
- Menys sensibles a valors atípics.
- Aplicables a petites mostres.
-
Desavantatges dels Mètodes No Paramètrics:
- Menys potència estadística en comparació amb els mètodes paramètrics.
- Pot ser més difícil d'interpretar.
Principals Mètodes No Paramètrics
- Prova de Mann-Whitney U
- Objectiu: Comparar dues mostres independents per determinar si provenen de la mateixa distribució.
- Assumpcions:
- Les mostres són independents.
- Les dades són ordinals o contínues.
Exemple de Codi en Python:
import scipy.stats as stats # Dades de dues mostres independents mostra1 = [12, 15, 14, 10, 13] mostra2 = [18, 20, 17, 19, 21] # Realitzar la prova de Mann-Whitney U resultat = stats.mannwhitneyu(mostra1, mostra2) print(f'Estadístic U: {resultat.statistic}') print(f'P-valor: {resultat.pvalue}')
- Prova de Wilcoxon
- Objectiu: Comparar dues mostres relacionades o aparellades.
- Assumpcions:
- Les mostres són aparellades.
- Les dades són ordinals o contínues.
Exemple de Codi en Python:
import scipy.stats as stats # Dades de dues mostres aparellades mostra1 = [12, 15, 14, 10, 13] mostra2 = [14, 16, 15, 11, 14] # Realitzar la prova de Wilcoxon resultat = stats.wilcoxon(mostra1, mostra2) print(f'Estadístic T: {resultat.statistic}') print(f'P-valor: {resultat.pvalue}')
- Prova de Kruskal-Wallis
- Objectiu: Comparar més de dues mostres independents.
- Assumpcions:
- Les mostres són independents.
- Les dades són ordinals o contínues.
Exemple de Codi en Python:
import scipy.stats as stats # Dades de tres mostres independents mostra1 = [12, 15, 14, 10, 13] mostra2 = [18, 20, 17, 19, 21] mostra3 = [22, 25, 24, 23, 26] # Realitzar la prova de Kruskal-Wallis resultat = stats.kruskal(mostra1, mostra2, mostra3) print(f'Estadístic H: {resultat.statistic}') print(f'P-valor: {resultat.pvalue}')
- Prova de Chi-quadrat
- Objectiu: Provar la independència entre dues variables categòriques.
- Assumpcions:
- Les dades són categòriques.
- Les mostres són independents.
Exemple de Codi en Python:
import scipy.stats as stats # Taula de contingència taula = [[10, 20, 30], [6, 9, 17]] # Realitzar la prova de Chi-quadrat resultat = stats.chi2_contingency(taula) print(f'Estadístic Chi-quadrat: {resultat[0]}') print(f'P-valor: {resultat[1]}') print(f'Graus de llibertat: {resultat[2]}') print(f'Esperats: {resultat[3]}')
Exercicis Pràctics
Exercici 1: Prova de Mann-Whitney U
Comparar les següents dues mostres independents utilitzant la prova de Mann-Whitney U:
- Mostra 1: [23, 45, 67, 34, 22]
- Mostra 2: [56, 78, 45, 89, 67]
Solució:
import scipy.stats as stats mostra1 = [23, 45, 67, 34, 22] mostra2 = [56, 78, 45, 89, 67] resultat = stats.mannwhitneyu(mostra1, mostra2) print(f'Estadístic U: {resultat.statistic}') print(f'P-valor: {resultat.pvalue}')
Exercici 2: Prova de Wilcoxon
Comparar les següents dues mostres aparellades utilitzant la prova de Wilcoxon:
- Mostra 1: [12, 14, 16, 18, 20]
- Mostra 2: [11, 15, 17, 19, 21]
Solució:
import scipy.stats as stats mostra1 = [12, 14, 16, 18, 20] mostra2 = [11, 15, 17, 19, 21] resultat = stats.wilcoxon(mostra1, mostra2) print(f'Estadístic T: {resultat.statistic}') print(f'P-valor: {resultat.pvalue}')
Exercici 3: Prova de Kruskal-Wallis
Comparar les següents tres mostres independents utilitzant la prova de Kruskal-Wallis:
- Mostra 1: [10, 20, 30, 40, 50]
- Mostra 2: [15, 25, 35, 45, 55]
- Mostra 3: [12, 22, 32, 42, 52]
Solució:
import scipy.stats as stats mostra1 = [10, 20, 30, 40, 50] mostra2 = [15, 25, 35, 45, 55] mostra3 = [12, 22, 32, 42, 52] resultat = stats.kruskal(mostra1, mostra2, mostra3) print(f'Estadístic H: {resultat.statistic}') print(f'P-valor: {resultat.pvalue}')
Exercici 4: Prova de Chi-quadrat
Provar la independència entre les següents dues variables categòriques utilitzant la prova de Chi-quadrat:
- Taula de contingència: [[8, 12, 15], [10, 14, 20]]
Solució:
import scipy.stats as stats taula = [[8, 12, 15], [10, 14, 20]] resultat = stats.chi2_contingency(taula) print(f'Estadístic Chi-quadrat: {resultat[0]}') print(f'P-valor: {resultat[1]}') print(f'Graus de llibertat: {resultat[2]}') print(f'Esperats: {resultat[3]}')
Resum
En aquesta secció, hem explorat els mètodes no paramètrics, incloent-hi les proves de Mann-Whitney U, Wilcoxon, Kruskal-Wallis i Chi-quadrat. Aquests mètodes són útils quan les dades no compleixen les assumpcions necessàries per als mètodes paramètrics. Hem proporcionat exemples de codi en Python per a cada prova i exercicis pràctics per reforçar els conceptes apresos. En el següent mòdul, explorarem les aplicacions pràctiques de l'estadística en diferents camps.