Els mètodes no paramètrics són tècniques estadístiques que no assumeixen una distribució específica per a les dades. Aquests mètodes són útils quan les dades no compleixen les assumpcions necessàries per als mètodes paramètrics, com la normalitat o la homogeneïtat de variàncies. En aquest tema, explorarem els conceptes clau, exemples i exercicis pràctics relacionats amb els mètodes no paramètrics.

Conceptes Clau

  1. Definició de Mètodes No Paramètrics:

    • Mètodes estadístics que no requereixen assumpcions sobre la distribució de les dades.
    • Són útils per a dades ordinals, categòriques o quan les dades no compleixen les assumpcions de normalitat.
  2. Avantatges dels Mètodes No Paramètrics:

    • Flexibilitat en l'anàlisi de dades.
    • Menys sensibles a valors atípics.
    • Aplicables a petites mostres.
  3. Desavantatges dels Mètodes No Paramètrics:

    • Menys potència estadística en comparació amb els mètodes paramètrics.
    • Pot ser més difícil d'interpretar.

Principals Mètodes No Paramètrics

  1. Prova de Mann-Whitney U

  • Objectiu: Comparar dues mostres independents per determinar si provenen de la mateixa distribució.
  • Assumpcions:
    • Les mostres són independents.
    • Les dades són ordinals o contínues.

Exemple de Codi en Python:

import scipy.stats as stats

# Dades de dues mostres independents
mostra1 = [12, 15, 14, 10, 13]
mostra2 = [18, 20, 17, 19, 21]

# Realitzar la prova de Mann-Whitney U
resultat = stats.mannwhitneyu(mostra1, mostra2)

print(f'Estadístic U: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')

  1. Prova de Wilcoxon

  • Objectiu: Comparar dues mostres relacionades o aparellades.
  • Assumpcions:
    • Les mostres són aparellades.
    • Les dades són ordinals o contínues.

Exemple de Codi en Python:

import scipy.stats as stats

# Dades de dues mostres aparellades
mostra1 = [12, 15, 14, 10, 13]
mostra2 = [14, 16, 15, 11, 14]

# Realitzar la prova de Wilcoxon
resultat = stats.wilcoxon(mostra1, mostra2)

print(f'Estadístic T: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')

  1. Prova de Kruskal-Wallis

  • Objectiu: Comparar més de dues mostres independents.
  • Assumpcions:
    • Les mostres són independents.
    • Les dades són ordinals o contínues.

Exemple de Codi en Python:

import scipy.stats as stats

# Dades de tres mostres independents
mostra1 = [12, 15, 14, 10, 13]
mostra2 = [18, 20, 17, 19, 21]
mostra3 = [22, 25, 24, 23, 26]

# Realitzar la prova de Kruskal-Wallis
resultat = stats.kruskal(mostra1, mostra2, mostra3)

print(f'Estadístic H: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')

  1. Prova de Chi-quadrat

  • Objectiu: Provar la independència entre dues variables categòriques.
  • Assumpcions:
    • Les dades són categòriques.
    • Les mostres són independents.

Exemple de Codi en Python:

import scipy.stats as stats

# Taula de contingència
taula = [[10, 20, 30], [6, 9, 17]]

# Realitzar la prova de Chi-quadrat
resultat = stats.chi2_contingency(taula)

print(f'Estadístic Chi-quadrat: {resultat[0]}')
print(f'P-valor: {resultat[1]}')
print(f'Graus de llibertat: {resultat[2]}')
print(f'Esperats: {resultat[3]}')

Exercicis Pràctics

Exercici 1: Prova de Mann-Whitney U

Comparar les següents dues mostres independents utilitzant la prova de Mann-Whitney U:

  • Mostra 1: [23, 45, 67, 34, 22]
  • Mostra 2: [56, 78, 45, 89, 67]

Solució:

import scipy.stats as stats

mostra1 = [23, 45, 67, 34, 22]
mostra2 = [56, 78, 45, 89, 67]

resultat = stats.mannwhitneyu(mostra1, mostra2)

print(f'Estadístic U: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')

Exercici 2: Prova de Wilcoxon

Comparar les següents dues mostres aparellades utilitzant la prova de Wilcoxon:

  • Mostra 1: [12, 14, 16, 18, 20]
  • Mostra 2: [11, 15, 17, 19, 21]

Solució:

import scipy.stats as stats

mostra1 = [12, 14, 16, 18, 20]
mostra2 = [11, 15, 17, 19, 21]

resultat = stats.wilcoxon(mostra1, mostra2)

print(f'Estadístic T: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')

Exercici 3: Prova de Kruskal-Wallis

Comparar les següents tres mostres independents utilitzant la prova de Kruskal-Wallis:

  • Mostra 1: [10, 20, 30, 40, 50]
  • Mostra 2: [15, 25, 35, 45, 55]
  • Mostra 3: [12, 22, 32, 42, 52]

Solució:

import scipy.stats as stats

mostra1 = [10, 20, 30, 40, 50]
mostra2 = [15, 25, 35, 45, 55]
mostra3 = [12, 22, 32, 42, 52]

resultat = stats.kruskal(mostra1, mostra2, mostra3)

print(f'Estadístic H: {resultat.statistic}')
print(f'P-valor: {resultat.pvalue}')

Exercici 4: Prova de Chi-quadrat

Provar la independència entre les següents dues variables categòriques utilitzant la prova de Chi-quadrat:

  • Taula de contingència: [[8, 12, 15], [10, 14, 20]]

Solució:

import scipy.stats as stats

taula = [[8, 12, 15], [10, 14, 20]]

resultat = stats.chi2_contingency(taula)

print(f'Estadístic Chi-quadrat: {resultat[0]}')
print(f'P-valor: {resultat[1]}')
print(f'Graus de llibertat: {resultat[2]}')
print(f'Esperats: {resultat[3]}')

Resum

En aquesta secció, hem explorat els mètodes no paramètrics, incloent-hi les proves de Mann-Whitney U, Wilcoxon, Kruskal-Wallis i Chi-quadrat. Aquests mètodes són útils quan les dades no compleixen les assumpcions necessàries per als mètodes paramètrics. Hem proporcionat exemples de codi en Python per a cada prova i exercicis pràctics per reforçar els conceptes apresos. En el següent mòdul, explorarem les aplicacions pràctiques de l'estadística en diferents camps.

© Copyright 2024. Tots els drets reservats