Introducció a l'ANOVA

L'Anàlisi de Variància (ANOVA) és una tècnica estadística utilitzada per comparar les mitjanes de tres o més grups per determinar si almenys una de les mitjanes és diferent de les altres. Aquesta tècnica és molt útil en experiments on es vol avaluar l'efecte de diferents tractaments o condicions.

Objectius de l'ANOVA

  • Comparar les mitjanes de múltiples grups.
  • Determinar si les diferències observades entre les mitjanes són estadísticament significatives.
  • Identificar la font de variabilitat en les dades.

Tipus d'ANOVA

  1. ANOVA d'un factor (one-way ANOVA): Compara les mitjanes de tres o més grups basats en un sol factor.
  2. ANOVA de dos factors (two-way ANOVA): Compara les mitjanes de grups basats en dos factors, permetent avaluar les interaccions entre els factors.

Conceptes Clau

Hipòtesis en ANOVA

  • Hipòtesi nul·la (H0): Totes les mitjanes dels grups són iguals.
  • Hipòtesi alternativa (H1): Almenys una de les mitjanes dels grups és diferent.

Components de la Variància

  • Variància entre grups (Between-group variance): Variància deguda a les diferències entre les mitjanes dels grups.
  • Variància dins dels grups (Within-group variance): Variància deguda a les diferències dins de cada grup.

F-Estadístic

L'ANOVA utilitza l'estadístic F per determinar si les diferències entre les mitjanes dels grups són significatives. L'estadístic F es calcula com la relació entre la variància entre grups i la variància dins dels grups.

\[ F = \frac{\text{Variància entre grups}}{\text{Variància dins dels grups}} \]

Procediment de l'ANOVA d'un Factor

  1. Formulació de les Hipòtesis:

    • H0: μ1 = μ2 = μ3 = ... = μk
    • H1: Almenys una mitjana és diferent.
  2. Càlcul de la Variància:

    • Suma de quadrats total (SST): Mesura la variabilitat total en les dades.
    • Suma de quadrats entre grups (SSB): Mesura la variabilitat deguda a les diferències entre les mitjanes dels grups.
    • Suma de quadrats dins dels grups (SSW): Mesura la variabilitat dins de cada grup.
  3. Càlcul dels Graus de Llibertat:

    • Graus de llibertat entre grups (dfB): k - 1, on k és el nombre de grups.
    • Graus de llibertat dins dels grups (dfW): N - k, on N és el nombre total d'observacions.
  4. Càlcul de la Mitjana Quadràtica:

    • Mitjana quadràtica entre grups (MSB): SSB / dfB
    • Mitjana quadràtica dins dels grups (MSW): SSW / dfW
  5. Càlcul de l'Estadístic F:

    • F = MSB / MSW
  6. Determinació del Valor Crític:

    • Comparar l'estadístic F calculat amb el valor crític de la distribució F per als graus de llibertat corresponents.
  7. Conclusió:

    • Si F calculat > F crític, rebutjar H0.
    • Si F calculat ≤ F crític, no rebutjar H0.

Exemple Pràctic

Dades

Suposem que volem comparar l'efecte de tres dietes diferents sobre la pèrdua de pes. Les dades són les següents:

Dieta 1 Dieta 2 Dieta 3
5 8 6
7 9 7
6 7 8
8 6 9

Càlculs

  1. Mitjanes de cada grup:

    • μ1 = (5 + 7 + 6 + 8) / 4 = 6.5
    • μ2 = (8 + 9 + 7 + 6) / 4 = 7.5
    • μ3 = (6 + 7 + 8 + 9) / 4 = 7.5
  2. Mitjana global (μ):

    • μ = (5 + 7 + 6 + 8 + 8 + 9 + 7 + 6 + 6 + 7 + 8 + 9) / 12 = 7
  3. Suma de quadrats total (SST):

    • SST = Σ (xi - μ)^2 = (5-7)^2 + (7-7)^2 + (6-7)^2 + (8-7)^2 + (8-7)^2 + (9-7)^2 + (7-7)^2 + (6-7)^2 + (6-7)^2 + (7-7)^2 + (8-7)^2 + (9-7)^2 = 22
  4. Suma de quadrats entre grups (SSB):

    • SSB = Σ ni (μi - μ)^2 = 4(6.5-7)^2 + 4(7.5-7)^2 + 4(7.5-7)^2 = 4(0.25) + 4(0.25) + 4(0.25) = 3
  5. Suma de quadrats dins dels grups (SSW):

    • SSW = SST - SSB = 22 - 3 = 19
  6. Graus de llibertat:

    • dfB = k - 1 = 3 - 1 = 2
    • dfW = N - k = 12 - 3 = 9
  7. Mitjana quadràtica:

    • MSB = SSB / dfB = 3 / 2 = 1.5
    • MSW = SSW / dfW = 19 / 9 = 2.11
  8. Estadístic F:

    • F = MSB / MSW = 1.5 / 2.11 = 0.71
  9. Conclusió:

    • Comparar el valor de F calculat amb el valor crític de la distribució F per als graus de llibertat corresponents. Si el valor de F calculat és menor que el valor crític, no rebutgem la hipòtesi nul·la.

Exercici Pràctic

Dades

Suposem que volem comparar l'efecte de quatre programes d'entrenament diferents sobre la millora del rendiment físic. Les dades són les següents:

Programa 1 Programa 2 Programa 3 Programa 4
15 20 25 30
18 22 27 32
17 21 26 31
16 23 28 33

Tasques

  1. Calcular les mitjanes de cada grup.
  2. Calcular la mitjana global.
  3. Calcular la suma de quadrats total (SST).
  4. Calcular la suma de quadrats entre grups (SSB).
  5. Calcular la suma de quadrats dins dels grups (SSW).
  6. Calcular els graus de llibertat.
  7. Calcular les mitjanes quadràtiques (MSB i MSW).
  8. Calcular l'estadístic F.
  9. Comparar el valor de F calculat amb el valor crític i prendre una decisió sobre la hipòtesi nul·la.

Solució

  1. Mitjanes de cada grup:

    • μ1 = (15 + 18 + 17 + 16) / 4 = 16.5
    • μ2 = (20 + 22 + 21 + 23) / 4 = 21.5
    • μ3 = (25 + 27 + 26 + 28) / 4 = 26.5
    • μ4 = (30 + 32 + 31 + 33) / 4 = 31.5
  2. Mitjana global (μ):

    • μ = (15 + 18 + 17 + 16 + 20 + 22 + 21 + 23 + 25 + 27 + 26 + 28 + 30 + 32 + 31 + 33) / 16 = 24.5
  3. Suma de quadrats total (SST):

    • SST = Σ (xi - μ)^2 = (15-24.5)^2 + (18-24.5)^2 + ... + (33-24.5)^2 = 680
  4. Suma de quadrats entre grups (SSB):

    • SSB = Σ ni (μi - μ)^2 = 4(16.5-24.5)^2 + 4(21.5-24.5)^2 + 4(26.5-24.5)^2 + 4(31.5-24.5)^2 = 680
  5. Suma de quadrats dins dels grups (SSW):

    • SSW = SST - SSB = 680 - 680 = 0
  6. Graus de llibertat:

    • dfB = k - 1 = 4 - 1 = 3
    • dfW = N - k = 16 - 4 = 12
  7. Mitjana quadràtica:

    • MSB = SSB / dfB = 680 / 3 = 226.67
    • MSW = SSW / dfW = 0 / 12 = 0
  8. Estadístic F:

    • F = MSB / MSW = 226.67 / 0 = ∞ (infinito)
  9. Conclusió:

    • En aquest cas, l'estadístic F és infinit, el que indica que hi ha una diferència significativa entre les mitjanes dels grups. Rebutgem la hipòtesi nul·la.

Resum

L'ANOVA és una eina poderosa per comparar les mitjanes de múltiples grups i determinar si les diferències observades són estadísticament significatives. Comprendre els conceptes clau i el procediment de càlcul és essencial per aplicar correctament aquesta tècnica en l'anàlisi de dades.

© Copyright 2024. Tots els drets reservats