En aquest tema, aprendrem a utilitzar MATLAB per realitzar anàlisis estadístiques descriptives. Les estadístiques descriptives són eines fonamentals per resumir i descriure les característiques principals d'un conjunt de dades. Aquestes inclouen mesures de tendència central, dispersió i distribució.

Objectius del Tema

  • Comprendre les mesures de tendència central: mitjana, mediana i moda.
  • Aprendre a calcular mesures de dispersió: rang, variància i desviació estàndard.
  • Utilitzar MATLAB per generar estadístiques descriptives de manera eficient.
  • Visualitzar dades per entendre millor la seva distribució.

  1. Mesures de Tendència Central

Mitjana

La mitjana és el valor promig d'un conjunt de dades. Es calcula sumant tots els valors i dividint pel nombre total de valors.

% Exemple de càlcul de la mitjana
dades = [5, 10, 15, 20, 25];
mitjana = mean(dades);
disp(['La mitjana és: ', num2str(mitjana)]);

Mediana

La mediana és el valor central d'un conjunt de dades ordenades. Si el nombre de valors és parell, la mediana és la mitjana dels dos valors centrals.

% Exemple de càlcul de la mediana
mediana = median(dades);
disp(['La mediana és: ', num2str(mediana)]);

Moda

La moda és el valor que apareix amb més freqüència en un conjunt de dades.

% Exemple de càlcul de la moda
dades = [5, 10, 10, 15, 20, 25];
moda = mode(dades);
disp(['La moda és: ', num2str(moda)]);

  1. Mesures de Dispersió

Rang

El rang és la diferència entre el valor màxim i el valor mínim d'un conjunt de dades.

% Exemple de càlcul del rang
rang = range(dades);
disp(['El rang és: ', num2str(rang)]);

Variància

La variància mesura la dispersió dels valors respecte a la mitjana. Es calcula com la mitjana dels quadrats de les diferències entre cada valor i la mitjana.

% Exemple de càlcul de la variància
variancia = var(dades);
disp(['La variància és: ', num2str(variancia)]);

Desviació Estàndard

La desviació estàndard és l'arrel quadrada de la variància i proporciona una mesura de la dispersió en les mateixes unitats que les dades originals.

% Exemple de càlcul de la desviació estàndard
desviacio_estandard = std(dades);
disp(['La desviació estàndard és: ', num2str(desviacio_estandard)]);

  1. Visualització de Dades

Histograma

Un histograma és una representació gràfica de la distribució de dades. Mostra la freqüència de valors dins de certs intervals.

% Exemple de creació d'un histograma
histogram(dades);
title('Histograma de les Dades');
xlabel('Valors');
ylabel('Frequència');

Boxplot

Un boxplot és una eina gràfica que mostra la distribució de dades basant-se en un resum de cinc números: mínim, primer quartil, mediana, tercer quartil i màxim.

% Exemple de creació d'un boxplot
boxplot(dades);
title('Boxplot de les Dades');

Exercicis Pràctics

Exercici 1

Calcula la mitjana, mediana, moda, rang, variància i desviació estàndard per al següent conjunt de dades: [12, 15, 14, 10, 8, 12, 14, 16, 10, 12].

Solució

dades = [12, 15, 14, 10, 8, 12, 14, 16, 10, 12];
mitjana = mean(dades);
mediana = median(dades);
moda = mode(dades);
rang = range(dades);
variancia = var(dades);
desviacio_estandard = std(dades);

disp(['Mitjana: ', num2str(mitjana)]);
disp(['Mediana: ', num2str(mediana)]);
disp(['Moda: ', num2str(moda)]);
disp(['Rang: ', num2str(rang)]);
disp(['Variància: ', num2str(variancia)]);
disp(['Desviació Estàndard: ', num2str(desviacio_estandard)]);

Exercici 2

Genera un histograma i un boxplot per al conjunt de dades de l'exercici anterior.

Solució

% Histograma
figure;
histogram(dades);
title('Histograma de les Dades');
xlabel('Valors');
ylabel('Frequència');

% Boxplot
figure;
boxplot(dades);
title('Boxplot de les Dades');

Conclusió

En aquest tema, hem après a calcular i interpretar les mesures de tendència central i dispersió utilitzant MATLAB. També hem explorat com visualitzar dades per obtenir una millor comprensió de la seva distribució. Aquestes eines són fonamentals per a l'anàlisi de dades i proporcionen una base sòlida per a tècniques estadístiques més avançades.

© Copyright 2024. Tots els drets reservats