En aquest tema, aprendrem a utilitzar MATLAB per realitzar anàlisis estadístiques descriptives. Les estadístiques descriptives són eines fonamentals per resumir i descriure les característiques principals d'un conjunt de dades. Aquestes inclouen mesures de tendència central, dispersió i distribució.
Objectius del Tema
- Comprendre les mesures de tendència central: mitjana, mediana i moda.
- Aprendre a calcular mesures de dispersió: rang, variància i desviació estàndard.
- Utilitzar MATLAB per generar estadístiques descriptives de manera eficient.
- Visualitzar dades per entendre millor la seva distribució.
- Mesures de Tendència Central
Mitjana
La mitjana és el valor promig d'un conjunt de dades. Es calcula sumant tots els valors i dividint pel nombre total de valors.
% Exemple de càlcul de la mitjana dades = [5, 10, 15, 20, 25]; mitjana = mean(dades); disp(['La mitjana és: ', num2str(mitjana)]);
Mediana
La mediana és el valor central d'un conjunt de dades ordenades. Si el nombre de valors és parell, la mediana és la mitjana dels dos valors centrals.
% Exemple de càlcul de la mediana mediana = median(dades); disp(['La mediana és: ', num2str(mediana)]);
Moda
La moda és el valor que apareix amb més freqüència en un conjunt de dades.
% Exemple de càlcul de la moda dades = [5, 10, 10, 15, 20, 25]; moda = mode(dades); disp(['La moda és: ', num2str(moda)]);
- Mesures de Dispersió
Rang
El rang és la diferència entre el valor màxim i el valor mínim d'un conjunt de dades.
Variància
La variància mesura la dispersió dels valors respecte a la mitjana. Es calcula com la mitjana dels quadrats de les diferències entre cada valor i la mitjana.
% Exemple de càlcul de la variància variancia = var(dades); disp(['La variància és: ', num2str(variancia)]);
Desviació Estàndard
La desviació estàndard és l'arrel quadrada de la variància i proporciona una mesura de la dispersió en les mateixes unitats que les dades originals.
% Exemple de càlcul de la desviació estàndard desviacio_estandard = std(dades); disp(['La desviació estàndard és: ', num2str(desviacio_estandard)]);
- Visualització de Dades
Histograma
Un histograma és una representació gràfica de la distribució de dades. Mostra la freqüència de valors dins de certs intervals.
% Exemple de creació d'un histograma histogram(dades); title('Histograma de les Dades'); xlabel('Valors'); ylabel('Frequència');
Boxplot
Un boxplot és una eina gràfica que mostra la distribució de dades basant-se en un resum de cinc números: mínim, primer quartil, mediana, tercer quartil i màxim.
Exercicis Pràctics
Exercici 1
Calcula la mitjana, mediana, moda, rang, variància i desviació estàndard per al següent conjunt de dades: [12, 15, 14, 10, 8, 12, 14, 16, 10, 12]
.
Solució
dades = [12, 15, 14, 10, 8, 12, 14, 16, 10, 12]; mitjana = mean(dades); mediana = median(dades); moda = mode(dades); rang = range(dades); variancia = var(dades); desviacio_estandard = std(dades); disp(['Mitjana: ', num2str(mitjana)]); disp(['Mediana: ', num2str(mediana)]); disp(['Moda: ', num2str(moda)]); disp(['Rang: ', num2str(rang)]); disp(['Variància: ', num2str(variancia)]); disp(['Desviació Estàndard: ', num2str(desviacio_estandard)]);
Exercici 2
Genera un histograma i un boxplot per al conjunt de dades de l'exercici anterior.
Solució
% Histograma figure; histogram(dades); title('Histograma de les Dades'); xlabel('Valors'); ylabel('Frequència'); % Boxplot figure; boxplot(dades); title('Boxplot de les Dades');
Conclusió
En aquest tema, hem après a calcular i interpretar les mesures de tendència central i dispersió utilitzant MATLAB. També hem explorat com visualitzar dades per obtenir una millor comprensió de la seva distribució. Aquestes eines són fonamentals per a l'anàlisi de dades i proporcionen una base sòlida per a tècniques estadístiques més avançades.
Curs de Programació en MATLAB
Mòdul 1: Introducció a MATLAB
- Començant amb MATLAB
- Interfície i Entorn de MATLAB
- Comandes i Sintaxi Bàsiques
- Variables i Tipus de Dades
- Operacions i Funcions Bàsiques
Mòdul 2: Vectors i Matrius
- Creació de Vectors i Matrius
- Operacions amb Matrius
- Indexació i Segmentació
- Funcions de Matrius
- Àlgebra Lineal en MATLAB
Mòdul 3: Estructures de Programació
- Flux de Control: if, else, switch
- Bucles: for, while
- Funcions: Definició i Abast
- Scripts vs. Funcions
- Depuració i Gestió d'Errors
Mòdul 4: Visualització de Dades
- Conceptes Bàsics de Gràfics
- Gràfics 2D
- Gràfics 3D
- Personalització de Gràfics
- Tècniques Avançades de Gràfics
Mòdul 5: Anàlisi de Dades i Estadística
- Importació i Exportació de Dades
- Estadístiques Descriptives
- Preprocessament de Dades
- Anàlisi de Regressió
- Proves Estadístiques
Mòdul 6: Temes Avançats
- Entrada/Sortida de Fitxers
- Gestió de Grans Conjunts de Dades
- Tècniques d'Optimització
- Conceptes Bàsics de Simulink
- Computació Paral·lela