Introducció
L'estadística és una eina fonamental en les ciències socials, ja que permet als investigadors analitzar dades, identificar patrons i fer inferències sobre les poblacions d'estudi. Aquest tema se centra en l'aplicació de mètodes estadístics en disciplines com la sociologia, la psicologia, l'economia i la ciència política.
Objectius del Tema
- Comprendre la importància de l'estadística en les ciències socials.
- Aprendre a aplicar tècniques estadístiques per analitzar dades socials.
- Desenvolupar habilitats per interpretar resultats estadístics en el context de les ciències socials.
Conceptes Clau
- Importància de l'Estadística en les Ciències Socials
- Anàlisi de Dades: Permet als investigadors comprendre millor els fenòmens socials mitjançant l'anàlisi de dades recollides.
- Inferència: Ajuda a fer prediccions i inferències sobre poblacions més grans a partir de mostres.
- Validació d'Hipòtesis: Facilita la comprovació d'hipòtesis i la validació de teories socials.
- Tipus de Dades en Ciències Socials
- Dades Qualitatives: Informació no numèrica que descriu qualitats o característiques (per exemple, opinions, comportaments).
- Dades Quantitatives: Informació numèrica que es pot mesurar i analitzar estadísticament (per exemple, ingressos, edat).
- Mètodes Estadístics Comuns
- Descripció de Dades: Ús de mesures de tendència central (mitjana, mediana, moda) i mesures de dispersió (rang, desviació estàndard).
- Anàlisi de Correlació: Estudi de la relació entre dues variables.
- Anàlisi de Regressió: Modelatge de la relació entre una variable dependent i una o més variables independents.
- Proves d'Hipòtesis: Comprovació d'hipòtesis sobre les dades recollides.
Exemples Pràctics
Exemple 1: Anàlisi de Correlació
Situació: Un sociòleg vol estudiar la relació entre el nivell d'educació i els ingressos.
Dades:
Codi en Python:
import numpy as np import matplotlib.pyplot as plt # Dades educacio = np.array([12, 14, 16, 18, 20]) ingressos = np.array([25, 30, 35, 40, 50]) # Correlació correlacio = np.corrcoef(educacio, ingressos)[0, 1] print(f"Coeficient de correlació: {correlacio}") # Gràfic de dispersió plt.scatter(educacio, ingressos) plt.xlabel('Nivell d\'Educació (anys)') plt.ylabel('Ingressos (milers d\'euros)') plt.title('Relació entre Nivell d\'Educació i Ingressos') plt.show()
Explicació:
- El coeficient de correlació mesura la força i la direcció de la relació lineal entre dues variables.
- En aquest exemple, un coeficient de correlació positiu indica que a mesura que augmenta el nivell d'educació, també augmenten els ingressos.
Exemple 2: Anàlisi de Regressió
Situació: Un psicòleg vol predir el nivell d'estrès basat en les hores de treball setmanals.
Dades:
Codi en Python:
from sklearn.linear_model import LinearRegression # Dades hores_treball = np.array([35, 40, 45, 50, 55]).reshape(-1, 1) nivell_estres = np.array([3, 4, 5, 6, 7]) # Model de regressió model = LinearRegression() model.fit(hores_treball, nivell_estres) # Predicció hores_noves = np.array([60]).reshape(-1, 1) prediccio_estres = model.predict(hores_noves) print(f"Predicció del nivell d'estrès per 60 hores de treball: {prediccio_estres[0]}") # Gràfic de regressió plt.scatter(hores_treball, nivell_estres, color='blue') plt.plot(hores_treball, model.predict(hores_treball), color='red') plt.xlabel('Hores de Treball') plt.ylabel('Nivell d\'Estrès') plt.title('Regressió entre Hores de Treball i Nivell d\'Estrès') plt.show()
Explicació:
- La regressió lineal permet modelar la relació entre una variable dependent (nivell d'estrès) i una variable independent (hores de treball).
- En aquest exemple, el model prediu el nivell d'estrès per a 60 hores de treball setmanals.
Exercicis Pràctics
Exercici 1: Anàlisi de Correlació
Situació: Un economista vol estudiar la relació entre la taxa d'atur i la inflació.
Dades:
Instruccions:
- Calculeu el coeficient de correlació entre la taxa d'atur i la inflació.
- Creeu un gràfic de dispersió per visualitzar la relació.
Solució:
# Dades taxa_atur = np.array([5, 6, 7, 8, 9]) inflacio = np.array([2, 2.5, 3, 3.5, 4]) # Correlació correlacio = np.corrcoef(taxa_atur, inflacio)[0, 1] print(f"Coeficient de correlació: {correlacio}") # Gràfic de dispersió plt.scatter(taxa_atur, inflacio) plt.xlabel('Taxa d\'Atur (%)') plt.ylabel('Inflació (%)') plt.title('Relació entre Taxa d\'Atur i Inflació') plt.show()
Exercici 2: Anàlisi de Regressió
Situació: Un politòleg vol predir el nombre de vots basat en la despesa en campanya electoral.
Dades:
Instruccions:
- Ajusteu un model de regressió lineal per predir el nombre de vots basat en la despesa en campanya.
- Prediu el nombre de vots per una despesa de 60 milers d'euros.
Solució:
# Dades despesa_campanya = np.array([10, 20, 30, 40, 50]).reshape(-1, 1) nombre_vots = np.array([1, 2, 3, 4, 5]) # Model de regressió model = LinearRegression() model.fit(despesa_campanya, nombre_vots) # Predicció despesa_nova = np.array([60]).reshape(-1, 1) prediccio_vots = model.predict(despesa_nova) print(f"Predicció del nombre de vots per 60 milers d'euros de despesa: {prediccio_vots[0]}") # Gràfic de regressió plt.scatter(despesa_campanya, nombre_vots, color='blue') plt.plot(despesa_campanya, model.predict(despesa_campanya), color='red') plt.xlabel('Despesa en Campanya (milers d\'euros)') plt.ylabel('Nombre de Vots (milers)') plt.title('Regressió entre Despesa en Campanya i Nombre de Vots') plt.show()
Conclusió
L'estadística és una eina poderosa per a les ciències socials, permetent als investigadors analitzar dades, validar hipòtesis i fer inferències sobre poblacions. Mitjançant l'ús de tècniques com l'anàlisi de correlació i la regressió, els professionals poden obtenir informació valuosa sobre els fenòmens socials i prendre decisions informades. Els exercicis pràctics proporcionats ajuden a consolidar aquests conceptes i a desenvolupar habilitats analítiques aplicables en diversos contextos de les ciències socials.