En aquesta secció, explorarem els diferents tipus de dades i els gràfics més adequats per representar-les. La comprensió dels tipus de dades és fonamental per seleccionar la visualització correcta, la qual cosa facilita la interpretació i l'anàlisi de la informació.
Tipus de Dades
Les dades es poden classificar en diverses categories, cadascuna amb les seves pròpies característiques i usos. A continuació, es descriuen els principals tipus de dades:
-
Dades Categòriques (Qualitatives)
- Nominals: Dades que representen categories sense un ordre inherent. Exemples: colors (vermell, blau, verd), tipus de fruita (poma, taronja, plàtan).
- Ordinales: Dades que representen categories amb un ordre inherent. Exemples: classificacions (primer, segon, tercer), nivells d'educació (primària, secundària, terciària).
-
Dades Numèriques (Quantitatives)
- Discretes: Dades que poden prendre valors específics i comptables. Exemples: nombre de fills, nombre de cotxes.
- Contínues: Dades que poden prendre qualsevol valor dins d'un rang. Exemples: altura, pes, temperatura.
Tipus de Gràfics
Cada tipus de dada es pot representar millor amb certs tipus de gràfics. A continuació, es presenten els gràfics més comuns i les seves aplicacions:
-
Gràfics de Barres
- Ús: Representar dades categòriques (nominals o ordinales).
- Exemple: Nombre de vendes per categoria de producte.
import matplotlib.pyplot as plt categories = ['A', 'B', 'C'] values = [10, 20, 15] plt.bar(categories, values) plt.xlabel('Categories') plt.ylabel('Valors') plt.title('Gràfic de Barres') plt.show()
-
Gràfics de Columnes
- Ús: Similar als gràfics de barres, però les barres són verticals.
- Exemple: Nombre de vendes per mes.
months = ['Gener', 'Febrer', 'Març'] sales = [100, 150, 120] plt.bar(months, sales) plt.xlabel('Mesos') plt.ylabel('Vendes') plt.title('Gràfic de Columnes') plt.show()
-
Gràfics de Línies
- Ús: Representar dades contínues al llarg del temps.
- Exemple: Evolució de la temperatura durant una setmana.
days = ['Dilluns', 'Dimarts', 'Dimecres', 'Dijous', 'Divendres'] temperatures = [20, 21, 19, 22, 20] plt.plot(days, temperatures) plt.xlabel('Dies') plt.ylabel('Temperatura (°C)') plt.title('Gràfic de Línies') plt.show()
-
Gràfics de Dispersió
- Ús: Representar la relació entre dues variables numèriques.
- Exemple: Relació entre l'alçada i el pes de les persones.
heights = [150, 160, 170, 180, 190] weights = [50, 60, 70, 80, 90] plt.scatter(heights, weights) plt.xlabel('Alçada (cm)') plt.ylabel('Pes (kg)') plt.title('Gràfic de Dispersió') plt.show()
-
Gràfics de Pastís
- Ús: Representar la proporció de parts d'un tot.
- Exemple: Distribució percentual de les vendes per producte.
products = ['Producte A', 'Producte B', 'Producte C'] sales_percentage = [40, 35, 25] plt.pie(sales_percentage, labels=products, autopct='%1.1f%%') plt.title('Gràfic de Pastís') plt.show()
-
Mapes de Calor
- Ús: Representar dades en una matriu, on els colors indiquen la intensitat dels valors.
- Exemple: Matriu de correlació entre diferents variables.
import seaborn as sns import numpy as np data = np.random.rand(10, 12) sns.heatmap(data, annot=True) plt.title('Mapa de Calor') plt.show()
Exercicis Pràctics
-
Exercici 1: Crea un gràfic de barres per representar el nombre d'estudiants en diferents cursos.
cursos = ['Matemàtiques', 'Física', 'Química', 'Biologia'] nombre_estudiants = [30, 25, 20, 15] plt.bar(cursos, nombre_estudiants) plt.xlabel('Cursos') plt.ylabel('Nombre d\'Estudiants') plt.title('Nombre d\'Estudiants per Curs') plt.show()
-
Exercici 2: Crea un gràfic de línies per mostrar l'evolució de les vendes mensuals d'una empresa.
mesos = ['Gener', 'Febrer', 'Març', 'Abril', 'Maig'] vendes = [200, 220, 210, 230, 240] plt.plot(mesos, vendes) plt.xlabel('Mesos') plt.ylabel('Vendes') plt.title('Evolució de les Vendes Mensuals') plt.show()
-
Exercici 3: Crea un gràfic de dispersió per mostrar la relació entre l'edat i el salari de diferents empleats.
edats = [25, 30, 35, 40, 45] salaris = [30000, 35000, 40000, 45000, 50000] plt.scatter(edats, salaris) plt.xlabel('Edat') plt.ylabel('Salari') plt.title('Relació entre Edat i Salari') plt.show()
Conclusió
En aquesta secció, hem après sobre els diferents tipus de dades i els gràfics més adequats per representar-les. La selecció correcta del tipus de gràfic és essencial per comunicar la informació de manera clara i efectiva. A mesura que avancem en el curs, aplicarem aquests coneixements per crear visualitzacions més complexes i informatives.
Visualització de Dades
Mòdul 1: Introducció a la Visualització de Dades
- Conceptes Bàsics de Visualització de Dades
- Importància de la Visualització de Dades
- Tipus de Dades i Gràfics
Mòdul 2: Eines de Visualització de Dades
- Introducció a Eines de Visualització
- Ús de Microsoft Excel per a Visualització
- Introducció a Tableau
- Ús de Power BI
- Visualització amb Python: Matplotlib i Seaborn
- Visualització amb R: ggplot2
Mòdul 3: Tècniques de Visualització de Dades
- Gràfics de Barres i Columnes
- Gràfics de Línies
- Gràfics de Dispersió
- Gràfics de Pastís
- Mapes de Calor
- Gràfics d'Àrea
- Diagrames de Caixa i Bigots
- Gràfics de Bombolla
Mòdul 4: Principis de Disseny en Visualització de Dades
- Principis de Percepció Visual
- Ús del Color en Visualització
- Disseny de Gràfics Efectius
- Evitar Errors Comuns en Visualització
Mòdul 5: Casos Pràctics i Projectes
- Anàlisi de Dades de Vendes
- Visualització de Dades de Màrqueting
- Projectes de Visualització de Dades en Salut
- Visualització de Dades Financeres