En aquesta secció, explorarem els diferents tipus de dades i els gràfics més adequats per representar-les. La comprensió dels tipus de dades és fonamental per seleccionar la visualització correcta, la qual cosa facilita la interpretació i l'anàlisi de la informació.

Tipus de Dades

Les dades es poden classificar en diverses categories, cadascuna amb les seves pròpies característiques i usos. A continuació, es descriuen els principals tipus de dades:

  1. Dades Categòriques (Qualitatives)

    • Nominals: Dades que representen categories sense un ordre inherent. Exemples: colors (vermell, blau, verd), tipus de fruita (poma, taronja, plàtan).
    • Ordinales: Dades que representen categories amb un ordre inherent. Exemples: classificacions (primer, segon, tercer), nivells d'educació (primària, secundària, terciària).
  2. Dades Numèriques (Quantitatives)

    • Discretes: Dades que poden prendre valors específics i comptables. Exemples: nombre de fills, nombre de cotxes.
    • Contínues: Dades que poden prendre qualsevol valor dins d'un rang. Exemples: altura, pes, temperatura.

Tipus de Gràfics

Cada tipus de dada es pot representar millor amb certs tipus de gràfics. A continuació, es presenten els gràfics més comuns i les seves aplicacions:

  1. Gràfics de Barres

    • Ús: Representar dades categòriques (nominals o ordinales).
    • Exemple: Nombre de vendes per categoria de producte.
    import matplotlib.pyplot as plt
    
    categories = ['A', 'B', 'C']
    values = [10, 20, 15]
    
    plt.bar(categories, values)
    plt.xlabel('Categories')
    plt.ylabel('Valors')
    plt.title('Gràfic de Barres')
    plt.show()
    
  2. Gràfics de Columnes

    • Ús: Similar als gràfics de barres, però les barres són verticals.
    • Exemple: Nombre de vendes per mes.
    months = ['Gener', 'Febrer', 'Març']
    sales = [100, 150, 120]
    
    plt.bar(months, sales)
    plt.xlabel('Mesos')
    plt.ylabel('Vendes')
    plt.title('Gràfic de Columnes')
    plt.show()
    
  3. Gràfics de Línies

    • Ús: Representar dades contínues al llarg del temps.
    • Exemple: Evolució de la temperatura durant una setmana.
    days = ['Dilluns', 'Dimarts', 'Dimecres', 'Dijous', 'Divendres']
    temperatures = [20, 21, 19, 22, 20]
    
    plt.plot(days, temperatures)
    plt.xlabel('Dies')
    plt.ylabel('Temperatura (°C)')
    plt.title('Gràfic de Línies')
    plt.show()
    
  4. Gràfics de Dispersió

    • Ús: Representar la relació entre dues variables numèriques.
    • Exemple: Relació entre l'alçada i el pes de les persones.
    heights = [150, 160, 170, 180, 190]
    weights = [50, 60, 70, 80, 90]
    
    plt.scatter(heights, weights)
    plt.xlabel('Alçada (cm)')
    plt.ylabel('Pes (kg)')
    plt.title('Gràfic de Dispersió')
    plt.show()
    
  5. Gràfics de Pastís

    • Ús: Representar la proporció de parts d'un tot.
    • Exemple: Distribució percentual de les vendes per producte.
    products = ['Producte A', 'Producte B', 'Producte C']
    sales_percentage = [40, 35, 25]
    
    plt.pie(sales_percentage, labels=products, autopct='%1.1f%%')
    plt.title('Gràfic de Pastís')
    plt.show()
    
  6. Mapes de Calor

    • Ús: Representar dades en una matriu, on els colors indiquen la intensitat dels valors.
    • Exemple: Matriu de correlació entre diferents variables.
    import seaborn as sns
    import numpy as np
    
    data = np.random.rand(10, 12)
    sns.heatmap(data, annot=True)
    plt.title('Mapa de Calor')
    plt.show()
    

Exercicis Pràctics

  1. Exercici 1: Crea un gràfic de barres per representar el nombre d'estudiants en diferents cursos.

    cursos = ['Matemàtiques', 'Física', 'Química', 'Biologia']
    nombre_estudiants = [30, 25, 20, 15]
    
    plt.bar(cursos, nombre_estudiants)
    plt.xlabel('Cursos')
    plt.ylabel('Nombre d\'Estudiants')
    plt.title('Nombre d\'Estudiants per Curs')
    plt.show()
    
  2. Exercici 2: Crea un gràfic de línies per mostrar l'evolució de les vendes mensuals d'una empresa.

    mesos = ['Gener', 'Febrer', 'Març', 'Abril', 'Maig']
    vendes = [200, 220, 210, 230, 240]
    
    plt.plot(mesos, vendes)
    plt.xlabel('Mesos')
    plt.ylabel('Vendes')
    plt.title('Evolució de les Vendes Mensuals')
    plt.show()
    
  3. Exercici 3: Crea un gràfic de dispersió per mostrar la relació entre l'edat i el salari de diferents empleats.

    edats = [25, 30, 35, 40, 45]
    salaris = [30000, 35000, 40000, 45000, 50000]
    
    plt.scatter(edats, salaris)
    plt.xlabel('Edat')
    plt.ylabel('Salari')
    plt.title('Relació entre Edat i Salari')
    plt.show()
    

Conclusió

En aquesta secció, hem après sobre els diferents tipus de dades i els gràfics més adequats per representar-les. La selecció correcta del tipus de gràfic és essencial per comunicar la informació de manera clara i efectiva. A mesura que avancem en el curs, aplicarem aquests coneixements per crear visualitzacions més complexes i informatives.

© Copyright 2024. Tots els drets reservats