Introducció

En aquest tema, aprendrem a utilitzar dues de les biblioteques més populars per a la visualització de dades en Python: Matplotlib i Seaborn. Matplotlib és una biblioteca de baix nivell que proporciona un gran control sobre els gràfics, mentre que Seaborn és una biblioteca de més alt nivell construïda sobre Matplotlib que facilita la creació de gràfics estadístics atractius i informatius.

Objectius

  • Entendre les funcionalitats bàsiques de Matplotlib.
  • Aprendre a crear gràfics bàsics amb Matplotlib.
  • Explorar les capacitats de Seaborn per a la visualització de dades estadístiques.
  • Comparar i contrastar Matplotlib i Seaborn.

  1. Introducció a Matplotlib

1.1 Instal·lació

Per instal·lar Matplotlib, pots utilitzar pip:

pip install matplotlib

1.2 Conceptes Bàsics

Matplotlib es basa en la creació de figures i eixos. Una figura pot contenir múltiples eixos (gràfics).

import matplotlib.pyplot as plt

# Crear una figura i eixos
fig, ax = plt.subplots()

# Dibuixar un gràfic de línies
ax.plot([1, 2, 3, 4], [1, 4, 2, 3])

# Mostrar el gràfic
plt.show()

1.3 Gràfics Bàsics amb Matplotlib

Gràfic de Línies

import matplotlib.pyplot as plt

x = [1, 2, 3, 4]
y = [1, 4, 2, 3]

plt.plot(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Gràfic de Línies')
plt.show()

Gràfic de Barres

import matplotlib.pyplot as plt

categories = ['A', 'B', 'C', 'D']
values = [3, 7, 5, 4]

plt.bar(categories, values)
plt.xlabel('Categories')
plt.ylabel('Valors')
plt.title('Gràfic de Barres')
plt.show()

Gràfic de Dispersió

import matplotlib.pyplot as plt

x = [1, 2, 3, 4]
y = [1, 4, 2, 3]

plt.scatter(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Gràfic de Dispersió')
plt.show()

  1. Introducció a Seaborn

2.1 Instal·lació

Per instal·lar Seaborn, pots utilitzar pip:

pip install seaborn

2.2 Conceptes Bàsics

Seaborn està dissenyat per treballar bé amb dades de tipus DataFrame de pandas.

import seaborn as sns
import pandas as pd

# Crear un DataFrame
data = pd.DataFrame({
    'x': [1, 2, 3, 4],
    'y': [1, 4, 2, 3]
})

# Crear un gràfic de dispersió
sns.scatterplot(x='x', y='y', data=data)
plt.title('Gràfic de Dispersió amb Seaborn')
plt.show()

2.3 Gràfics Bàsics amb Seaborn

Gràfic de Línies

import seaborn as sns
import pandas as pd

data = pd.DataFrame({
    'x': [1, 2, 3, 4],
    'y': [1, 4, 2, 3]
})

sns.lineplot(x='x', y='y', data=data)
plt.title('Gràfic de Línies amb Seaborn')
plt.show()

Gràfic de Barres

import seaborn as sns
import pandas as pd

data = pd.DataFrame({
    'categories': ['A', 'B', 'C', 'D'],
    'values': [3, 7, 5, 4]
})

sns.barplot(x='categories', y='values', data=data)
plt.title('Gràfic de Barres amb Seaborn')
plt.show()

Gràfic de Dispersió

import seaborn as sns
import pandas as pd

data = pd.DataFrame({
    'x': [1, 2, 3, 4],
    'y': [1, 4, 2, 3]
})

sns.scatterplot(x='x', y='y', data=data)
plt.title('Gràfic de Dispersió amb Seaborn')
plt.show()

  1. Comparació entre Matplotlib i Seaborn

Característica Matplotlib Seaborn
Nivell de Control Alt Mitjà
Facilitat d'Ús Moderada Alta
Tipus de Gràfics Bàsics i avançats Estadístics i avançats
Integració amb Pandas Bona Excel·lent
Estètica per Defecte Bàsica Atractiva

Exercicis Pràctics

Exercici 1: Gràfic de Línies amb Matplotlib

Crea un gràfic de línies amb les següents dades:

  • X: [0, 1, 2, 3, 4, 5]
  • Y: [0, 1, 4, 9, 16, 25]

Solució:

import matplotlib.pyplot as plt

x = [0, 1, 2, 3, 4, 5]
y = [0, 1, 4, 9, 16, 25]

plt.plot(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Gràfic de Línies')
plt.show()

Exercici 2: Gràfic de Barres amb Seaborn

Crea un gràfic de barres amb les següents dades:

  • Categories: ['E', 'F', 'G', 'H']
  • Valors: [5, 3, 6, 2]

Solució:

import seaborn as sns
import pandas as pd

data = pd.DataFrame({
    'categories': ['E', 'F', 'G', 'H'],
    'values': [5, 3, 6, 2]
})

sns.barplot(x='categories', y='values', data=data)
plt.title('Gràfic de Barres amb Seaborn')
plt.show()

Conclusió

En aquest tema, hem explorat les capacitats de Matplotlib i Seaborn per a la visualització de dades en Python. Hem après a crear gràfics bàsics amb ambdues biblioteques i hem comparat les seves característiques. Ara estàs preparat per utilitzar aquestes eines per a les teves pròpies necessitats de visualització de dades.

© Copyright 2024. Tots els drets reservats