Introducció
En aquest tema, aprendrem a utilitzar dues de les biblioteques més populars per a la visualització de dades en Python: Matplotlib i Seaborn. Matplotlib és una biblioteca de baix nivell que proporciona un gran control sobre els gràfics, mentre que Seaborn és una biblioteca de més alt nivell construïda sobre Matplotlib que facilita la creació de gràfics estadístics atractius i informatius.
Objectius
- Entendre les funcionalitats bàsiques de Matplotlib.
- Aprendre a crear gràfics bàsics amb Matplotlib.
- Explorar les capacitats de Seaborn per a la visualització de dades estadístiques.
- Comparar i contrastar Matplotlib i Seaborn.
- Introducció a Matplotlib
1.1 Instal·lació
Per instal·lar Matplotlib, pots utilitzar pip:
1.2 Conceptes Bàsics
Matplotlib es basa en la creació de figures i eixos. Una figura pot contenir múltiples eixos (gràfics).
import matplotlib.pyplot as plt # Crear una figura i eixos fig, ax = plt.subplots() # Dibuixar un gràfic de línies ax.plot([1, 2, 3, 4], [1, 4, 2, 3]) # Mostrar el gràfic plt.show()
1.3 Gràfics Bàsics amb Matplotlib
Gràfic de Línies
import matplotlib.pyplot as plt x = [1, 2, 3, 4] y = [1, 4, 2, 3] plt.plot(x, y) plt.xlabel('X-axis') plt.ylabel('Y-axis') plt.title('Gràfic de Línies') plt.show()
Gràfic de Barres
import matplotlib.pyplot as plt categories = ['A', 'B', 'C', 'D'] values = [3, 7, 5, 4] plt.bar(categories, values) plt.xlabel('Categories') plt.ylabel('Valors') plt.title('Gràfic de Barres') plt.show()
Gràfic de Dispersió
import matplotlib.pyplot as plt x = [1, 2, 3, 4] y = [1, 4, 2, 3] plt.scatter(x, y) plt.xlabel('X-axis') plt.ylabel('Y-axis') plt.title('Gràfic de Dispersió') plt.show()
- Introducció a Seaborn
2.1 Instal·lació
Per instal·lar Seaborn, pots utilitzar pip:
2.2 Conceptes Bàsics
Seaborn està dissenyat per treballar bé amb dades de tipus DataFrame de pandas.
import seaborn as sns import pandas as pd # Crear un DataFrame data = pd.DataFrame({ 'x': [1, 2, 3, 4], 'y': [1, 4, 2, 3] }) # Crear un gràfic de dispersió sns.scatterplot(x='x', y='y', data=data) plt.title('Gràfic de Dispersió amb Seaborn') plt.show()
2.3 Gràfics Bàsics amb Seaborn
Gràfic de Línies
import seaborn as sns import pandas as pd data = pd.DataFrame({ 'x': [1, 2, 3, 4], 'y': [1, 4, 2, 3] }) sns.lineplot(x='x', y='y', data=data) plt.title('Gràfic de Línies amb Seaborn') plt.show()
Gràfic de Barres
import seaborn as sns import pandas as pd data = pd.DataFrame({ 'categories': ['A', 'B', 'C', 'D'], 'values': [3, 7, 5, 4] }) sns.barplot(x='categories', y='values', data=data) plt.title('Gràfic de Barres amb Seaborn') plt.show()
Gràfic de Dispersió
import seaborn as sns import pandas as pd data = pd.DataFrame({ 'x': [1, 2, 3, 4], 'y': [1, 4, 2, 3] }) sns.scatterplot(x='x', y='y', data=data) plt.title('Gràfic de Dispersió amb Seaborn') plt.show()
- Comparació entre Matplotlib i Seaborn
Característica | Matplotlib | Seaborn |
---|---|---|
Nivell de Control | Alt | Mitjà |
Facilitat d'Ús | Moderada | Alta |
Tipus de Gràfics | Bàsics i avançats | Estadístics i avançats |
Integració amb Pandas | Bona | Excel·lent |
Estètica per Defecte | Bàsica | Atractiva |
Exercicis Pràctics
Exercici 1: Gràfic de Línies amb Matplotlib
Crea un gràfic de línies amb les següents dades:
- X: [0, 1, 2, 3, 4, 5]
- Y: [0, 1, 4, 9, 16, 25]
Solució:
import matplotlib.pyplot as plt x = [0, 1, 2, 3, 4, 5] y = [0, 1, 4, 9, 16, 25] plt.plot(x, y) plt.xlabel('X-axis') plt.ylabel('Y-axis') plt.title('Gràfic de Línies') plt.show()
Exercici 2: Gràfic de Barres amb Seaborn
Crea un gràfic de barres amb les següents dades:
- Categories: ['E', 'F', 'G', 'H']
- Valors: [5, 3, 6, 2]
Solució:
import seaborn as sns import pandas as pd data = pd.DataFrame({ 'categories': ['E', 'F', 'G', 'H'], 'values': [5, 3, 6, 2] }) sns.barplot(x='categories', y='values', data=data) plt.title('Gràfic de Barres amb Seaborn') plt.show()
Conclusió
En aquest tema, hem explorat les capacitats de Matplotlib i Seaborn per a la visualització de dades en Python. Hem après a crear gràfics bàsics amb ambdues biblioteques i hem comparat les seves característiques. Ara estàs preparat per utilitzar aquestes eines per a les teves pròpies necessitats de visualització de dades.
Visualització de Dades
Mòdul 1: Introducció a la Visualització de Dades
- Conceptes Bàsics de Visualització de Dades
- Importància de la Visualització de Dades
- Tipus de Dades i Gràfics
Mòdul 2: Eines de Visualització de Dades
- Introducció a Eines de Visualització
- Ús de Microsoft Excel per a Visualització
- Introducció a Tableau
- Ús de Power BI
- Visualització amb Python: Matplotlib i Seaborn
- Visualització amb R: ggplot2
Mòdul 3: Tècniques de Visualització de Dades
- Gràfics de Barres i Columnes
- Gràfics de Línies
- Gràfics de Dispersió
- Gràfics de Pastís
- Mapes de Calor
- Gràfics d'Àrea
- Diagrames de Caixa i Bigots
- Gràfics de Bombolla
Mòdul 4: Principis de Disseny en Visualització de Dades
- Principis de Percepció Visual
- Ús del Color en Visualització
- Disseny de Gràfics Efectius
- Evitar Errors Comuns en Visualització
Mòdul 5: Casos Pràctics i Projectes
- Anàlisi de Dades de Vendes
- Visualització de Dades de Màrqueting
- Projectes de Visualització de Dades en Salut
- Visualització de Dades Financeres