En aquest tema, aprendrem a filtrar i ordenar dades utilitzant SQL a BigQuery. Aquestes operacions són fonamentals per a l'anàlisi de dades, ja que ens permeten seleccionar subconjunts específics de dades i organitzar-los de manera que siguin més fàcils d'interpretar.
Objectius d'aprenentatge
- Comprendre com utilitzar la clàusula
WHERE
per filtrar dades. - Aprendre a utilitzar les clàusules
ORDER BY
iLIMIT
per ordenar i limitar els resultats. - Practicar amb exemples pràctics i exercicis.
Filtrar dades amb la clàusula WHERE
La clàusula WHERE
s'utilitza per filtrar registres que compleixen una condició específica. Només les files que compleixen aquesta condició seran retornades en el resultat de la consulta.
Sintaxi bàsica
Exemple pràctic
Suposem que tenim una taula employees
amb les següents columnes: employee_id
, first_name
, last_name
, department
, i salary
. Volem seleccionar tots els empleats que treballen en el departament de "Sales".
Explicació
SELECT employee_id, first_name, last_name
: Selecciona les columnesemployee_id
,first_name
ilast_name
.FROM employees
: De la taulaemployees
.WHERE department = 'Sales'
: Filtra les files on la columnadepartment
és igual a 'Sales'.
Ordenar dades amb la clàusula ORDER BY
La clàusula ORDER BY
s'utilitza per ordenar els resultats d'una consulta en ordre ascendent o descendent.
Sintaxi bàsica
ASC
: Ordena en ordre ascendent (per defecte).DESC
: Ordena en ordre descendent.
Exemple pràctic
Continuant amb l'exemple anterior, volem ordenar els empleats del departament de "Sales" per salari en ordre descendent.
SELECT employee_id, first_name, last_name, salary FROM employees WHERE department = 'Sales' ORDER BY salary DESC;
Explicació
ORDER BY salary DESC
: Ordena els resultats per la columnasalary
en ordre descendent.
Limitar els resultats amb la clàusula LIMIT
La clàusula LIMIT
s'utilitza per especificar el nombre màxim de files que es retornaran en el resultat de la consulta.
Sintaxi bàsica
Exemple pràctic
Volem seleccionar els 5 empleats amb els salaris més alts del departament de "Sales".
SELECT employee_id, first_name, last_name, salary FROM employees WHERE department = 'Sales' ORDER BY salary DESC LIMIT 5;
Explicació
LIMIT 5
: Limita el resultat a les primeres 5 files.
Exercicis pràctics
Exercici 1
Selecciona tots els empleats del departament de "Engineering" i ordena'ls per last_name
en ordre ascendent.
SELECT employee_id, first_name, last_name FROM employees WHERE department = 'Engineering' ORDER BY last_name ASC;
Exercici 2
Selecciona els 10 empleats amb els salaris més baixos i ordena'ls per salary
en ordre ascendent.
Exercici 3
Selecciona tots els empleats que tenen un salari superior a 50,000 i ordena'ls per first_name
en ordre descendent.
SELECT employee_id, first_name, last_name, salary FROM employees WHERE salary > 50000 ORDER BY first_name DESC;
Resum
En aquest tema, hem après a:
- Utilitzar la clàusula
WHERE
per filtrar dades basades en condicions específiques. - Utilitzar la clàusula
ORDER BY
per ordenar els resultats en ordre ascendent o descendent. - Utilitzar la clàusula
LIMIT
per limitar el nombre de files retornades en el resultat de la consulta.
Aquestes habilitats són fonamentals per treballar amb dades a BigQuery i ens permeten extreure informació rellevant de grans conjunts de dades de manera eficient. En el següent tema, explorarem com agregar dades utilitzant funcions d'agregació com COUNT
, SUM
, AVG
, MIN
i MAX
.
Curs de BigQuery
Mòdul 1: Introducció a BigQuery
- Què és BigQuery?
- Configurar el teu entorn de BigQuery
- Comprendre l'arquitectura de BigQuery
- Visió general de la consola de BigQuery
Mòdul 2: SQL bàsic a BigQuery
Mòdul 3: SQL intermedi a BigQuery
Mòdul 4: SQL avançat a BigQuery
- Unions avançades
- Camps niats i repetits
- Funcions definides per l'usuari (UDFs)
- Particionament i agrupament
Mòdul 5: Gestió de dades a BigQuery
- Carregar dades a BigQuery
- Exportar dades de BigQuery
- Transformació i neteja de dades
- Gestió de conjunts de dades i taules
Mòdul 6: Optimització del rendiment de BigQuery
- Tècniques d'optimització de consultes
- Comprendre els plans d'execució de consultes
- Ús de vistes materialitzades
- Optimització de l'emmagatzematge
Mòdul 7: Seguretat i compliment de BigQuery
Mòdul 8: Integració i automatització de BigQuery
- Integració amb serveis de Google Cloud
- Ús de BigQuery amb Dataflow
- Automatització de fluxos de treball amb Cloud Functions
- Programació de consultes amb Cloud Scheduler
Mòdul 9: Aprenentatge automàtic a BigQuery (BQML)
- Introducció a BigQuery ML
- Creació i entrenament de models
- Avaluació i predicció amb models
- Funcions avançades de BQML