Introducció
En aquest tema, aprendrem com utilitzar BigQuery per analitzar dades d'analítiques web i d'aplicacions. Aquest tipus d'anàlisi és crucial per comprendre el comportament dels usuaris, optimitzar l'experiència de l'usuari i prendre decisions informades basades en dades.
Objectius
- Comprendre com importar dades d'analítiques web i d'aplicacions a BigQuery.
- Aprendre a realitzar consultes per obtenir informació útil sobre el comportament dels usuaris.
- Utilitzar funcions avançades de BigQuery per analitzar dades de manera eficient.
Importació de dades d'analítiques web i d'aplicacions
Configuració de Google Analytics 360 amb BigQuery
Google Analytics 360 permet exportar dades directament a BigQuery. A continuació es mostren els passos per configurar aquesta integració:
-
Accedeix a Google Analytics 360:
- Inicia sessió a Google Analytics 360.
- Ves a l'administrador i selecciona la propietat que vols vincular amb BigQuery.
-
Configura la vinculació amb BigQuery:
- A la columna de la propietat, fes clic a "BigQuery Linking".
- Fes clic a "Link" i segueix les instruccions per autoritzar l'accés a BigQuery.
-
Selecciona el projecte de BigQuery:
- Tria el projecte de Google Cloud on vols emmagatzemar les dades.
- Configura les opcions d'exportació segons les teves necessitats.
Importació de dades d'aplicacions mòbils
Per a aplicacions mòbils, Firebase és una eina popular que es pot integrar amb BigQuery:
-
Configura Firebase:
- Inicia sessió a Firebase Console.
- Selecciona el teu projecte i ves a "Project Settings".
-
Vincula Firebase amb BigQuery:
- A la pestanya "Integrations", fes clic a "Link" sota BigQuery.
- Autoritza l'accés i selecciona el projecte de BigQuery.
-
Configura l'exportació de dades:
- Tria les dades que vols exportar i configura la freqüència d'exportació.
Consultes bàsiques per a l'anàlisi d'analítiques web
Exemple 1: Comptar el nombre de sessions per dia
SELECT DATE(session_start_time) AS date, COUNT(*) AS session_count FROM `project_id.dataset_id.analytics_data` GROUP BY date ORDER BY date;
Explicació:
DATE(session_start_time)
: Converteix el temps d'inici de la sessió en una data.COUNT(*)
: Comptabilitza el nombre de sessions.GROUP BY date
: Agrupa els resultats per data.ORDER BY date
: Ordena els resultats per data.
Exemple 2: Pàgines més visitades
SELECT page_path, COUNT(*) AS page_views FROM `project_id.dataset_id.analytics_data` GROUP BY page_path ORDER BY page_views DESC LIMIT 10;
Explicació:
page_path
: La ruta de la pàgina visitada.COUNT(*)
: Comptabilitza el nombre de visites a cada pàgina.GROUP BY page_path
: Agrupa els resultats per ruta de pàgina.ORDER BY page_views DESC
: Ordena els resultats per nombre de visites en ordre descendent.LIMIT 10
: Mostra les 10 pàgines més visitades.
Consultes avançades per a l'anàlisi d'analítiques d'aplicacions
Exemple 1: Anàlisi de retenció d'usuaris
WITH first_touch AS ( SELECT user_pseudo_id, MIN(event_timestamp) AS first_touch_timestamp FROM `project_id.dataset_id.app_events` GROUP BY user_pseudo_id ), retention AS ( SELECT user_pseudo_id, DATE_DIFF(DATE(event_timestamp), DATE(first_touch_timestamp), DAY) AS days_since_first_touch FROM `project_id.dataset_id.app_events` AS events JOIN first_touch ON events.user_pseudo_id = first_touch.user_pseudo_id ) SELECT days_since_first_touch, COUNT(*) AS user_count FROM retention GROUP BY days_since_first_touch ORDER BY days_since_first_touch;
Explicació:
first_touch
: Subconsulta per obtenir el primer esdeveniment de cada usuari.retention
: Subconsulta per calcular els dies des del primer esdeveniment per a cada usuari.DATE_DIFF
: Calcula la diferència en dies entre dos timestamps.COUNT(*)
: Comptabilitza el nombre d'usuaris per cada dia des del primer esdeveniment.
Exemple 2: Anàlisi de conversions
SELECT event_name, COUNT(*) AS event_count FROM `project_id.dataset_id.app_events` WHERE event_name IN ('purchase', 'signup', 'add_to_cart') GROUP BY event_name ORDER BY event_count DESC;
Explicació:
event_name
: El nom de l'esdeveniment (per exemple, 'purchase', 'signup', 'add_to_cart').COUNT(*)
: Comptabilitza el nombre d'esdeveniments per tipus.GROUP BY event_name
: Agrupa els resultats per nom d'esdeveniment.ORDER BY event_count DESC
: Ordena els resultats per nombre d'esdeveniments en ordre descendent.
Exercicis pràctics
Exercici 1: Comptar el nombre d'usuaris únics per dia
Descripció: Escriu una consulta per comptar el nombre d'usuaris únics que han visitat el teu lloc web cada dia.
Solució:
SELECT DATE(session_start_time) AS date, COUNT(DISTINCT user_id) AS unique_users FROM `project_id.dataset_id.analytics_data` GROUP BY date ORDER BY date;
Exercici 2: Trobar les pàgines amb la major taxa de rebot
Descripció: Escriu una consulta per trobar les pàgines amb la major taxa de rebot. La taxa de rebot es defineix com el percentatge de sessions que comencen i acaben en la mateixa pàgina.
Solució:
SELECT page_path, COUNTIF(is_bounce) / COUNT(*) AS bounce_rate FROM `project_id.dataset_id.analytics_data` GROUP BY page_path ORDER BY bounce_rate DESC LIMIT 10;
Resum
En aquest tema, hem après com importar dades d'analítiques web i d'aplicacions a BigQuery i com realitzar consultes per obtenir informació útil sobre el comportament dels usuaris. Hem vist exemples pràctics de consultes bàsiques i avançades, i hem practicat amb exercicis per reforçar els conceptes apresos. Amb aquestes habilitats, estàs preparat per analitzar dades d'analítiques web i d'aplicacions de manera eficient i prendre decisions informades basades en dades.
Curs de BigQuery
Mòdul 1: Introducció a BigQuery
- Què és BigQuery?
- Configurar el teu entorn de BigQuery
- Comprendre l'arquitectura de BigQuery
- Visió general de la consola de BigQuery
Mòdul 2: SQL bàsic a BigQuery
Mòdul 3: SQL intermedi a BigQuery
Mòdul 4: SQL avançat a BigQuery
- Unions avançades
- Camps niats i repetits
- Funcions definides per l'usuari (UDFs)
- Particionament i agrupament
Mòdul 5: Gestió de dades a BigQuery
- Carregar dades a BigQuery
- Exportar dades de BigQuery
- Transformació i neteja de dades
- Gestió de conjunts de dades i taules
Mòdul 6: Optimització del rendiment de BigQuery
- Tècniques d'optimització de consultes
- Comprendre els plans d'execució de consultes
- Ús de vistes materialitzades
- Optimització de l'emmagatzematge
Mòdul 7: Seguretat i compliment de BigQuery
Mòdul 8: Integració i automatització de BigQuery
- Integració amb serveis de Google Cloud
- Ús de BigQuery amb Dataflow
- Automatització de fluxos de treball amb Cloud Functions
- Programació de consultes amb Cloud Scheduler
Mòdul 9: Aprenentatge automàtic a BigQuery (BQML)
- Introducció a BigQuery ML
- Creació i entrenament de models
- Avaluació i predicció amb models
- Funcions avançades de BQML