En el subcapítol anterior vam veure els logs, mètriques i alarmes de CloudWatch. Tens moltíssima informació valuosa... però dispersa. Com la presentes de manera que s'entengui d'una ullada? Per això hi ha els Dashboards (panells), que reuneixen les teves mètriques en pantalles visuals. I veurem Contributor Insights, una eina per descobrir qui o què hi ha darrere d'un comportament.
El problema: moltes dades, poca visió de conjunt
Tens mètriques dels teus servidors, la teva base de dades, el teu balancejador, les teves Lambdas... cadascuna per separat. Per saber «com va el sistema en general», hauries d'anar mirant una per una. Necessites una vista de conjunt: una sola pantalla on veure l'estat de tot allò important alhora.
Què és un Dashboard de CloudWatch
Un Dashboard (panell) de CloudWatch és una pantalla personalitzable on col·loques les gràfiques de les mètriques que t'importen, juntes, per veure-les d'una ullada. Tu tries què mostrar i com organitzar-ho:
┌─────────────── Dashboard "Producció" ───────────────┐ │ CPU servidors │ Peticions/seg │ │ ▁▂▅▇▅▂▁ │ ▃▅▆▇▆▅▃ │ │──────────────────────┼───────────────────────────────│ │ Errors HTTP │ Latència base de dades │ │ ▁▁▁▂▁▁▁ │ ▂▂▃▂▂▂▃ │ └──────────────────────┴───────────────────────────────┘
Analogia: un Dashboard és com el panell de control de la cabina d'un avió o la sala de control d'una central: tots els indicadors importants reunits en un lloc, organitzats perquè el pilot (o operador) vegi l'estat complet del sistema d'una sola ullada, sense haver d'anar mirant instrument per instrument en llocs diferents.
Per a què serveixen els Dashboards
- Visió general d'una ullada: està tot el sistema sa ara mateix? Una mirada al dashboard t'ho diu.
- Pantalles d'operació: molts equips tenen dashboards en pantalles grans a l'oficina (o sempre oberts) per vigilar producció contínuament.
- Investigar incidents: quan alguna cosa va malament, un bon dashboard et mostra totes les mètriques relacionades juntes, cosa que ajuda a correlacionar («quan va pujar la CPU, també va pujar la latència... estan relacionats»).
- Compartir l'estat: serveixen perquè tot l'equip (tècnic o no) vegi com va el sistema.
Pots tenir diversos dashboards: un de general, un per aplicació, un per a l'equip de negoci amb mètriques de negoci (comandes, ingressos), etc.
Exemple del món real: un equip que gestiona una plataforma de streaming té un dashboard sempre visible en una pantalla de l'oficina. Mostra: usuaris connectats, amplada de banda usada, errors de reproducció i latència. Durant l'estrena d'una sèrie molt esperada, l'equip veu en directe com pugen els usuaris connectats, i vigila que els errors es mantinguin baixos. Quan veuen un petit repunt d'errors, actuen abans que afecti més gent. El dashboard els dóna el pols del sistema en temps real.
El problema més difícil: QUI causa això?
Les mètriques normals et diuen quant (ex.: «hi ha 10.000 peticions per minut»). Però a vegades necessites saber qui o què hi ha darrere d'un número:
- «Hi ha moltíssim trànsit... de quin usuari o IP ve?»
- «La base de dades està saturada... quina consulta o quin client la satura?»
- «Quins són els 10 usuaris que més recursos consumeixen?»
Això és difícil de veure en una gràfica normal, que només mostra el total. Aquí entra Contributor Insights.
Què és Contributor Insights
CloudWatch Contributor Insights analitza els teus logs per identificar els principals contribuïdors a un comportament: qui o què està generant la major part de certa activitat. Et mostra rànquings dels «més responsables»:
Contributor Insights — "IPs amb més peticions": 1. 203.0.113.5 → 45.000 peticions ← sospitós 2. 198.51.100.2 → 3.200 peticions 3. 192.0.2.10 → 2.800 peticions ...
Analogia: Contributor Insights és com el detectiu que, davant d'una multitud, identifica els caps. La mètrica normal et diu «hi ha molta gent i molt soroll»; Contributor Insights et diu «el soroll el fan aquestes tres persones concretes». Et porta del «quant» al «qui».
Per a què serveix Contributor Insights
- Detectar abusos: identificar la IP o l'usuari que està fent un ús anormal (possible atac o client que satura el sistema).
- Trobar el culpable d'un problema: «què està saturant la base de dades?» → veure quin client o consulta domina.
- Entendre l'ús real: «quins endpoints de la meva API s'utilitzen més?», «quins clients consumeixen més recursos?».
Exemple del món real: una API comença a anar lenta perquè rep moltíssim trànsit. La mètrica «peticions totals» confirma el volum alt, però no la causa. Amb Contributor Insights, l'equip veu a l'instant que una sola IP està generant el 80 % de les peticions: un client amb un bug que crida l'API en bucle. Bloquegen aquesta IP i el sistema es normalitza. Sense Contributor Insights, haurien trigat hores a trobar el culpable entre milers de clients.
Com encaixen: del «quant» al «qui»
DASHBOARDS → visió general d'una ullada (com va tot?) MÈTRIQUES + ALARMES → quant està passant i quan avisar (Cap. 24.1) CONTRIBUTOR INSIGHTS → QUI o què hi ha darrere d'un comportament
Els dashboards et donen la foto general; les mètriques i alarmes, els números i avisos; i Contributor Insights, quan cal, et porta al detall de qui causa alguna cosa.
El que has de recordar
- Un Dashboard de CloudWatch és una pantalla personalitzable que reuneix les gràfiques de les mètriques que t'importen, per veure l'estat de tot d'una ullada. Com el panell de control d'una cabina.
- Serveixen per a: visió general, pantalles d'operació sempre visibles, investigar incidents (correlacionar mètriques) i compartir l'estat amb l'equip.
- Les mètriques normals diuen quant; a vegades necessites saber qui o què ho causa.
- Contributor Insights analitza els logs per identificar els principals contribuïdors a un comportament (rànquings de «més responsables»). Com el detectiu que identifica els caps d'una multitud.
- Serveix per detectar abusos (una IP que ataca), trobar el culpable d'un problema (què satura la BD) i entendre l'ús real.
En el següent subcapítol farem un pas més en l'observabilitat: seguir el rastre d'una petició a través de molts serveis amb el traçat distribuït i X-Ray.
Cloud, AWS & Terraform — De zero a expert
Capítol 1 · Què és el cloud computing
- 1.1 El model client-servidor tradicional
- 1.2 Problemes que venia a resoldre el núvol
- 1.3 On-premise vs cloud vs híbrid
- 1.4 Els tres models de servei: IaaS, PaaS, SaaS
- 1.5 Els cinc pilars del cloud (segons NIST)
- 1.6 Avantatges reals: elasticitat, pagament per ús, disponibilitat global
Capítol 2 · El mercat cloud i els grans proveïdors
- 2.1 AWS, Azure i GCP: diferències i quotes de mercat
- 2.2 Per què aprendre AWS primer
- 2.3 Conceptes que són universals entre proveïdors
Capítol 3 · Regions, zones de disponibilitat i edge
- 3.1 Què és una regió AWS i com triar-la
- 3.2 Availability Zones: alta disponibilitat des del disseny
- 3.3 Edge locations i CloudFront
- 3.4 Latència, resiliència i sobirania de dades
Capítol 4 · Càlcul: EC2
- 4.1 Instàncies: tipus, famílies i quan triar cadascuna
- 4.2 AMIs, key pairs i Security Groups
- 4.3 Cicle de vida d'una instància
- 4.4 Elastic IPs i Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítol 5 · Emmagatzematge: S3
- 5.1 Buckets, objectes i claus
- 5.2 Classes d'emmagatzematge (Standard, IA, Glacier…)
- 5.3 Versionat i cicle de vida d'objectes
- 5.4 Polítiques de bucket i ACLs
- 5.5 Hosting de llocs web estàtics
Capítol 6 · Xarxes: VPC
- 6.1 Què és una VPC i per què la necessites
- 6.2 Subxarxes públiques i privades
- 6.3 Internet Gateway i NAT Gateway
- 6.4 Route Tables i Network ACLs
- 6.5 VPC Peering i endpoints
Capítol 7 · Identitat i accés: IAM
- 7.1 Usuaris, grups, rols i polítiques
- 7.2 El principi de mínim privilegi
- 7.3 Polítiques basades en identitat vs en recurs
- 7.4 MFA i credencials temporals (STS)
- 7.5 Bones pràctiques de seguretat IAM
Capítol 8 · Bases de dades gestionades
- 8.1 RDS: motors, Multi-AZ i rèpliques de lectura
- 8.2 Aurora i els seus avantatges sobre RDS vanilla
- 8.3 DynamoDB: model clau-valor / documents
- 8.4 ElastiCache per a memòria cau en memòria
- 8.5 Quan utilitzar cada tipus de base de dades
Capítol 9 · Per què Infraestructura com a Codi
- 9.1 Problemes del provisionament manual
- 9.2 IaC declaratiu vs imperatiu
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El cicle plan → apply → destroy
Capítol 10 · HCL: el llenguatge de Terraform
- 10.1 Blocs resource, variable, output, locals
- 10.2 Tipus de dades: string, number, bool, list, map, object
- 10.3 Expressions, referències i funcions built-in
- 10.4 Condicionals i bucles (count, for_each, for)
Capítol 11 · Providers i estat
- 11.1 Com funciona el provider d'AWS
- 11.2 El fitxer terraform.tfstate i la seva importància
- 11.3 State local vs state remot (S3 + DynamoDB)
- 11.4 Comandes essencials: init, plan, apply, destroy, fmt, validate
Capítol 12 · La teva primera infraestructura real amb Terraform
- 12.1 Crear una VPC amb subxarxes des de zero
- 12.2 Posar en marxa una instància EC2 pública
- 12.3 Associar un Security Group i una Elastic IP
- 12.4 Outputs i referències entre recursos
- 12.5 Flux de treball en equip: PR review de plans
Capítol 13 · Balanceig de càrrega i autoescalat
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners i regles
- 13.3 Auto Scaling Groups: polítiques i mètriques
- 13.4 Warm pools i lifecycle hooks
Capítol 14 · Serverless amb Lambda
- 14.1 El model d'execució de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestió de dependències i capes (Layers)
- 14.4 Cold starts i estratègies per reduir-los
- 14.5 Límits i antipatrones
Capítol 15 · Missatgeria i esdeveniments
- 15.1 SQS: cues estàndard vs FIFO, DLQ
- 15.2 SNS: topics, subscripcions, fan-out
- 15.3 EventBridge: event buses i regles
- 15.4 Patrons: pub/sub, desacoblament, saga
Capítol 16 · Lliurament de contingut i DNS
- 16.1 Route 53: tipus de registres i routing policies
- 16.2 CloudFront: distribucions, memòries cau i origins
- 16.3 ACM: certificats SSL/TLS gratuïts
- 16.4 WAF integrat amb CloudFront
Capítol 17 · Contenidors a AWS
- 17.1 Docker: repàs exprés de conceptes clau
- 17.2 ECR: registre privat d'imatges
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: quan Kubernetes i quan no
Capítol 18 · Mòduls: reutilització i composició
- 18.1 Anatomia d'un mòdul Terraform
- 18.2 Variables d'entrada, outputs i dependències
- 18.3 Mòduls locals vs mòduls del Terraform Registry
- 18.4 Versionat de mòduls amb Git tags
- 18.5 Disseny de mòduls genèrics vs específics de domini
Capítol 19 · Workspaces i gestió d'entorns
- 19.1 Workspaces de Terraform: casos d'ús i limitacions
- 19.2 Estratègia de directoris per entorn (dev/stg/prod)
- 19.3 Terragrunt: DRY per a configuracions d'entorn
- 19.4 Variables d'entorn i fitxers .tfvars
Capítol 20 · Backends remots i locking
- 20.1 Configurar S3 + DynamoDB com a backend
- 20.2 State locking: evitar corrupció en equip
- 20.3 Migració d'estat entre backends
- 20.4 terraform import: portar recursos existents a l'estat
Capítol 21 · Testing d'infraestructura
- 21.1 Terraform validate i fmt en CI
- 21.2 Checkov i tfsec: anàlisi de seguretat estàtica
- 21.3 Terratest: tests d'integració en Go
- 21.4 Contract testing entre mòduls
Capítol 22 · Terraform en CI/CD
- 22.1 Pipeline bàsic: lint → plan → apply a GitHub Actions
- 22.2 Atlantis: GitOps per a Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection i reconciliació automàtica
Capítol 23 · Seguretat en profunditat
- 23.1 AWS Organizations i Service Control Policies
- 23.2 AWS Config: compliment continu
- 23.3 GuardDuty: detecció d'amenaces
- 23.4 Security Hub: visió centralitzada
- 23.5 KMS: gestió de claus i rotació
- 23.6 Secrets Manager vs Parameter Store
Capítol 24 · Observabilitat: logs, mètriques i traces
- 24.1 CloudWatch Logs, mètriques i alarmes
- 24.2 CloudWatch Dashboards i Contributor Insights
- 24.3 X-Ray: traçat distribuït
- 24.4 OpenTelemetry a AWS
- 24.5 Managed Grafana i Managed Prometheus
Capítol 25 · Optimització de costos
- 25.1 AWS Cost Explorer i pressupostos amb alertes
- 25.2 Trusted Advisor i Compute Optimizer
- 25.3 Rightsizing: com detectar sobredimensionament
- 25.4 Savings Plans vs Reserved Instances: decisió estratègica
- 25.5 FinOps: cultura i processos per controlar la despesa
Capítol 26 · Alta disponibilitat i disaster recovery
- 26.1 RTO i RPO: definir els objectius
- 26.2 Estratègies: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks i failover automàtic
- 26.4 AWS Backup: política centralitzada de còpies
Capítol 27 · Well-Architected Framework d'AWS
- 27.1 Els sis pilars: excel·lència operacional, seguretat, fiabilitat, eficiència de rendiment, optimització de costos, sostenibilitat
- 27.2 Well-Architected Tool: revisions formals
- 27.3 Com aplicar el framework en decisions de disseny
Capítol 28 · Arquitectures serverless a escala
- 28.1 Event-driven architecture amb Lambda + EventBridge
- 28.2 Saga pattern per a transaccions distribuïdes
- 28.3 Step Functions: orquestració de workflows complexos
- 28.4 Lambda@Edge i CloudFront Functions
Capítol 29 · Plataformes de dades a AWS
- 29.1 Data Lake amb S3, Glue i Athena
- 29.2 Kinesis Data Streams i Firehose per a streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: govern del dada
Capítol 30 · Multi-compte i landing zones
- 30.1 Per què separar workloads en comptes diferents
- 30.2 AWS Control Tower i Account Factory
- 30.3 Gestió centralitzada de logs i seguretat
- 30.4 Terraform a escala multi-compte amb mòduls compartits
Capítol 31 · Platform Engineering i Internal Developer Platform
- 31.1 Golden paths i abstraccions sobre Terraform
- 31.2 Service Catalog d'AWS
- 31.3 Backstage com a portal de desenvolupadors
- 31.4 Mòduls Terraform com a producte intern
Capítol 32 · Certificacions AWS rellevants
- 32.1 Cloud Practitioner: val la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítol 33 · Projectes per consolidar el que s'ha après
- 33.1 Projecte 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Projecte 2: API REST amb ECS Fargate + RDS + ALB
- 33.3 Projecte 3: plataforma de dades amb Glue + Athena + Redshift
- 33.4 Projecte 4: landing zone multi-compte amb Terraform i Control Tower
