Tanquem el capítol d'observabilitat amb dues eines molt populars en el món del codi obert que AWS ofereix com a serveis gestionats: Prometheus (per recopilar i emmagatzemar mètriques) i Grafana (per visualitzar-les en panells preciosos). Són l'estàndard de facto en moltes empreses, especialment amb Kubernetes, i entendre què són i per què utilitzar-los en la seva versió gestionada t'obre la porta a un ecosistema enorme.

El context: l'ecosistema open source d'observabilitat

A més de CloudWatch (l'eina nativa d'AWS), existeix un ecosistema d'eines de codi obert molt estès per a observabilitat. Dues de les més populars són:

  • Prometheus: per recopilar i emmagatzemar mètriques.
  • Grafana: per visualitzar aquestes mètriques (i d'altres) en panells.

Molta gent les fa servir juntes i són gairebé un estàndard, sobretot en entorns amb Kubernetes (recorda EKS, subcapítol 17.4). El problema: instal·lar-les i mantenir-les tu mateix dóna feina (servidors, actualitzacions, escalat, còpies...). Per això AWS ofereix versions gestionades d'ambdues, on AWS s'encarrega de tota aquesta operació (recorda la idea de «servei gestionat» que vam veure amb RDS al Capítol 8).

Què és Prometheus (i Managed Prometheus)

Prometheus és un sistema de codi obert per recopilar i emmagatzemar mètriques, molt popular, especialment en el món dels contenidors i Kubernetes. Recull mètriques de les teves aplicacions i serveis i les guarda de manera optimitzada per consultar-les.

Amazon Managed Service for Prometheus és la versió gestionada que ofereix AWS: tu utilitzes Prometheus, però AWS s'encarrega dels servidors, l'escalat, la disponibilitat i el manteniment. Tu et centres en les teves mètriques, no en operar la infraestructura de Prometheus.

Les teves aplicacions / Kubernetes
        │ (emeten mètriques)
        ▼
Managed Prometheus (recull i emmagatzema les mètriques)
        │ AWS gestiona els servidors, escalat, disponibilitat...
        ▼
   llestes per consultar i visualitzar

Analogia: Prometheus és com un magatzem especialitzat a guardar mesuraments (milions de números al llarg del temps), molt ben organitzat per trobar-los ràpid. La versió gestionada és com llogar aquest magatzem amb tot el personal inclòs: tu hi poses i consultes les mesuraments, però no t'has de preocupar de mantenir l'edifici, la seguretat ni d'ampliar-lo quan s'omple. AWS ho opera per tu.

Què és Grafana (i Managed Grafana)

Grafana és una eina de codi obert per visualitzar dades en panells (dashboards) molt potents, flexibles i atractius. És famosa per les seves gràfiques espectaculars i per poder ajuntar dades de moltes fonts diferents en un mateix panell (de Prometheus, de CloudWatch, de bases de dades...).

Amazon Managed Grafana és la versió gestionada: AWS opera Grafana per tu (servidors, actualitzacions, escalat, seguretat), i tu només crees i utilitzes els teus dashboards.

   ┌──────────── Dashboard de Grafana ────────────┐
   │  Dades de Managed Prometheus  +  CloudWatch   │
   │  + base de dades  +  altres fonts, JUNTS      │
   │   📊 gràfiques potents i personalitzables      │
   └───────────────────────────────────────────────┘

Analogia: Grafana és com un estudi de disseny de panells de control professional: agafa dades d'on sigui i les converteix en pantalles visuals clares, boniques i molt configurables. La versió gestionada és contractar aquest estudi «clau en mà»: tu dissenyes els teus panells, però no mantens el local ni els equips.

Com treballen junts Prometheus i Grafana

La combinació clàssica és Prometheus recull, Grafana visualitza:

Aplicacions → Managed Prometheus (recull i guarda mètriques)
                        │
                        ▼
              Managed Grafana (visualitza aquestes mètriques en dashboards)

Prometheus és el «magatzem de números» i Grafana la «pantalla bonica» que els mostra. Junts formen una solució d'observabilitat completa i molt utilitzada a la indústria.

Per què utilitzar aquestes versions gestionades?

La pregunta clau: si ja existeix CloudWatch, per què utilitzar Prometheus i Grafana gestionats? Raons habituals:

  • Estàndard de la indústria: Prometheus i Grafana són l'estàndard de facto en moltíssimes empreses, sobretot amb Kubernetes. Si el teu equip ja els coneix o el teu ecosistema els utilitza, té molt sentit.
  • Sense el dolor d'operar-los: obtens aquestes potents eines open source sense haver-les d'instal·lar ni mantenir (AWS ho fa).
  • Flexibilitat de Grafana: Grafana pot ajuntar dades de moltes fonts (Prometheus, CloudWatch, altres núvols, bases de dades...) en un mateix panell, ideal per a entorns multi-núvol o híbrids.
  • Portabilitat: com que són eines estàndard, la teva inversió en dashboards i configuració és portable (encaixa amb la filosofia d'OpenTelemetry del subcapítol 24.4: evitar el lock-in).

Exemple del món real: una empresa que executa les seves aplicacions en Kubernetes (EKS) ja utilitza Prometheus i Grafana, com és habitual en aquest món. En lloc de mantenir aquests sistemes ells mateixos (amb la feina d'operació que comporta), adopten Managed Prometheus i Managed Grafana. Conserven exactament les eines que el seu equip domina, els seus dashboards funcionen igual, però ara AWS s'ocupa de mantenir-los disponibles i escalats. A més, a Grafana ajunten en un mateix panell les mètriques de Prometheus i algunes de CloudWatch, tenint una visió unificada. El millor dels dos mons: eines estàndard que coneixen, operades per AWS.

CloudWatch vs Prometheus/Grafana: quin?

No és que un sigui millor; depèn del context:

CloudWatch Managed Prometheus + Grafana
Origen Natiu d'AWS Open source (estàndard de la indústria)
Integració amb AWS Total i immediata Bona, però menys «nativa»
Ideal si Estàs centrat en AWS i vols el més simple Utilitzes Kubernetes, multi-núvol, o el teu equip ja domina aquestes eines
Portabilitat Lligada a AWS Alta (eines estàndard)

Per començar i si només utilitzes AWS, CloudWatch és el més directe. Si vens del món Kubernetes/open source o treballes multi-núvol, Prometheus + Grafana gestionats encaixen millor.

El que has de recordar

  • Existeix un ecosistema open source d'observabilitat molt estès; dues peces clau són Prometheus (recull i emmagatzema mètriques) i Grafana (les visualitza en dashboards), molt utilitzades juntes, sobretot amb Kubernetes.
  • AWS ofereix versions gestionades: Amazon Managed Service for Prometheus i Amazon Managed Grafana, on AWS opera els servidors, escalat i manteniment (com qualsevol servei gestionat).
  • Prometheus = «magatzem de mesuraments» optimitzat; Grafana = «estudi de panells» que ajunta dades de moltes fonts en gràfiques potents. Combinació clàssica: Prometheus recull, Grafana visualitza.
  • S'utilitzen per ser l'estàndard de la indústria (especialment amb Kubernetes), per evitar el dolor d'operar-los, per la flexibilitat de Grafana amb múltiples fonts, i per la seva portabilitat (sense lock-in, en línia amb OpenTelemetry).
  • CloudWatch és ideal si et centres en AWS i vols simplicitat; Prometheus + Grafana gestionats, si utilitzes Kubernetes/multi-núvol o el teu equip ja els domina.

Has completat el Capítol 24 i, amb ell, domines l'observabilitat a AWS: logs, mètriques, alarmes, dashboards, traçat distribuït, l'estàndard OpenTelemetry i les eines gestionades open source! Al Capítol 25 abordarem un altre aspecte crucial d'operar al núvol: la optimització de costos.

Cloud, AWS & Terraform — De zero a expert

Capítol 1 · Què és el cloud computing

Capítol 2 · El mercat cloud i els grans proveïdors

Capítol 3 · Regions, zones de disponibilitat i edge

Capítol 4 · Càlcul: EC2

Capítol 5 · Emmagatzematge: S3

Capítol 6 · Xarxes: VPC

Capítol 7 · Identitat i accés: IAM

Capítol 8 · Bases de dades gestionades

Capítol 9 · Per què Infraestructura com a Codi

Capítol 10 · HCL: el llenguatge de Terraform

Capítol 11 · Providers i estat

Capítol 12 · La teva primera infraestructura real amb Terraform

Capítol 13 · Balanceig de càrrega i autoescalat

Capítol 14 · Serverless amb Lambda

Capítol 15 · Missatgeria i esdeveniments

Capítol 16 · Lliurament de contingut i DNS

Capítol 17 · Contenidors a AWS

Capítol 18 · Mòduls: reutilització i composició

Capítol 19 · Workspaces i gestió d'entorns

Capítol 20 · Backends remots i locking

Capítol 21 · Testing d'infraestructura

Capítol 22 · Terraform en CI/CD

Capítol 23 · Seguretat en profunditat

Capítol 24 · Observabilitat: logs, mètriques i traces

Capítol 25 · Optimització de costos

Capítol 26 · Alta disponibilitat i disaster recovery

Capítol 27 · Well-Architected Framework d'AWS

Capítol 28 · Arquitectures serverless a escala

Capítol 29 · Plataformes de dades a AWS

Capítol 30 · Multi-compte i landing zones

Capítol 31 · Platform Engineering i Internal Developer Platform

Capítol 32 · Certificacions AWS rellevants

Capítol 33 · Projectes per consolidar el que s'ha après

Capítol 34 · Recursos i comunitat

© Copyright 2024. Tots els drets reservats