S3 guarda les teves dades, però qui pot veure-les o modificar-les? Controlar l'accés als teus buckets és un dels aspectes més crítics de la seguretat al núvol. Les filtracions de dades per buckets mal configurats han estat notícia moltes vegades. En aquest subcapítol aprendràs a controlar qui accedeix a què, i els errors que mai has de cometre.
El punt de partida: tot està bloquejat
Bona notícia per començar: per defecte, un bucket nou és completament privat. Només el teu compte pot accedir-hi. Perquè algú més (un altre compte, un servei, o el públic) hi pugui accedir, ho has de concedir explícitament. AWS aplica aquí el principi de «denegar per defecte».
El problema gairebé sempre ve quan algú obre l'accés de més sense voler. Vegem les eines per obrir-lo (amb cura).
Les formes de controlar l'accés
Hi ha diverses maneres de gestionar permisos a S3. Les principals:
- Polítiques de bucket (l'eina principal)
Una bucket policy és un document (en format JSON) que s'adjunta a un bucket i defineix regles detallades sobre qui pot fer què amb els objectes.
Analogia: És com el reglament d'accés d'un edifici, penjat a l'entrada: «els repartidors poden entrar al magatzem; el públic només a la recepció; ningú entra a les oficines sense targeta».
Una política de bucket especifica, en cada regla:
- Qui (quin compte, usuari o servei, o «tothom»).
- Quina acció (llegir, escriure, esborrar…).
- Sobre quins objectes (tot el bucket o una part).
- Permetre o denegar.
Exemple conceptual d'una política:
"Permetre a QUALSEVOL (públic) LLEGIR els objectes que estiguin dins la carpeta /public/ d'aquest bucket."
Això serviria, per exemple, per a una web estàtica (subcapítol 5.5) on vols que tothom vegi certs fitxers però no d'altres.
Aquí tens un exemple real de bucket policy que permet lectura pública d'una carpeta:
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "LecturaPublicaWeb",
"Effect": "Allow",
"Principal": "*",
"Action": "s3:GetObject",
"Resource": "arn:aws:s3:::mi-bucket-web/publico/*"
}
]
}No et preocupis per entendre cada línia ara; ho veurem en detall amb IAM al Capítol 7. L'important: Effect és permetre/denegar, Principal és qui, Action és què pot fer i Resource és sobre què.
- ACLs (el mètode antic)
Les ACLs (Access Control Lists, llistes de control d'accés) són un mecanisme més antic i simple per donar permisos bàsics a objectes o buckets.
Recomanació d'AWS: evita les ACLs. Avui dia AWS recomana usar polítiques de bucket i IAM en el seu lloc, perquè són més clares i potents. De fet, AWS ara desactiva les ACLs per defecte als buckets nous. Has de saber que existeixen (les veuràs en documentació antiga), però no les facis servir si ho pots evitar.
- Polítiques d'IAM
També pots controlar l'accés des del costat de l'usuari amb polítiques d'IAM (Capítol 7): «aquest usuari pot llegir d'aquests buckets». És complementari a les polítiques de bucket. La diferència: les polítiques de bucket s'adjunten al recurs (el bucket), les d'IAM s'adjunten a la identitat (l'usuari o rol).
La xarxa de seguretat: Block Public Access
AWS va aprendre dels molts incidents de buckets exposats i va crear una protecció extra anomenada Block Public Access (bloquejar l'accés públic).
És un interruptor de seguretat que, quan està activat (ho està per defecte en buckets nous), impedeix que el bucket es faci públic, encara que algú escrigui per error una política que ho permeti. És com un doble segur.
⚠️ Regla d'or: Deixa Block Public Access activat tret que tinguis una raó molt concreta i conscient per desactivar-lo (com allotjar una web pública). I tot i així, valora posar CloudFront davant en lloc d'exposar el bucket directament. Desactivar-lo «per provar» i oblidar-se'n és exactament com passen les filtracions.
Els errors que MAI has de cometre
Aquests són els errors que han causat filtracions de dades famoses:
- Fer un bucket públic sense voler. Si poses dades sensibles (dades de clients, còpies de seguretat) en un bucket públic, qualsevol a internet pot descarregar-les. Això ha exposat milions de registres en empreses reals.
- Desactivar Block Public Access sense necessitat.
- Donar permisos massa amplis («que qualsevol pugui escriure/esborrar»). Un atacant podria esborrar o segrestar les teves dades.
- Fer servir ACLs heretades en lloc de polítiques clares.
Cas real (patró repetit): Nombroses empreses han patit filtracions perquè un desenvolupador va deixar un bucket amb dades de clients configurat com a públic «temporalment» i se'n va oblidar. Investigadors de seguretat (i atacants) escanegen internet buscant aquests buckets oberts. La lliçó: tracta cada bucket com a privat per defecte i obre només el que sigui imprescindible.
Bones pràctiques resumides
- Privat per defecte: obre accés només quan sigui estrictament necessari.
- Mínim privilegi: dona els permisos justos, ni un més (concepe clau que veurem al Capítol 7).
- Fes servir polítiques de bucket i IAM, no ACLs.
- Mantén Block Public Access activat tret d'excepció justificada.
- Xifra les dades (S3 xifra en repòs per defecte; ho veurem amb KMS al Capítol 23).
- Per webs públiques, serveix a través de CloudFront en lloc d'exposar el bucket directament.
El que has de recordar
- Els buckets són privats per defecte; tu concedeixes l'accés explícitament.
- Les polítiques de bucket (JSON) són la forma principal i recomanada de controlar l'accés: defineixen qui, quina acció, sobre què i si es permet o es denega.
- Les ACLs són el mètode antic: evita-les, AWS les desactiva per defecte.
- Block Public Access és una xarxa de seguretat que impedeix exposar el bucket per error: deixa-ho activat.
- L'error més greu i freqüent és fer públic un bucket amb dades sensibles. Privat per defecte, mínim privilegi.
A l'últim subcapítol de S3 veurem un ús molt pràctic i popular: allotjar un lloc web estàtic directament a S3.
Cloud, AWS & Terraform — De zero a expert
Capítol 1 · Què és el cloud computing
- 1.1 El model client-servidor tradicional
- 1.2 Problemes que venia a resoldre el núvol
- 1.3 On-premise vs cloud vs híbrid
- 1.4 Els tres models de servei: IaaS, PaaS, SaaS
- 1.5 Els cinc pilars del cloud (segons NIST)
- 1.6 Avantatges reals: elasticitat, pagament per ús, disponibilitat global
Capítol 2 · El mercat cloud i els grans proveïdors
- 2.1 AWS, Azure i GCP: diferències i quotes de mercat
- 2.2 Per què aprendre AWS primer
- 2.3 Conceptes que són universals entre proveïdors
Capítol 3 · Regions, zones de disponibilitat i edge
- 3.1 Què és una regió AWS i com triar-la
- 3.2 Availability Zones: alta disponibilitat des del disseny
- 3.3 Edge locations i CloudFront
- 3.4 Latència, resiliència i sobirania de dades
Capítol 4 · Càlcul: EC2
- 4.1 Instàncies: tipus, famílies i quan triar cadascuna
- 4.2 AMIs, key pairs i Security Groups
- 4.3 Cicle de vida d'una instància
- 4.4 Elastic IPs i Placement Groups
- 4.5 Savings Plans vs Reserved vs On-Demand vs Spot
Capítol 5 · Emmagatzematge: S3
- 5.1 Buckets, objectes i claus
- 5.2 Classes d'emmagatzematge (Standard, IA, Glacier…)
- 5.3 Versionat i cicle de vida d'objectes
- 5.4 Polítiques de bucket i ACLs
- 5.5 Hosting de llocs web estàtics
Capítol 6 · Xarxes: VPC
- 6.1 Què és una VPC i per què la necessites
- 6.2 Subxarxes públiques i privades
- 6.3 Internet Gateway i NAT Gateway
- 6.4 Route Tables i Network ACLs
- 6.5 VPC Peering i endpoints
Capítol 7 · Identitat i accés: IAM
- 7.1 Usuaris, grups, rols i polítiques
- 7.2 El principi de mínim privilegi
- 7.3 Polítiques basades en identitat vs en recurs
- 7.4 MFA i credencials temporals (STS)
- 7.5 Bones pràctiques de seguretat IAM
Capítol 8 · Bases de dades gestionades
- 8.1 RDS: motors, Multi-AZ i rèpliques de lectura
- 8.2 Aurora i els seus avantatges sobre RDS vanilla
- 8.3 DynamoDB: model clau-valor / documents
- 8.4 ElastiCache per a memòria cau en memòria
- 8.5 Quan utilitzar cada tipus de base de dades
Capítol 9 · Per què Infraestructura com a Codi
- 9.1 Problemes del provisionament manual
- 9.2 IaC declaratiu vs imperatiu
- 9.3 Terraform vs CloudFormation vs Pulumi vs CDK
- 9.4 El cicle plan → apply → destroy
Capítol 10 · HCL: el llenguatge de Terraform
- 10.1 Blocs resource, variable, output, locals
- 10.2 Tipus de dades: string, number, bool, list, map, object
- 10.3 Expressions, referències i funcions built-in
- 10.4 Condicionals i bucles (count, for_each, for)
Capítol 11 · Providers i estat
- 11.1 Com funciona el provider d'AWS
- 11.2 El fitxer terraform.tfstate i la seva importància
- 11.3 State local vs state remot (S3 + DynamoDB)
- 11.4 Comandes essencials: init, plan, apply, destroy, fmt, validate
Capítol 12 · La teva primera infraestructura real amb Terraform
- 12.1 Crear una VPC amb subxarxes des de zero
- 12.2 Posar en marxa una instància EC2 pública
- 12.3 Associar un Security Group i una Elastic IP
- 12.4 Outputs i referències entre recursos
- 12.5 Flux de treball en equip: PR review de plans
Capítol 13 · Balanceig de càrrega i autoescalat
- 13.1 Application Load Balancer vs Network Load Balancer
- 13.2 Target Groups, listeners i regles
- 13.3 Auto Scaling Groups: polítiques i mètriques
- 13.4 Warm pools i lifecycle hooks
Capítol 14 · Serverless amb Lambda
- 14.1 El model d'execució de Lambda
- 14.2 Triggers: API Gateway, S3, DynamoDB Streams, SQS
- 14.3 Gestió de dependències i capes (Layers)
- 14.4 Cold starts i estratègies per reduir-los
- 14.5 Límits i antipatrones
Capítol 15 · Missatgeria i esdeveniments
- 15.1 SQS: cues estàndard vs FIFO, DLQ
- 15.2 SNS: topics, subscripcions, fan-out
- 15.3 EventBridge: event buses i regles
- 15.4 Patrons: pub/sub, desacoblament, saga
Capítol 16 · Lliurament de contingut i DNS
- 16.1 Route 53: tipus de registres i routing policies
- 16.2 CloudFront: distribucions, memòries cau i origins
- 16.3 ACM: certificats SSL/TLS gratuïts
- 16.4 WAF integrat amb CloudFront
Capítol 17 · Contenidors a AWS
- 17.1 Docker: repàs exprés de conceptes clau
- 17.2 ECR: registre privat d'imatges
- 17.3 ECS: task definitions, services, Fargate vs EC2
- 17.4 EKS: quan Kubernetes i quan no
Capítol 18 · Mòduls: reutilització i composició
- 18.1 Anatomia d'un mòdul Terraform
- 18.2 Variables d'entrada, outputs i dependències
- 18.3 Mòduls locals vs mòduls del Terraform Registry
- 18.4 Versionat de mòduls amb Git tags
- 18.5 Disseny de mòduls genèrics vs específics de domini
Capítol 19 · Workspaces i gestió d'entorns
- 19.1 Workspaces de Terraform: casos d'ús i limitacions
- 19.2 Estratègia de directoris per entorn (dev/stg/prod)
- 19.3 Terragrunt: DRY per a configuracions d'entorn
- 19.4 Variables d'entorn i fitxers .tfvars
Capítol 20 · Backends remots i locking
- 20.1 Configurar S3 + DynamoDB com a backend
- 20.2 State locking: evitar corrupció en equip
- 20.3 Migració d'estat entre backends
- 20.4 terraform import: portar recursos existents a l'estat
Capítol 21 · Testing d'infraestructura
- 21.1 Terraform validate i fmt en CI
- 21.2 Checkov i tfsec: anàlisi de seguretat estàtica
- 21.3 Terratest: tests d'integració en Go
- 21.4 Contract testing entre mòduls
Capítol 22 · Terraform en CI/CD
- 22.1 Pipeline bàsic: lint → plan → apply a GitHub Actions
- 22.2 Atlantis: GitOps per a Terraform
- 22.3 Terraform Cloud / HCP Terraform
- 22.4 Drift detection i reconciliació automàtica
Capítol 23 · Seguretat en profunditat
- 23.1 AWS Organizations i Service Control Policies
- 23.2 AWS Config: compliment continu
- 23.3 GuardDuty: detecció d'amenaces
- 23.4 Security Hub: visió centralitzada
- 23.5 KMS: gestió de claus i rotació
- 23.6 Secrets Manager vs Parameter Store
Capítol 24 · Observabilitat: logs, mètriques i traces
- 24.1 CloudWatch Logs, mètriques i alarmes
- 24.2 CloudWatch Dashboards i Contributor Insights
- 24.3 X-Ray: traçat distribuït
- 24.4 OpenTelemetry a AWS
- 24.5 Managed Grafana i Managed Prometheus
Capítol 25 · Optimització de costos
- 25.1 AWS Cost Explorer i pressupostos amb alertes
- 25.2 Trusted Advisor i Compute Optimizer
- 25.3 Rightsizing: com detectar sobredimensionament
- 25.4 Savings Plans vs Reserved Instances: decisió estratègica
- 25.5 FinOps: cultura i processos per controlar la despesa
Capítol 26 · Alta disponibilitat i disaster recovery
- 26.1 RTO i RPO: definir els objectius
- 26.2 Estratègies: backup/restore, pilot light, warm standby, multi-site
- 26.3 Route 53 health checks i failover automàtic
- 26.4 AWS Backup: política centralitzada de còpies
Capítol 27 · Well-Architected Framework d'AWS
- 27.1 Els sis pilars: excel·lència operacional, seguretat, fiabilitat, eficiència de rendiment, optimització de costos, sostenibilitat
- 27.2 Well-Architected Tool: revisions formals
- 27.3 Com aplicar el framework en decisions de disseny
Capítol 28 · Arquitectures serverless a escala
- 28.1 Event-driven architecture amb Lambda + EventBridge
- 28.2 Saga pattern per a transaccions distribuïdes
- 28.3 Step Functions: orquestració de workflows complexos
- 28.4 Lambda@Edge i CloudFront Functions
Capítol 29 · Plataformes de dades a AWS
- 29.1 Data Lake amb S3, Glue i Athena
- 29.2 Kinesis Data Streams i Firehose per a streaming
- 29.3 Redshift: data warehousing a escala
- 29.4 Lake Formation: govern del dada
Capítol 30 · Multi-compte i landing zones
- 30.1 Per què separar workloads en comptes diferents
- 30.2 AWS Control Tower i Account Factory
- 30.3 Gestió centralitzada de logs i seguretat
- 30.4 Terraform a escala multi-compte amb mòduls compartits
Capítol 31 · Platform Engineering i Internal Developer Platform
- 31.1 Golden paths i abstraccions sobre Terraform
- 31.2 Service Catalog d'AWS
- 31.3 Backstage com a portal de desenvolupadors
- 31.4 Mòduls Terraform com a producte intern
Capítol 32 · Certificacions AWS rellevants
- 32.1 Cloud Practitioner: val la pena?
- 32.2 Solutions Architect Associate → Professional
- 32.3 DevOps Engineer Professional
- 32.4 Specialty: Security, Database, Networking
- 32.5 HashiCorp Terraform Associate
Capítol 33 · Projectes per consolidar el que s'ha après
- 33.1 Projecte 1: blog serverless (S3 + CloudFront + Lambda + DynamoDB)
- 33.2 Projecte 2: API REST amb ECS Fargate + RDS + ALB
- 33.3 Projecte 3: plataforma de dades amb Glue + Athena + Redshift
- 33.4 Projecte 4: landing zone multi-compte amb Terraform i Control Tower
