El monitoratge i manteniment de servidors és una part crucial de la gestió d'infraestructures TI. Assegurar-se que els servidors funcionen de manera òptima i que qualsevol problema potencial es detecti i es resolgui ràpidament és essencial per garantir la disponibilitat i el rendiment dels serveis TI.

Objectius del Monitoratge i Manteniment de Servidors

  1. Assegurar la Disponibilitat: Garantir que els servidors estiguin operatius i accessibles en tot moment.
  2. Optimitzar el Rendiment: Monitoritzar i ajustar els recursos per mantenir un rendiment òptim.
  3. Detectar i Resoldre Problemes: Identificar i solucionar problemes abans que afectin els usuaris finals.
  4. Garantir la Seguretat: Monitoritzar per detectar activitats sospitoses i vulnerabilitats.

Components del Monitoratge de Servidors

  1. Monitoratge de Rendiment:

    • CPU: Utilització, càrrega i temps de resposta.
    • Memòria: Utilització de la RAM i memòria virtual.
    • Disc: Utilització de l'espai d'emmagatzematge, I/O de disc.
    • Xarxa: Ample de banda, latència, pèrdua de paquets.
  2. Monitoratge de Logs:

    • Logs del Sistema Operatiu: Errors, advertències i informació general.
    • Logs d'Aplicacions: Registres específics de les aplicacions que s'executen en el servidor.
    • Logs de Seguretat: Activitats d'inici de sessió, intents fallits, canvis en la configuració.
  3. Monitoratge de Serveis:

    • Disponibilitat dels Serveis: Verificar que els serveis crítics estiguin operatius.
    • Temps de Resposta: Mesurar el temps que triga un servei a respondre a les sol·licituds.

Eines de Monitoratge

  1. Nagios: Solució de monitoratge de sistemes i xarxes.
  2. Zabbix: Plataforma de monitoratge per a xarxes i aplicacions.
  3. Prometheus: Sistema de monitoratge i alerta, especialment utilitzat en entorns de contenidors.
  4. SolarWinds: Suite d'eines per al monitoratge de xarxes, servidors i aplicacions.

Pràctiques de Manteniment de Servidors

  1. Actualitzacions Regulars:

    • Sistema Operatiu: Aplicar pegats de seguretat i actualitzacions.
    • Aplicacions: Mantenir les aplicacions actualitzades per corregir errors i vulnerabilitats.
  2. Còpies de Seguretat:

    • Dades: Realitzar còpies de seguretat regulars de les dades crítiques.
    • Configuracions: Guardar còpies de les configuracions del sistema i aplicacions.
  3. Auditories de Seguretat:

    • Revisió de Logs: Analitzar els logs per detectar activitats sospitoses.
    • Escaneig de Vulnerabilitats: Utilitzar eines per identificar i corregir vulnerabilitats.
  4. Optimització de Recursos:

    • Ajust de Paràmetres: Modificar la configuració del sistema per millorar el rendiment.
    • Redistribució de Recursos: Assignar recursos addicionals als serveis que ho necessitin.

Exemples Pràctics

Exemple 1: Monitoratge de CPU amb Nagios

define service {
    use                     generic-service
    host_name               server1
    service_description     CPU Load
    check_command           check_nrpe!check_load
}

Explicació: Aquest fragment de configuració de Nagios defineix un servei per monitoritzar la càrrega de la CPU en un servidor anomenat server1 utilitzant el plugin check_nrpe.

Exemple 2: Configuració d'Alerta de Memòria amb Zabbix

- trigger:
    description: "High memory usage on {HOST.NAME}"
    expression: "{server1:vm.memory.size[available].last()}<500M"

Explicació: Aquest fragment de configuració de Zabbix crea un desencadenant que enviarà una alerta si la memòria disponible en el servidor server1 cau per sota de 500 MB.

Exercicis Pràctics

Exercici 1: Configuració de Monitoratge de Disc amb Prometheus

  1. Instal·la Prometheus en un servidor.
  2. Configura un job per monitoritzar l'ús del disc.
  3. Crea una alerta que es dispari quan l'ús del disc superi el 80%.

Solució:

scrape_configs:
  - job_name: 'node'
    static_configs:
      - targets: ['localhost:9100']

alerting:
  alertmanagers:
    - static_configs:
        - targets: ['localhost:9093']

rule_files:
  - "alert.rules"

groups:
- name: disk_alerts
  rules:
  - alert: HighDiskUsage
    expr: node_filesystem_avail_bytes{fstype!="tmpfs"} / node_filesystem_size_bytes{fstype!="tmpfs"} < 0.20
    for: 5m
    labels:
      severity: warning
    annotations:
      summary: "High disk usage detected"
      description: "Disk usage is above 80% on {{ $labels.instance }}"

Exercici 2: Revisió de Logs de Seguretat

  1. Accedeix als logs de seguretat del teu servidor.
  2. Identifica i documenta qualsevol activitat sospitosa.
  3. Proposa mesures correctives per millorar la seguretat.

Solució:

  • Accés als logs: Utilitza comandes com cat /var/log/auth.log per revisar els logs d'autenticació.
  • Identificació d'activitats sospitoses: Busca intents fallits de connexió o canvis inesperats en la configuració.
  • Mesures correctives: Implementa autenticació de dos factors, restringeix l'accés per IP, etc.

Conclusió

El monitoratge i manteniment de servidors és essencial per garantir la disponibilitat, rendiment i seguretat de les infraestructures TI. Utilitzar eines adequades i seguir pràctiques de manteniment regulars pot ajudar a detectar i resoldre problemes de manera proactiva, assegurant un funcionament òptim dels serveis TI.

Curs d'Infraestructures TI

Mòdul 1: Introducció a les Infraestructures TI

Mòdul 2: Gestió de Servidors

Mòdul 3: Gestió de Xarxes

Mòdul 4: Gestió d'Emmagatzematge

Mòdul 5: Alta Disponibilitat i Recuperació davant Desastres

Mòdul 6: Monitoratge i Rendiment

Mòdul 7: Seguretat en Infraestructures TI

Mòdul 8: Automatització i Gestió de Configuració

Mòdul 9: Tendències i Futur de les Infraestructures TI

© Copyright 2024. Tots els drets reservats