El monitoratge i manteniment de servidors és una part crucial de la gestió d'infraestructures TI. Assegurar-se que els servidors funcionen de manera òptima i que qualsevol problema potencial es detecti i es resolgui ràpidament és essencial per garantir la disponibilitat i el rendiment dels serveis TI.
Objectius del Monitoratge i Manteniment de Servidors
- Assegurar la Disponibilitat: Garantir que els servidors estiguin operatius i accessibles en tot moment.
- Optimitzar el Rendiment: Monitoritzar i ajustar els recursos per mantenir un rendiment òptim.
- Detectar i Resoldre Problemes: Identificar i solucionar problemes abans que afectin els usuaris finals.
- Garantir la Seguretat: Monitoritzar per detectar activitats sospitoses i vulnerabilitats.
Components del Monitoratge de Servidors
-
Monitoratge de Rendiment:
- CPU: Utilització, càrrega i temps de resposta.
- Memòria: Utilització de la RAM i memòria virtual.
- Disc: Utilització de l'espai d'emmagatzematge, I/O de disc.
- Xarxa: Ample de banda, latència, pèrdua de paquets.
-
Monitoratge de Logs:
- Logs del Sistema Operatiu: Errors, advertències i informació general.
- Logs d'Aplicacions: Registres específics de les aplicacions que s'executen en el servidor.
- Logs de Seguretat: Activitats d'inici de sessió, intents fallits, canvis en la configuració.
-
Monitoratge de Serveis:
- Disponibilitat dels Serveis: Verificar que els serveis crítics estiguin operatius.
- Temps de Resposta: Mesurar el temps que triga un servei a respondre a les sol·licituds.
Eines de Monitoratge
- Nagios: Solució de monitoratge de sistemes i xarxes.
- Zabbix: Plataforma de monitoratge per a xarxes i aplicacions.
- Prometheus: Sistema de monitoratge i alerta, especialment utilitzat en entorns de contenidors.
- SolarWinds: Suite d'eines per al monitoratge de xarxes, servidors i aplicacions.
Pràctiques de Manteniment de Servidors
-
Actualitzacions Regulars:
- Sistema Operatiu: Aplicar pegats de seguretat i actualitzacions.
- Aplicacions: Mantenir les aplicacions actualitzades per corregir errors i vulnerabilitats.
-
Còpies de Seguretat:
- Dades: Realitzar còpies de seguretat regulars de les dades crítiques.
- Configuracions: Guardar còpies de les configuracions del sistema i aplicacions.
-
Auditories de Seguretat:
- Revisió de Logs: Analitzar els logs per detectar activitats sospitoses.
- Escaneig de Vulnerabilitats: Utilitzar eines per identificar i corregir vulnerabilitats.
-
Optimització de Recursos:
- Ajust de Paràmetres: Modificar la configuració del sistema per millorar el rendiment.
- Redistribució de Recursos: Assignar recursos addicionals als serveis que ho necessitin.
Exemples Pràctics
Exemple 1: Monitoratge de CPU amb Nagios
define service { use generic-service host_name server1 service_description CPU Load check_command check_nrpe!check_load }
Explicació: Aquest fragment de configuració de Nagios defineix un servei per monitoritzar la càrrega de la CPU en un servidor anomenat server1
utilitzant el plugin check_nrpe
.
Exemple 2: Configuració d'Alerta de Memòria amb Zabbix
- trigger: description: "High memory usage on {HOST.NAME}" expression: "{server1:vm.memory.size[available].last()}<500M"
Explicació: Aquest fragment de configuració de Zabbix crea un desencadenant que enviarà una alerta si la memòria disponible en el servidor server1
cau per sota de 500 MB.
Exercicis Pràctics
Exercici 1: Configuració de Monitoratge de Disc amb Prometheus
- Instal·la Prometheus en un servidor.
- Configura un job per monitoritzar l'ús del disc.
- Crea una alerta que es dispari quan l'ús del disc superi el 80%.
Solució:
scrape_configs: - job_name: 'node' static_configs: - targets: ['localhost:9100'] alerting: alertmanagers: - static_configs: - targets: ['localhost:9093'] rule_files: - "alert.rules" groups: - name: disk_alerts rules: - alert: HighDiskUsage expr: node_filesystem_avail_bytes{fstype!="tmpfs"} / node_filesystem_size_bytes{fstype!="tmpfs"} < 0.20 for: 5m labels: severity: warning annotations: summary: "High disk usage detected" description: "Disk usage is above 80% on {{ $labels.instance }}"
Exercici 2: Revisió de Logs de Seguretat
- Accedeix als logs de seguretat del teu servidor.
- Identifica i documenta qualsevol activitat sospitosa.
- Proposa mesures correctives per millorar la seguretat.
Solució:
- Accés als logs: Utilitza comandes com
cat /var/log/auth.log
per revisar els logs d'autenticació. - Identificació d'activitats sospitoses: Busca intents fallits de connexió o canvis inesperats en la configuració.
- Mesures correctives: Implementa autenticació de dos factors, restringeix l'accés per IP, etc.
Conclusió
El monitoratge i manteniment de servidors és essencial per garantir la disponibilitat, rendiment i seguretat de les infraestructures TI. Utilitzar eines adequades i seguir pràctiques de manteniment regulars pot ajudar a detectar i resoldre problemes de manera proactiva, assegurant un funcionament òptim dels serveis TI.
Curs d'Infraestructures TI
Mòdul 1: Introducció a les Infraestructures TI
- Conceptes Bàsics d'Infraestructures TI
- Components Principals d'una Infraestructura TI
- Models d'Infraestructura: On-Premise vs. Cloud
Mòdul 2: Gestió de Servidors
- Tipus de Servidors i els seus Usos
- Instal·lació i Configuració de Servidors
- Monitoratge i Manteniment de Servidors
- Seguretat en Servidors
Mòdul 3: Gestió de Xarxes
- Fonaments de Xarxes
- Disseny i Configuració de Xarxes
- Monitoratge i Manteniment de Xarxes
- Seguretat en Xarxes
Mòdul 4: Gestió d'Emmagatzematge
- Tipus d'Emmagatzematge: Local, NAS, SAN
- Configuració i Gestió d'Emmagatzematge
- Monitoratge i Manteniment d'Emmagatzematge
- Seguretat en Emmagatzematge
Mòdul 5: Alta Disponibilitat i Recuperació davant Desastres
- Conceptes d'Alta Disponibilitat
- Tècniques i Eines per a l'Alta Disponibilitat
- Plans de Recuperació davant Desastres
- Proves i Simulacions de Recuperació
Mòdul 6: Monitoratge i Rendiment
- Eines de Monitoratge
- Mètriques Clau de Rendiment
- Optimització d'Infraestructura
- Alertes i Notificacions
Mòdul 7: Seguretat en Infraestructures TI
- Principis de Seguretat en TI
- Gestió de Vulnerabilitats
- Implementació de Polítiques de Seguretat
- Auditories i Compliment
Mòdul 8: Automatització i Gestió de Configuració
- Introducció a l'Automatització
- Eines d'Automatització
- Gestió de Configuració
- Cases d'Ús i Exemples Pràctics