La seguretat és un aspecte crític en qualsevol sistema de gestió de dades, i Hadoop no és una excepció. En aquest mòdul, explorarem els diferents mecanismes i pràctiques de seguretat que es poden implementar en un entorn Hadoop per protegir les dades i assegurar-se que només els usuaris autoritzats tinguin accés a la informació.

Objectius del Mòdul

  • Comprendre els conceptes bàsics de la seguretat en Hadoop.
  • Aprendre sobre els diferents components de seguretat en Hadoop.
  • Implementar autenticació, autorització i xifratge en Hadoop.
  • Conèixer les millors pràctiques per assegurar un clúster Hadoop.

Conceptes Bàsics de Seguretat en Hadoop

  1. Autenticació

L'autenticació és el procés de verificar la identitat d'un usuari o servei. Hadoop suporta diversos mecanismes d'autenticació, incloent Kerberos, que és el més utilitzat.

  1. Autorització

L'autorització determina quins recursos i operacions pot accedir un usuari autenticat. Hadoop utilitza ACLs (Access Control Lists) i permisos basats en POSIX per gestionar l'autorització.

  1. Xifratge

El xifratge protegeix les dades tant en trànsit com en repòs. Hadoop suporta el xifratge de dades en HDFS i la comunicació segura entre nodes.

Components de Seguretat en Hadoop

  1. Kerberos

Kerberos és un protocol d'autenticació de xarxa que utilitza tiquets per permetre als nodes i usuaris provar la seva identitat de manera segura.

  1. Ranger

Apache Ranger proporciona una solució centralitzada per gestionar les polítiques de seguretat en tot l'ecosistema Hadoop.

  1. Knox

Apache Knox actua com una passarel·la de seguretat que proporciona autenticació i autorització per a serveis RESTful en un clúster Hadoop.

  1. SSL/TLS

SSL/TLS s'utilitza per xifrar la comunicació entre els components de Hadoop, assegurant que les dades en trànsit estiguin protegides.

Implementació de Seguretat en Hadoop

  1. Configuració de Kerberos

Pas 1: Instal·lació de Kerberos

sudo apt-get install krb5-kdc krb5-admin-server

Pas 2: Configuració del fitxer krb5.conf

[libdefaults]
    default_realm = EXAMPLE.COM

[realms]
    EXAMPLE.COM = {
        kdc = kerberos.example.com
        admin_server = kerberos.example.com
    }

[domain_realm]
    .example.com = EXAMPLE.COM
    example.com = EXAMPLE.COM

Pas 3: Creació de principals

sudo kadmin.local
kadmin.local: addprinc hdfs/[email protected]
kadmin.local: addprinc yarn/[email protected]

  1. Configuració de Ranger

Pas 1: Instal·lació de Ranger

wget http://apache.mirrors.pair.com/ranger/2.1.0/ranger-2.1.0-admin.tar.gz
tar -xzf ranger-2.1.0-admin.tar.gz
cd ranger-2.1.0-admin

Pas 2: Configuració de la base de dades

./setup.sh

Pas 3: Inici del servei Ranger

./ranger-admin start

  1. Configuració de Knox

Pas 1: Instal·lació de Knox

wget http://apache.mirrors.pair.com/knox/1.5.0/knox-1.5.0.tar.gz
tar -xzf knox-1.5.0.tar.gz
cd knox-1.5.0

Pas 2: Configuració del fitxer gateway-site.xml

<configuration>
    <property>
        <name>gateway.port</name>
        <value>8443</value>
    </property>
</configuration>

Pas 3: Inici del servei Knox

./bin/gateway.sh start

Millors Pràctiques per Assegurar un Clúster Hadoop

  1. Utilitzar Kerberos per a l'autenticació: Assegura't que tots els serveis i usuaris estiguin autenticats mitjançant Kerberos.
  2. Implementar ACLs i permisos POSIX: Gestiona l'accés als fitxers i directoris en HDFS utilitzant ACLs i permisos POSIX.
  3. Xifrar les dades en trànsit i en repòs: Utilitza SSL/TLS per xifrar la comunicació entre nodes i habilita el xifratge de dades en HDFS.
  4. Monitoritzar i auditar l'activitat del clúster: Utilitza eines com Apache Ranger per monitoritzar i auditar l'accés a les dades.
  5. Mantenir el sistema actualitzat: Assegura't que tots els components de Hadoop estiguin actualitzats amb les últimes versions i pegats de seguretat.

Exercici Pràctic

Configuració de Kerberos en un Clúster Hadoop

Objectiu: Configurar Kerberos per a l'autenticació en un clúster Hadoop.

Passos:

  1. Instal·la i configura un servidor Kerberos.
  2. Crea principals per als serveis HDFS i YARN.
  3. Configura Hadoop per utilitzar Kerberos per a l'autenticació.
  4. Verifica que els serveis de Hadoop es poden autenticar correctament amb Kerberos.

Solució: Segueix els passos detallats en la secció "Configuració de Kerberos" per completar aquest exercici.

Conclusió

En aquest mòdul, hem explorat els diferents aspectes de la seguretat en Hadoop, incloent l'autenticació, l'autorització i el xifratge. Hem après a configurar Kerberos, Ranger i Knox per assegurar un clúster Hadoop. També hem revisat les millors pràctiques per mantenir un entorn Hadoop segur. Amb aquests coneixements, estàs preparat per implementar mesures de seguretat efectives en el teu clúster Hadoop.

© Copyright 2024. Tots els drets reservats