En aquest tema, aprendrem les comandes bàsiques i avançades del Sistema de Fitxers Distribuït de Hadoop (HDFS). Aquestes comandes són essencials per gestionar i manipular fitxers dins del clúster de Hadoop.
Objectius d'aprenentatge
- Entendre les comandes bàsiques de HDFS.
- Aprendre a gestionar fitxers i directoris en HDFS.
- Conèixer les comandes avançades per a la gestió de dades en HDFS.
- Comandes bàsiques de HDFS
1.1. hdfs dfs -ls
Llista els fitxers i directoris en un directori especificat de HDFS.
Sintaxi:
Exemple:
1.2. hdfs dfs -mkdir
Crea un nou directori en HDFS.
Sintaxi:
Exemple:
1.3. hdfs dfs -put
Copia fitxers des del sistema de fitxers local a HDFS.
Sintaxi:
Exemple:
1.4. hdfs dfs -get
Copia fitxers des de HDFS al sistema de fitxers local.
Sintaxi:
Exemple:
1.5. hdfs dfs -rm
Elimina fitxers o directoris de HDFS.
Sintaxi:
Exemple:
1.6. hdfs dfs -rmdir
Elimina un directori buit de HDFS.
Sintaxi:
Exemple:
- Comandes avançades de HDFS
2.1. hdfs dfs -du
Mostra l'ús de disc per a fitxers i directoris en HDFS.
Sintaxi:
Exemple:
2.2. hdfs dfs -chown
Canvia el propietari d'un fitxer o directori en HDFS.
Sintaxi:
Exemple:
2.3. hdfs dfs -chmod
Canvia els permisos d'un fitxer o directori en HDFS.
Sintaxi:
Exemple:
2.4. hdfs dfs -chgrp
Canvia el grup d'un fitxer o directori en HDFS.
Sintaxi:
Exemple:
2.5. hdfs dfs -copyFromLocal
Copia fitxers des del sistema de fitxers local a HDFS (similar a -put
).
Sintaxi:
Exemple:
2.6. hdfs dfs -copyToLocal
Copia fitxers des de HDFS al sistema de fitxers local (similar a -get
).
Sintaxi:
Exemple:
Exercicis pràctics
Exercici 1: Crear i llistar directoris
- Crea un directori anomenat
test_directory
a HDFS. - Llista el contingut del directori
/user/hadoop
.
Solució:
Exercici 2: Copiar fitxers entre el sistema local i HDFS
- Copia un fitxer anomenat
example.txt
des del sistema local a HDFS. - Copia el fitxer
example.txt
des de HDFS al sistema local amb el nomexample_copy.txt
.
Solució:
Exercici 3: Gestionar permisos i propietats
- Canvia el propietari del fitxer
example.txt
anewuser
. - Canvia els permisos del fitxer
example.txt
a644
.
Solució:
Resum
En aquest tema, hem après les comandes bàsiques i avançades de HDFS per gestionar fitxers i directoris dins del clúster de Hadoop. Aquestes comandes són fonamentals per treballar amb dades en un entorn distribuït. Hem practicat com crear, llistar, copiar, eliminar i modificar permisos de fitxers i directoris en HDFS. Amb aquesta base, estem preparats per aprofundir en altres aspectes de HDFS i Hadoop.
Curs de Hadoop
Mòdul 1: Introducció a Hadoop
- Què és Hadoop?
- Visió general de l'ecosistema Hadoop
- Hadoop vs Bases de dades tradicionals
- Configuració de l'entorn Hadoop
Mòdul 2: Arquitectura de Hadoop
- Components bàsics de Hadoop
- HDFS (Sistema de fitxers distribuït de Hadoop)
- Marc MapReduce
- YARN (Yet Another Resource Negotiator)
Mòdul 3: HDFS (Sistema de fitxers distribuït de Hadoop)
Mòdul 4: Programació MapReduce
- Introducció a MapReduce
- Flux de treball d'una feina MapReduce
- Escriure un programa MapReduce
- Tècniques d'optimització de MapReduce
Mòdul 5: Eines de l'ecosistema Hadoop
Mòdul 6: Conceptes avançats de Hadoop
- Seguretat de Hadoop
- Gestió de clústers de Hadoop
- Ajust de rendiment de Hadoop
- Serialització de dades de Hadoop
Mòdul 7: Aplicacions reals i estudis de cas
- Hadoop en emmagatzematge de dades
- Hadoop en aprenentatge automàtic
- Hadoop en processament de dades en temps real
- Estudis de cas d'implementacions de Hadoop