Accueil / Hadoop pour architectes et administrateurs
Hadoop pour architectes et administrateurs
Durée : 3 jours
Tarif Inter : 1800 €
Tarif sur mesure : Nous consulter
Référence : 4HAD
Programme
Public & Pré-requis
Organisation
Présentation
Cette formation permettra aux architectes et administrateurs en charge de la mise en œuvre et de la gestion d’une solution Big Data, d’être à même d’utiliser les différents outils fournis par la distribution Apache de Hadoop pour mener à bien leur mission.
Objectifs
- Savoir élaborer une architecture Hadoop
- Connaitre le fonctionnement du système des fichiers de Hadoop (HDFS) et de YARN/MapReduce
- Savoir administrer un cluster Hadoop
- Savoir configurer un cluster Hadoop et le mettre en œuvre
- Gestion de maintenance des nœuds dans un cluster
- Gestion de données dans un cluster
Programme
-
Introduction
- C’est quoi Hadoop ?
- En quoi Hadoop est utilisé ?
- Historique du Big Data et Hadoop
- Infrastructures et coûts associés
-
L’écosystème d’Hadoop
- Architecture globale d’Hadoop
- HDFS : Le système de fichiers distribué
- MapReduce et le gestionnaire de ressources YARN
- Zookeeper : Le garant des informations
- HBase et système de stockage de données
- La définition du dimensionnement pour un cluster Hadoop
- Les particularités de MapR
-
Installation d’un cluster Hadoop
- Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase
-
Manipulation des données dans un cluster Hadoop
- Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark : Architecture, Objectif et fonctionnement
- Mise en pratique sur les différents outils
-
Exploitation d’un cluster Hadoop
- MapR Control System : Architecture, objectif et fonctionnement
- Mise en pratique
-
Concepts d’architecture complexe
- Architecture en rack : les avantages et fonctionnement et paramétrage du rack awareness
- Scalabilité et performances : le Namenode Federation
- Haute disponibilité des serveurs maitres
- Utilisation des snapshots : sauvegarde et restauration