Accueil / Hadoop pour architectes et administrateurs

Hadoop pour architectes et administrateurs

Durée : 3 jours
Tarif Inter : 1800 €
Tarif sur mesure : Nous consulter
Référence : 4HAD

  • Partagez sur
  • Téléchargez en
  • Inscrivez vous
Programme Public & Pré-requis Organisation

Présentation

Cette formation permettra aux architectes et administrateurs en charge de la mise en œuvre et de la gestion d’une solution Big Data, d’être à même d’utiliser les différents outils fournis par la distribution Apache de Hadoop pour mener à bien leur mission.

Objectifs

  • Savoir élaborer une architecture Hadoop
  • Connaitre le fonctionnement du système des fichiers de Hadoop (HDFS) et de YARN/MapReduce
  • Savoir administrer un cluster Hadoop
  • Savoir configurer un cluster Hadoop et le mettre en œuvre
  • Gestion de maintenance des nœuds dans un cluster
  • Gestion de données dans un cluster

Programme

  1. Introduction

    • C’est quoi Hadoop ?
    • En quoi Hadoop est utilisé ?
    • Historique du Big Data et Hadoop
    • Infrastructures et coûts associés
  2. L’écosystème d’Hadoop

    • Architecture globale d’Hadoop
    • HDFS : Le système de fichiers distribué
    • MapReduce et le gestionnaire de ressources YARN
    • Zookeeper : Le garant des informations
    • HBase et système de stockage de données
    • La définition du dimensionnement pour un cluster Hadoop
    • Les particularités de MapR
  3. Installation d’un cluster Hadoop

    • Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase
  4. Manipulation des données dans un cluster Hadoop

    • Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark : Architecture, Objectif et fonctionnement
    • Mise en pratique sur les différents outils
  5. Exploitation d’un cluster Hadoop

    • MapR Control System : Architecture, objectif et fonctionnement
    • Mise en pratique
  6. Concepts d’architecture complexe

    • Architecture en rack : les avantages et fonctionnement et paramétrage du rack awareness
    • Scalabilité et performances : le Namenode Federation
    • Haute disponibilité des serveurs maitres
    • Utilisation des snapshots : sauvegarde et restauration
Formations à distance
En inter et en intra entreprise

Contactez-nous :
training@softeam.fr
+33 (0)6 07 78 24 18
Prochaines dates

A distance

Du 01 au 03 février 2021
Du 15 au 17 mars 2021
Du 06 au 08 avril 2021
Du 25 au 27 mai 2021
Du 14 au 16 juin 2021
Du 19 au 21 juillet 2021
Du 23 au 25 août 2021

Demande de renseignement