Accueil / HADOOP CLOUDERA pour Architectes et administrateurs

HADOOP CLOUDERA pour Architectes et administrateurs

Présentation

Cette formation permettra aux architectes et administrateurs en charge de la mise en oeuvre et de la gestion d’une solution Big Data d’être à même d’utiliser les différents outils fournis par la distribution Cloudera de Hadoop pour mener à bien leur mission.

Objectifs

  • Savoir élaborer une architecture Hadoop
  • Connaitre le fonctionnement du système des fichiers de Hadoop (HDFS) et de YARN/MapReduce
  • Savoir gérer un cluster Hadoop
  • Savoir configurer un cluster Hadoop et le mettre en oeuvre
  • Gestion de maintenance des nœuds dans un cluster
  • Gestion de données dans un cluster
  • Savoir administrer un cluster Hadoop

Prérequis

  • Avoir des connaissances des commandes des systèmes Unix/Linux.

Public

  • Chefs de projets, administrateurs systèmes et à toute personne qui gère ou maintient un système distribué avec Hadoop.

Moyens pédagogiques

  • La formation est constituée d’apports théoriques, d’exercices pratiques, de réflexions et de retours d’expérience

Programme

  1. Introduction

    • C’est quoi Hadoop ?
    • En quoi Hadoop est utilisé ?
    • Historique du big data et hadoop
    • Infrastructures et coûts associés
  2. L’écosystème d’HADOOP

    • Architecture globale d’hadoop
    • HDFS : Le système de fichiers distribué
    • MapReduce et le gestionnaire de ressources YARN
    • Zookeeper : Le garant des informations
    • HBase et système de stockage de données
    • La définition du dimensionnement pour un cluster Hadoop
    • Les particularités de MapR
  3. Installation d’un cluster HADOOP

    • Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase
  4. Manipulation des données dans un cluster HADOOP

    • Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark : Architecture, Objectif et fonctionnement
    • Mise en pratique sur les différents outils
  5. Exploitation d’un cluster HADOOP

    • MapR Control System : Architecture, objectif et fonctionnement
    • Mise en pratique
  6. Concepts d’architecture complexe

    • Architecture en rack : les avantages et fonctionnement et paramétrage du rack awareness
    • Scalabilité et performances : le Namenode Federation
    • High Availability des serveurs maitres
    • Utilisation des snapshots : sauvegarde et restauration

Nombre de jours

3

Dates

Paris

Du 09 au 11 mars 2020
Du 11 au 13 mai 2020

Rennes

Du 09 au 11 mars 2020
Du 11 au 13 mai 2020

Nantes

Du 09 au 11 mars 2020
Du 11 au 13 mai 2020

Sophia Antipolis

Du 09 au 11 mars 2020
Du 11 au 13 mai 2020

Aix en Provence

Du 09 au 11 mars 2020
Du 11 au 13 mai 2020

Tarif inter

1800 € HT

Tarif sur mesure

Réf.

6HAD

Demande de renseignement

FORMATIONS ASSOCIÉES