Hadoop | Développement Mixte : présentiel / à distance

Dernière mise à jour : 21/12/2023

Bannière visuelle de présentation de la formation

Présentation

Pour faire face à un volume croissant de données à analyser, et fournir aux internautes des résultats de recherche pertinents, le framework Hadoop voit le jour au milieu des années 2000.

Devant le succès rencontré par la solution, Hadoop passera chez Cloudera qui créera alors la distribution Hadoop la plus utilisée à ce jour.

Informations éligibilité financement Actions Collectives

Formation pouvant être prise en charge à 100% dans le cadre des Actions Collectives.

Pour en bénéficier, contactez-nous à hello.institute@docaposte.fr et complétez votre inscription sur campusAtlas

https://www.docaposteinstitute.com/wp-content/uploads/2023/08/Eligible-actions-co-1.png

 

Objectifs

  • Connaître les différents éléments de l'écosystème Hadoop et leurs rôles respectifs.
  • Comprendre l'architecture des applicatifs Hadoop.
  • Comprendre les apports et cas d'usage des solutions Hadoop.

Programme

Architecture Hadoop

  • Histoire de Hadoop - Facebook, Dynamo, Yahoo, Google
  • Le noyau Hadoop
  • Architecture YARN, Hadoop 2.0

 

Système de fichiers distribués Hadoop (HDFS)

  • Clusters HDFS - NameNodes, DataNodes et clients
  • Métadonnées
  • Administration en ligne

 

MapReduce

  • Traitement et génération de grands ensembles de données
  • Fonctions Map
  • Programmation de MapReduce à l'aide de SQL / Bash / Python
  • Traitement parallèle
  • Failover

 

Entreposage de données avec Hive

  • Synthétisation des données
  • Requêtes ad-hoc
  • Analyser de grands ensembles de données
  • HiveQL (langage de requête de type SQL)
  • Intégration avec les bases de données SQL
  • Analyse des n-grammes

 

Traitement parallèle avec Pig

  • Évaluation parallèle
  • Interface du langage de requête
  • Algèbre relationnelle

 

Extraction de données avec Mahout

  • Regroupement ou Clustering
  • Classification
  • Filtrage collaboratif par lots

 

Recherche avec Elastic Search

  • Concepts de recherche Elastic
  • Installation, importation des données
  • Démonstration de l'API, exemples de requêtes

 

Stockage de données structurées avec HBase

  • Big Data : échelle de taille d'un grand ensemble de données.
  • Optimiser l'accès en lecture/écriture en temps réel

 

Base de données multi-master Cassandra

  • Le modèle de données de Cassandra
  • Cohérence éventuelle
  • Quand utiliser Cassandra

 

Redis

  • Modèle de données Redis
  • Quand utiliser Redis

 

MongoDB

  • Modèle de données MongoDB
  • Installation de MongoDB
  • Quand utiliser MongoDB

 

Kafka

  • L'architecture de Kafka
  • Installation
  • Exemple d'utilisation
  • Quand utiliser Kafka

 

Architecture Lambda

  • Concept
  • Hadoop + Intégration du traitement des flux
  • Exemples d'architecture

 

Big Data dans le Cloud

(Si le temps le permet)

  • Amazon Web Services
  • Concepts : modèle de paiement à l'utilisation
  • Amazone S3, EC2, EMR
  • Plateforme Google Cloud
  • Google Big Query

Public visé

  • Développeurs de logiciels,
  • Administrateurs de bases de données,
  • Analystes BI,
  • Architectes logiciels,
  • Chefs de projet.

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :

 

  • Formation en présentiel
    • En groupe (inter-entreprises ou intra-entreprise)
    • En individuel (monitorat)
    • En journée ou en cours du soir (sur demande spécifique)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

Prérequis

  • Avoir des connaissances en matière de développement d'applications d'entreprise, d'intégration de systèmes commerciaux et/ou de conception, d'interrogation et de rapports de bases de données.

Moyens et supports pédagogiques

  • ·       Apports des connaissances communes.
  • ·       Mises en situation sur le thème de la formation et des cas concrets.
  • ·       Méthodologie d'apprentissage attractive, interactive et participative.
  • ·       Equilibre théorie / pratique : 60 % / 40 %.
  • ·       Supports de cours fournis au format papier et/ou numérique.
  • ·       Ressources documentaires en ligne et références mises à disposition par le formateur.
  • ·       Pour les formations en présentiel dans les locaux mis à disposition, les apprenants sont accueillis dans une salle de cours équipée d'un réseau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriés est mis à disposition (le cas échéant).
  •  

Modalités d'évaluation et de suivi

En amont de la formation

·       Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particulières...).

·       Auto-positionnement des apprenants afin de mesurer le niveau de départ.

Tout au long de la formation

·       Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

A la fin de la formation

·       Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.

·       Evaluation par le formateur des compétences acquises par les apprenants.

·       Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.

·       Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.

Accessibilité

Nos formations peuvent être adaptées à certaines conditions de handicap. Nous contacter pour toute information et demande spécifique.

M'inscrire à la formation

Valider la pré-inscription
Inscription possible jusqu'à 10 jours avant démarrage formation

Prochaines Sessions

  • Désolé, cette formation n'est pas programmée pour le moment.

    Si vous êtes responsable formation, vous pouvez faire une requête pour l'organiser en INTRA dans votre entreprise.

Catalogue de formation propulsé par Dendreo,
Plateforme dédiée pour les OF