Spark | Les fondamentaux Mixte : présentiel / à distance

DerniĂšre mise Ă  jour : 29/02/2024

BanniÚre visuelle de présentation de la formation

Présentation

Cette formation vous permettra de maĂźtriser les concepts fondamentaux de Spark.

Objectifs

  • Comprendre les fondamentaux de Spark
  • DĂ©couvrir les diffĂ©rents modules de Spark
  • Manipuler des donnĂ©es avec Spark SQL

Programme

Présentation d'Apache Spark

  • Introduction et historique
  • Les langages de programmation supportĂ©s par Spark (Scala, Python et Java)
  • Comparaison avec l'environnement Apache Hadoop
  • Les modules de Spark (Spark SQL, Spark Streaming, MLlib, GraphX )

 

Resilient Distributed Dataset (RDD)

  • C'est quoi un RDD ?
  • CrĂ©er, manipuler et rĂ©utiliser des RDD
  • Accumulateurs et variables broadcastĂ©es
  • Utiliser des partitions

 

Manipuler des données structurées avec Spark SQL

  • SQL, DataFrames et Datasets
  • Les diffĂ©rents types de sources de donnĂ©es
  • InteropĂ©rabilitĂ© avec les RDD
  • Performance de Spark SQL
  • JDBC/ODBC server et Spark SQL CLI

 

Spark sur un cluster

  • Les diffĂ©rents types d'architectures : Standalone, Apache Mesos ou Hadoop YARN
  • Configurer un cluster en mode Standalone
  • Packager une application avec ses dĂ©pendances
  • DĂ©ployer des applications avec Spark-submit
  • Dimensionner un cluster

Public visé

  • DĂ©veloppeurs
  • Architectes

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :

 

  • Formation en prĂ©sentiel
    • En groupe (inter-entreprises ou intra-entreprise)
    • En individuel (monitorat)
    • En journĂ©e ou en cours du soir (sur demande spĂ©cifique)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

 

 

Prérequis

  • Bonnes connaissances du langage Python

Moyens et supports pédagogiques

  • Apports des connaissances communes.
  • Mises en situation sur le thĂšme de la formation et des cas concrets.
  • MĂ©thodologie d'apprentissage attractive, interactive et participative.
  • Equilibre thĂ©orie / pratique : 60 % / 40 %.
  • Supports de cours fournis au format papier et/ou numĂ©rique.
  • Ressources documentaires en ligne et rĂ©fĂ©rences mises Ă  disposition par le formateur.
  • Pour les formations en prĂ©sentiel dans les locaux mis à disposition, les apprenants sont accueillis dans une salle de cours Ă©quipĂ©e d'un rĂ©seau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriĂ©s est mis Ă  disposition (le cas Ă©chĂ©ant).

Modalités d'évaluation et de suivi

En amont de la formation

 

  • Recueil des besoins des apprenants afin de disposer des informations essentielles au bon dĂ©roulĂ© de la formation (profil, niveau, attentes particuliĂšres...).
  • Auto-positionnement des apprenants afin de mesurer le niveau de dĂ©part.

Tout au long de la formation

 

  • Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

A la fin de la formation

 

  • Auto-positionnement des apprenants afin de mesurer l'acquisition des compĂ©tences.
  • Evaluation par le formateur des compĂ©tences acquises par les apprenants.
  • Questionnaire de satisfaction Ă  chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.
  • Questionnaire de satisfaction Ă  froid afin d'Ă©valuer les apports ancrĂ©s de la formation et leurs mises en application au quotidien.

Accessibilité

Nos formations peuvent ĂȘtre adaptĂ©es Ă  certaines conditions de handicap. Nous contacter pour toute information et demande spĂ©cifique.

M'inscrire Ă  la formation

Valider la pré-inscription
Inscription possible jusqu'à 10 jours avant démarrage formation

Prochaines Sessions

  • DĂ©solĂ©, cette formation n'est pas programmĂ©e pour le moment.

    Si vous ĂȘtes responsable formation, vous pouvez faire une requĂȘte pour l'organiser en INTRA dans votre entreprise.

Catalogue de formation propulsé par Dendreo,
Plateforme dédiée pour les OF