• Moyens et solutions pratiques pour le Big Data analysis

Accueil / Moyens et solutions pratiques pour le Big Data analysis

Moyens et solutions pratiques pour le Big Data analysis

Durée : 4 jours
Tarif Inter : 2400 €
Tarif sur mesure : Nous consulter
Référence : 4VMS

  • Partagez sur
  • Téléchargez en
  • Inscrivez vous
Programme Public & Pré-requis Organisation

Présentation

Cette formation vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Objectifs

  • Comprendre les concepts et l’apport du Big Data par rapport aux enjeux métiers
  • Comprendre l’écosystème technologique nécessaire pour réaliser un projet Big Data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d’analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

Programme

  1. Comprendre les concepts et les enjeux du Big Data

    • Origines et définition du Big Data : la BI face à la croissance et à la diversité des données
    • Les chiffres clés du marché dans le monde et en France
    • Les enjeux du Big Data : ROI, organisation et confidentialité des données
    • Un exemple d’architecture Big Data
  2. Les technologies du Big Data

    • Description de l’architecture et des composants de la plateforme Hadoop
    • Les modes de stockage (NoSQL, HDFS)
    • Principes de fonctionnement de MapReduce
    • Présentation des distributions principales du marché et des outils complémentaires (Hortonworks, Cloudera, MapR, Aster)
    • Installer une plateforme Hadoop
    • Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview …)
    • Exercice : installation d’une plateforme Big Data complète via Cloudera et ses composants.
  3. Les méthodes d’analyse des données pour le Big Data

    • Les méthodes d’exploration
    • Segmentation et classification
    • Estimation et prédiction
    • L’implémentation des modèles
    • Exercice : mise en place d’analyses avec le logiciel R
  4. Gérer les données structurées et non structurées

    • Principes de fonctionnement de Hadoop Distributed File System (HDFS)
    • Importer des données externes vers HDFS
    • Réaliser des requêtes SQL avec HIVE
    • Utiliser PIG pour traiter la donnée
    • Utiliser un ETL pour industrialiser la création de flux de données massives
    • Présentation de Talend For Big Data.
    • Exercice : implémentation de flux de données massives
  5. Les méthodes d’analyse des données pour le Big Data

    • Les outils de restitution du marché
    • Méthodologie de mise en forme des rapports
    • Apport du Big Data pour le « Social Business »
    • Mesurer l’e-réputation et la notoriété d’une marque
    • Mesurer l’expérience et la satisfaction clients, optimiser le parcours client
Formations à distance
En inter et en intra entreprise

Contactez-nous :
training@softeam.fr
+33 (0)6 07 78 24 18
Prochaines dates

A distance

Du 25 au 28 janvier 2021
Du 01 au 04 février 2021
Du 22 au 25 mars 2021
Du 26 au 29 avril 2021
Du 10 au 14 mai 2021
Du 01 au 04 juin 2021
Du 19 au 22 juillet 2021
Du 02 au 05 août 2021

Demande de renseignement