Accueil / Big Data enjeux et perspectives

Big Data enjeux et perspectives

Présentation

Cette formation offre un aperçu des modalités de planification et de mise en œuvre d’une solution Big Data et des différentes technologies de gestion du Big Data. Vous rencontrerez de nombreux exemples illustrant divers systèmes Big Data tout au long de cette formation. Les exemples de programmation sont écrits en Java mais l’objectif principal est de vous enseigner des bonnes pratiques que vous pourrez appliquer quel que soit votre langage de programmation. Les participants ayant un profil technique pourront avoir un aperçu des mécanismes internes qui régissent une solution Big Data et apprendre à mettre en œuvre ce type de solution au sein de leur entreprise. Les responsables auront une vue d’ensemble plus précise de la manière dont ils pourront exploiter le Big Data pour optimiser les résultats de leur entreprise.

Objectifs

  • Exploiter la puissance du Big Data pour devancer vos concurrents
  • Sélectionner et mettre en œuvre des entrepôts de Big Data adaptés pour gérer plusieurs ensembles de données
  • Connaitre l’écosystème, et les principales technologies et solutions associées au BIG DATA
  • Traiter des ensembles de données volumineux avec Hadoop pour faciliter la prise de décisions techniques et métier
  • Déterminer les enjeux stratégiques et organisationnels des projets Big Data en entreprise
  • Mesurer les enjeux de la protection de données et la sécurité de ces données et mesurer les impacts de tels projets sur l’entreprise et son organisation

Prérequis

  • Des notions de programmation sont utiles

Public

  • Cette formation s’adresse à toute personne souhaitant profiter des nombreux avantages liés aux technologies dédiées au Big Data

Moyens pédagogiques

  • 75/25 Théorie / Pratique : Séminaire illustré par des exemples concrets, cas d’usages et retours d’expériences
  • Stage présentiel interactif
  • Exercices, QCM ou tests de validation des acquis en fin de thème ou cas pratique

Programme

  1. Présentation de l’Ecosystème Big Data :

    • Définition, enjeux et perspectives
      • Quest-ce-que le Big Data et ses quatre dimensions : volume, vélocité, variété, véracité
      • Quels sont les enjeux sociétaux et économiques : exemples d’amélioration de la performance et des résultats de l’entreprise grâce au Big Data
      • Mesurer l’importance du Big Data au sein d’une entreprise : les enjeux, la place du Big data dans le-commerce, le-marketing et le-réputation
      • Réussir à extraire des données utiles
      • Intégrer le Big Data aux données traditionnelles
      • Intégrer les critères légaux et éthiques : que peut-on collecter, stocker et analyser
      • Intégrer les impacts organisationnels : apparition de nouveaux rôles /métiers
  2. Panorama des techniques liées au BIG DATA :

    • Acquisition de la donnée
      • L’enchaînement des opérations. L’acquisition
      • Le recueil des données : crawling, scraping
      • La gestion de flux événementiel (Complex Event Processing, CEP)
      • L’indexation du flux entrant
      • L’intégration avec les anciennes données
      • La qualité des données : un cinquième V ?
      • Les différents types de traitement : recherche, apprentissage (machine learning, transactionnel, data mining)
      • D’autres modèles d’enchaînement : Amazon, e-Santé
      • Un ou plusieurs gisements de données ? De Hadoop à l’in-memory
      • De l’analyse de tonalité à la découverte de connaissances.
    • Stockage de donnée du Big Data :
      • Analyser les caractéristiques de vos données
      • Sélectionner les sources de données à analyser
      • Définir le rôle et les caractéristiques des bases NoSQL
      • Présenter un entrepôt BIG DATA
      • Modèles de données : valeur clé, graph, document, famille de colonnes
      • Système de fichiers distribués Hadoop (HDFS)
      • Un éventail de bases de données : HBase, Cassandra, BigTable, DynamoDB, MongoDB, Redis, Riak, Neo4J
      • Solution de recherche : Elastic Search
      • Comment bien choisir un entrepot de données
      • Choisir un entrepôt de données en fonction des caractéristiques de vos données
      • Injecter du code dans les données, mettre en œuvre des solutions de stockage des données multilingues
      • Choisir un entrepôt de données capable de s’aligner sur les objectifs de l’entreprise
    • Traitement du Big Data :
      • Intégrer différents entrepôts de données digitales
      • Mapper les données avec le framework de programmation, se connecter aux données et les extraire de l’entrepôt de stockage, transformer les données à traiter
      • Fractionner les données pour Hadoop MapReduce
      • Traitement des données : Principes fondamentaux de l’écosysteme de Hadoop et MapReduce
      • Créer les composants des tâches Hadoop MapReduce
      • Identifier les démons Hadoop
    • Analyser et visualiser les donnéesTechniques et outils d’analyse du Big Data : synthétiser les tâches Hadoop MapReduce avec Pig
      • Communiquer avec Hadoop en Pig Latin
      • Exécuter des commandes avec le shell Grunt
      • Rationaliser les traitements de haut niveau
    • Surveiller l’avancement des flux de tâches, Lancer des requêtes ad hoc sur le Big Data avec Hive
      • La définition du Cloud Computing privé
      • Différence avec Data Center et Compute Grid
      • Bases et principales technologies de virtualisation.
      • Les outils Open Source. Les technologies
  3. Présentation d’autres Framework :

    • SPARK: lalternative à Hadoop MapReduce
    • KAFKA: le middleware de message distribué
  4.  Mise en œuvre et élaboration d’une stratégie dédiée au Big Data :

    • Définir les besoins en matière de Big Data
    • Atteindre les objectifs grâce à la pertinence des données
    • Évaluer les différents outils du marché dédiés au Big Data
    • Répondre aux attentes du personnel de l’entreprise
  5. Une méthode analytique innovante :

    • Identifier l’importance des traitements métier
    • Cerner le problème
    • Choisir les bons outils
    • Obtenir des résultats exploitables
  6. Mettre en œuvre une solution Big Data :

    • Bien choisir les fournisseurs et options d’hébergement
    • Trouver le juste équilibre entre les coûts engendrés et la valeur apportée à l’entreprise
    • Garder une longueur d’avance
  7. Mesurer les enjeux de la protection des données :

    • Intégrer le droit comme outil de valorisation des bases de données
    • Gérer la paternité des fichiers et des données
    • Assurer la sécurité informatique des fichiers de données
    • Assurer la sécurité juridique des fichiers de données : Cloud Computing
    • Étude de cas : analyse de la protection des données de l’entreprise
    • Mesurer les intérêts du big data et ses interactions avec le droit
    • Les données issues de l’open data : droit sur les données, obligations et coût
    • La réutilisation des données de l’open data : la licence
    • Étude de cas : analyse de la licence proposée par ETATLAB
    • Identifier les spécificités des données à caractère personnel
    • Concevoir des systèmes d’information et des traitements conformes (privacy by design) via l’identification des critères d’une collecte et d’un traitement légal des données
    • Appliquer les exigences de la qualité Informatique et libertés : proportionnalité, conservation, interconnexion, archivage
    • L’information des personnes et les limites du détournement de finalité
    • Assurer le droit des personnes sur leurs données
    • Mesurer les risques posés par une exploitation non conforme à la loi Informatique et libertés
    • Étude de cas : analyse des dernières sanctions de la CNIL

Nombre de jours

3

Dates

Paris

Du 09 au 11 mars 2020
Du 01 au 03 avril 2020
Du 11 au 13 mai 2020
Du 08 au 10 juin 2020

Rennes

Du 09 au 11 mars 2020
Du 01 au 03 avril 2020
Du 11 au 13 mai 2020
Du 08 au 10 juin 2020

Nantes

Du 09 au 11 mars 2020
Du 01 au 03 avril 2020
Du 11 au 13 mai 2020
Du 08 au 10 juin 2020

Sophia Antipolis

Du 09 au 11 mars 2020
Du 01 au 03 avril 2020
Du 11 au 13 mai 2020
Du 08 au 10 juin 2020

Aix en Provence

Du 09 au 11 mars 2020
Du 01 au 03 avril 2020
Du 11 au 13 mai 2020
Du 08 au 10 juin 2020

Tarif inter

2000 € HT

Tarif sur mesure

Réf.

6AEP

Demande de renseignement

FORMATIONS ASSOCIÉES