Accueil / Comprendre l’Architecture Big Data

Comprendre l’Architecture Big Data

Présentation

Cette formation vous permettra de comprendre l’architecture Big Data.

Objectifs

  • Identifier les différences des BDD SQL et des BDD NoSQL
  • Évaluer les avantages et les inconvénients inhérents aux technologies NoSQL
  • Analyser les principales solutions du monde NoSQL
  • Identifier les champs d’application des BDD NoSQL
  • Comprendre les différentes architectures, les modèles de données, les implémentations techniques

Prérequis

  • Connaissances de base des architectures techniques et du management SI
  • Connaissances de bases de données

Public

  • Direction informatique et fonctionnelle
  • Responsable informatique
  • Chef de projet
  • Architecte
  • Développeur

Moyens pédagogiques

  • 80% théorique – 20% pratiques

Programme

  1. Introduction au NoSQL :

    • L’historique du mouvement NoSQL
    • Les différentes approches de gestion de BDD à travers le temps : hiérarchiques, relationnelles, objets, XML, NoSQL.
    • Les grands acteurs à l’origine du mouvement NoSQL et du Big Data analytique : Google et Amazon
    • Données structurées, semi-structurées et non-structurées : provenance, typologie…
    • Vue synoptique des différents types de moteurs NoSQL du point de vue du modèle de données
    • Le NoSQL, la Big Data et les architectures Cloud: principes d’architecture communs et divergents
    • Les modes de distribution : avec maître et décentralisé
    • Le positionnement du NoSQL au sein du Big Analytics : de l’ère de la transaction à l’ère de l’interaction
  2. Le Relationnel et le NoSQL :

    • Les bases de données relationnelles : leurs forces et leurs limites
    • Structuration forte des données (schéma explicite) vs Structure souple (schéma implicite) et la modélisation agile
    • Des qualités ACID aux qualités BASE
    • Théorème CAP (cohérence, disponibilité, tolérance au partitionnement)
    • Les différents niveaux de cohérence
    • Le langage SQL, la performance des jointures. L’accès par la clé en NoSQL
    • L’évolution vers le distribué : extensibilité verticale et horizontale
    • Comprendre le NoSQL par le modèle de l’agrégat et de la centralité de la donnée
  3. Les mondes du NoSQL :

    • Monde du NoSQL à travers ses choix techniques et différentes bases NoSQL libres (du moins structuré au plus structuré)
    • L’architecture distribuée : principes, le shared-nothing
    • Disponibilité et cohérence différée : gossip, timestamps, vector clock, règle de majorité, arbre de Merkle
    • Les patterns et les modèles
    • Comment modéliser et travailler efficacement en NoSQL
    • Différents modèles de connexion avec le client : sur cluster décentralisé, protocoles comme Thrift ou ProtoBuf, REST…
    • Les bases orientées clé-valeur et en mémoire : Redis, Riak, Projet Voldemort, Aerospike
    • Les bases orientées documents : Le format JSON. Couchbase Server, MongoDB, ElasticSearch
    • Les bases orientées colonne distribuées pour le Big Data opérationnel : Hadoop, Hbase, Cassandra, Accumulo…
    • Les moteurs orientés graphes : Neo4j, OrientDB…
    • L’écosystème Hadoop : les différences avec les SGBDR, les relations avec le NoSQL
  4. NoSQL et Big Data :

    • Monde du NoSQL à travers ses choix techniques et différentes bases NoSQL libres (du moins structuré au plus structuré)
    • L’architecture distribuée : principes, le shared-nothing
    • Disponibilité et cohérence différée : gossip, timestamps, vector clock, règle de majorité, arbre de Merkle
    • Les patterns et les modèles
    • Comment modéliser et travailler efficacement en NoSQL
    • Différents modèles de connexion avec le client : sur cluster décentralisé, protocoles comme Thrift ou ProtoBuf, REST…
    • Les bases orientées clé-valeur et en mémoire : Redis, Riak, Projet Voldemort, Aerospike
    • Les bases orientées documents : Le format JSON. Couchbase Server, MongoDB, ElasticSearch
    • Les bases orientées colonne distribuées pour le Big Data opérationnel : Hadoop, Hbase, Cassandra, Accumulo…
    • Les moteurs orientés graphes : Neo4j, OrientDB…
    • L’écosystème Hadoop : les différences avec les SGBDR, les relations avec le NoSQL

Nombre de jours

2

Dates

Paris

Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020
Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020

Rennes

Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020
Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020

Nantes

Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020
Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020

Sophia Antipolis

Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020
Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020

Aix en Provence

Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020
Du 23 au 24 mars 2020
Du 01 au 02 avril 2020
Du 26 au 27 mai 2020
Du 08 au 09 juin 2020

Tarif inter

1800 € HT

Tarif sur mesure

Réf.

6AAR

Demande de renseignement

FORMATIONS ASSOCIÉES