Accueil / Développement avec Elastic Search
Développement avec Elastic Search
Durée : 3 jours
Tarif Inter : 1600 €
Tarif sur mesure : Nous consulter
Référence : 4DEL
Certifiant
Programme
Public & Pré-requis
Organisation
Présentation
Devenu extrêmement populaire depuis sa sortie en 2010, Elasticsearch est un moteur de recherche open source puissant permettant d’indexer et de rechercher des données.
Cette formation certifiante vous permettra d’apprendre à développer avec Elasticsearch.
Objectifs
- Découvrir les enjeux et les concepts clés d’Elasticsearch dans la recherche en plein texte
- Monter des indices et indexer des documents
- Maîtriser les requêtes DSL et les agrégations pour la recherche en plein texte
- Appliquer les scripts et les boosts pour personnaliser les résultats de recherche
- Utiliser les fonctionnalités avancées pour répondre aux besoins courants : auto-complétion, géolocalisation
- Bien choisir la relation des documents dans la production
- Savoir administrer et configurer les clusters
- Coupler Java à Elasticsearch via l’API client
Programme
-
Concepts de base
- Concept du moteur de recherche
- Introduction à Elasticsearch
- Concepts basics d’Elasticsearch
- Installation et configuration
-
Indexation de documents
- Vue générale de l’API REST
- CRUD API : Index, Get, Exist, Delete, Update, Multi Get, Bulk
- Le versionage des documents
-
Elasticsearch vs Lucene : les valeurs ajoutées
- Index inversé
- Trace de transaction
- Segment
-
Analyse de texte
- Le besoin d’une analyse de texte
- Anatomie d’un Analyzer
- Analyze API
- Configuration d’un Analyzer
- Les Tokenizers (Parseurs en Token)
- Filtre de Tokens
- Filtre de Synonyme
- ICU Tokenizers & FiltersSQL avec Spark
-
Mapping
- Les fondamentaux du Mapping
- Mapping API
- Les différents attributs et types de champs
-
Recherche de documents
- Recherche de documents
-
Spark – SQL découverte
- Les dataframes
- Chargement de données avec un schéma
- Agrégation
- Jointure
- SQL avec Spark
-
Spark – streaming, recherche avancée
- Agrégation : Scope
- Agrégation métrique
- Agrégation bucket
- Pertinence
- Modèle d’espace vectoriel
- TF/IDF
- Booster la requête
- Scoring personalisé
- Highlighting
- Suggestion
-
Relation des documents
- Problématique
- Dénormalisation
- Nested Object :
- Mapping
- Requête, Filtre, Agrégations
- Parent / Child :
- Mapping
- Requête, Filtre, Agrégations
-
Fonctionnalités avancées
- Percolator
- Geolocation
-
Vers la production
- Configuration d’un cluster
- Scalabilité et volumétrie de données
- Bonnes pratiques matérielles
- Supervision
-
Java et Elasticsearch
- Requête DSL
- Requête full-text
- Requête aux termes
- Requête composée
- BitSet, Filtre et Lucene
- Pagination
- Ordonnancement
- Types de recherche
- Warmer Api