Accueil / Machine Learning H2O
Machine Learning H2O
Durée : 3 jours
Tarif Inter : 1700 €
Tarif sur mesure : Nous consulter
Référence : 4MH2
Programme
Public & Pré-requis
Organisation
Présentation
Cette formation vous permettra Maîtriser les concepts fondamentaux de H2O – une plateforme d’apprentissage profond précise, rapide et évolutive. Construisez autant de modèles que vous le souhaitez et comparez les résultats pour trouver le meilleur. Soyez prêt à déployer des applications intelligentes avec un effort de codage minimal en exploitant les modèles ML intégrés.
Objectifs
- Installer et configurer H2O pour travailler avec R, Python et les fournisseurs Cloud
- Acquérir une compréhension approfondie des modèles d’apprentissage automatique intégrés et de l’accès à leur utilisation.
- Savoir utiliser les fonctionnalités H2O via les APIs pour créer et entrainer plusieurs modèles sur un seul nœud ou dans un cluster
- Former un modèle linéaire généralisé, installer et utiliser des modèles généralisés de bas rang H2O
- Charger, entraîner, évaluer les performances du modèle avec Storm et H2O pour la prédiction en temps réel
- Fournir des modèles évolutifs pouvant fonctionner sur des ensembles de données complexes et volumineux
Programme
-
Introduction
- La Data Science
- H2O
- Construire une application plus intelligente
- Combiner les applications et les modèles
- Déployer les modèles en production
-
Installer H2O
- Télécharger et décompresser le paquet H2O
- Installer H2O à partir de R
- Installer H2O à partir de Python
- H2O Quickstart avec R
- Intégration de H2O au Cloud
-
Deep Learning
- Le paquet H2O pour R
- Démarrer H2O
- Limites des décisions
- Le Cover Type Dataset
- Analyse exploratoire des données
- Le modèle Deep Learning
- Recherche par hyper-paramètres
- Les points de contrôles (Checkpointing)
- Validation croisée
- Sauvegarde et chargement du modèle
-
Régression et classification binaire
-
Détection d’anomalies non supervisée
-
GBM & Random Forest
- Arbres de décision
- Les Random Forest
- Machines à gradient renforcé (Gradient Boosted Machines)
- Mise en œuvre de H2O
-
Modèle linéaire généralisé (GLM)
- Les Cover Type
- Modèle multinomial
- Modèle binomial
-
Modèles généralisés de rang inférieur (MRLR)
- Introduction
- Exemple de construction d’un modèle de base
- Représentation par coordonnées (x,y) les caractéristiques archétypales
- Imputation des valeurs manquantes
-
Exemple de Ruche (Hive) UDF et POJO (Java Plain Old Java Object)
- Chargement des données d’apprentissage et de test
- Créer les modèles
- Exporter le meilleur modèle en POJO
- Compiler le modèle H2O comme partie intégrante du projet UDF
- Copier l’UDF dans le cluster et le charger dans la ruche
- Le Score avec votre UDF
-
L’Ensemble Learning
- La méthode Bagging
- La méthode Boosting
- Empiler des Learners
- Installer H2O Ensemble
- Démonstration avec le dataset Higgs
- Démarrer le cluster H2O
- Charger les données dans le cluster H2O
- Préciser le Base Learner & le Metalearner
- Entrainer un Ensemble
- Évaluer la performance des modèles
- Prédire
-
Streaming : Prévisions en temps réel avec H2O sur Storm
- Installation des logiciels nécessaires
- Discussion sur les données
- Utilisation de R pour construire un modèle de GBM dans H2O
- Exporter le modèle GBM en POJO
- Copie des fichiers POJO générés dans un environnement de construction Storm Bolt
- Compiler Storm et construire les Bolts pour le modèle
- Faire fonctionner une topologie Storm avec votre modèle déployé
- Regarder les prévisions en temps réel