• Technique de Data Mining avec R

Accueil / Technique de Data Mining avec R

Technique de Data Mining avec R

Durée : 3 jours
Tarif Inter : 1800 €
Tarif sur mesure : Nous consulter
Référence : 4TDR

  • Partagez sur
  • Téléchargez en
  • Inscrivez vous
Programme Public & Pré-requis Organisation

Présentation

Le Data Mining repose sur la maîtrise des techniques d’exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires. Ce stage pratique vous présentera des méthodes telles que les régressions et les ACP et vous apprendra à les mettre en œuvre avec le logiciel R.

Objectifs

  • Comprendre le principe de la modélisation statistique
  • Choisir le type de régression en fonction du type de données
  • Réaliser des prédictions
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances

Programme

  1. Introduction à la modélisation

    • Modélisation : la régression
    • Modélisation statistique : rappels des tests statistiques
    • Analyse de données
    • Introduction au logiciel R
    • Travaux pratiques
      • Présentation de plusieurs exemples de modélisation.
      • Installation de R et des packages à manipuler.
      • Applications sur R des tests et interprétations sur exemples.
  2. Analyse de régression linéaire

    • Principe de régression linéaire
    • Régression simple, lorsque le modèle comporte un seul paramètre pour des données continues
    • Régression multiple, lorsqu’il y a plus d’un paramètre
    • Autres types de modèles pour données continues
    • Travaux pratiques
      • Application pratique sur R.
      • Cas de régression simple et de régression multiple.
  3. Analyse de régression logistique

    • Présentation des différents types de régression logistique
    • Régression logistique Binaire
    • Régression logistique Ordinale
    • Régression logistique Multinomiale
    • Travaux pratiques
      • Application sur R pour des cas de données non continues.
      • Traitements sur des données à deux modalités, puis avec des modalités ordinales, puis des modalités nominales.
  4. Analyse en composantes

    • Présentation des différents types d’analyses et sélections
    • Analyse en Composantes Principales (ACP)
    • Analyse des Correspondances Multiples (ACM)
    • Classification Hiérarchique sur Composantes Principales (CHCP)
    • Travaux pratiques
      • Les composantes principales permettent de comprendre la structure de covariance des variables initiales et/ou à créer un plus petit nombre de variables à l’aide de cette structure.
      • Applications sur R.
  5. Analyse factorielle des données

    • Comprendre le principe de l’analyse factorielle : résumer la structure des données en un nombre inférieur de dimensions.
    • Analyse Factorielle des Correspondances (AFC).
    • Analyse Factorielle Multiple (AFM).
    • Analyse Factorielle pour Données Mixtes (AFDM).
    • Travaux pratiques
      • Exercices d’analyse factorielle sur R.
      • Identification des « facteurs » sous-jacents des dimensions associées à une variabilité importante.
Formations à distance
En inter et en intra entreprise

Contactez-nous :
training@softeam.fr
+33 (0)6 07 78 24 18
Prochaines dates

A distance

Du 01 au 03 février 2021
Du 08 au 10 mars 2021
Du 26 au 28 avril 2021
Du 10 au 12 mai 2021
Du 28 au 30 juin 2021
Du 05 au 07 juillet 2021
Du 23 au 25 août 2021

Demande de renseignement