• Technique de Data Mining avec R

Accueil / Technique de Data Mining avec R

Technique de Data Mining avec R

Durée : 3 jours
Tarif Inter : 1800 €
Tarif sur mesure : Nous consulter
Référence : 4TDR

  • Partagez sur
  • Téléchargez en
  • Inscrivez vous
Programme Public & Pré-requis Organisation

Présentation

Le Data Mining repose sur la maîtrise des techniques d’exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires. Ce stage pratique vous présentera des méthodes telles que les régressions et les ACP et vous apprendra à les mettre en œuvre avec le logiciel R.

Objectifs

  • Comprendre le principe de la modélisation statistique
  • Choisir le type de régression en fonction du type de données
  • Réaliser des prédictions
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances

Programme

  1. Introduction à la modélisation

    • Modélisation : la régression
    • Modélisation statistique : rappels des tests statistiques
    • Analyse de données
    • Introduction au logiciel R
    • Travaux pratiques
      • Présentation de plusieurs exemples de modélisation.
      • Installation de R et des packages à manipuler.
      • Applications sur R des tests et interprétations sur exemples.
  2. Analyse de régression linéaire

    • Principe de régression linéaire
    • Régression simple, lorsque le modèle comporte un seul paramètre pour des données continues
    • Régression multiple, lorsqu’il y a plus d’un paramètre
    • Autres types de modèles pour données continues
    • Travaux pratiques
      • Application pratique sur R.
      • Cas de régression simple et de régression multiple.
  3. Analyse de régression logistique

    • Présentation des différents types de régression logistique
    • Régression logistique Binaire
    • Régression logistique Ordinale
    • Régression logistique Multinomiale
    • Travaux pratiques
      • Application sur R pour des cas de données non continues.
      • Traitements sur des données à deux modalités, puis avec des modalités ordinales, puis des modalités nominales.
  4. Analyse en composantes

    • Présentation des différents types d’analyses et sélections
    • Analyse en Composantes Principales (ACP)
    • Analyse des Correspondances Multiples (ACM)
    • Classification Hiérarchique sur Composantes Principales (CHCP)
    • Travaux pratiques
      • Les composantes principales permettent de comprendre la structure de covariance des variables initiales et/ou à créer un plus petit nombre de variables à l’aide de cette structure.
      • Applications sur R.
  5. Analyse factorielle des données

    • Comprendre le principe de l’analyse factorielle : résumer la structure des données en un nombre inférieur de dimensions.
    • Analyse Factorielle des Correspondances (AFC).
    • Analyse Factorielle Multiple (AFM).
    • Analyse Factorielle pour Données Mixtes (AFDM).
    • Travaux pratiques
      • Exercices d’analyse factorielle sur R.
      • Identification des « facteurs » sous-jacents des dimensions associées à une variabilité importante.
Formations à distance
En inter et en intra entreprise

Contactez-nous :
training@softeam.fr
+33 (0)6 07 78 24 18
Prochaines dates

Paris

Rennes

Nantes

Sophia Antipolis

Aix en Provence

Demande de renseignement