• Découvrir les méthodes de Data Mining

Accueil / Découvrir les méthodes de Data Mining

Découvrir les méthodes de Data Mining

Durée : 2 jours
Tarif Inter : 1500 €
Tarif sur mesure : Nous consulter
Référence : 4VDM

  • Partagez sur
  • Téléchargez en
  • Inscrivez vous
Programme Public & Pré-requis Organisation

Présentation

La formation présente sans formalisme mathématique les principales techniques de la statistique décisionnelle utilisées sous le terme de « Data Mining ». Des démonstrations pratiques sur des cas concrets seront réalisées par l’intervenant. Les méthodes seront plus décrites dans leur intuition et sur leurs conséquences pratiques, logiciel, temps de calcul, performances, données nécessaires, outils graphiques, etc. Une documentation opérationnelle (synthèse) qui aidera le stagiaire à manipuler les données de retour dans son entreprise.

Objectifs

  • Comprendre la démarche du Data Mining et lorsqu’elle est applicable
  • Connaître le fonctionnement et les résultats à attendre des principales techniques statistiques employées (scoring, typologies)

Programme

  1. Présentation du data mining

    • Définition, positionnement par rapport à la statistique
    • Principales applications
    • Panorama des techniques employées
    • Présentation de l’offre logicielle
    • Cycle d’un projet (Méthode CRISP-DM)
  2. Analyse descriptive

    • Sélection de variables pertinentes
    • Data mining
    • Caractérisation
  3. Typologies et segmentation

    • Méthodes de classification
    • Description des classes
    • Réaffectation des individus aux classes
  4. Modélisation de phénomènes binaires

    • Arbres de décision : modèle et outil descriptif
    • Analyse discriminante
    • Régression logistique
    • Comparaison de modèles : courbes ROC, courbes de lift
  5. Travaux pratiques : comment analyser ?

    • Choisir la bonne méthode statistique en fonction de la nature des données du résultat visé
    • Estimer des résultats et savoir évaluer la précision associée
    • Estimer une moyenne ou une proportion par l’intervalle de confiance
    • Évaluer la précision du résultat
    • Définir la taille minimale de l’échantillon
    • Définir un échantillon représentatif et appliquer un redressement
  6. Travaux pratiques : comment comparer des résultats ?

    • Comparer entre eux des résultats chiffrés
      • Comparaison de moyennes et de proportions
      • Utiliser les tests d’hypothèse (Khi Deux, Student, Fisher)
      • Détecter les facteurs influents par l’analyse de la variance (ANOVA à un ou plusieurs facteurs)
      • Les risques à déjouer
    • Chercher la relation entre plusieurs facteurs
      • Mesurer la relation entre plusieurs variables
      • Calculer la matrice de corrélation et tracer le corrélogramme
      • Modéliser une variable numérique par régression multiple
  7. Prévoir des données dans le futur

    • Détecter et prolonger une tendance dans le temps
    • Dégager des phénomènes saisonniers
    • Prévoir le lissage exponentiel et interpréter l’intervalle de prédiction
Formations à distance
En inter et en intra entreprise

Contactez-nous :
training@softeam.fr
+33 (0)6 07 78 24 18
Prochaines dates

Paris

Rennes

Nantes

Sophia Antipolis

Aix en Provence

Demande de renseignement