Data Mining, synthèse
Réf: DMI
Durée: 2jours
Objectifs de la formation
Le Data Mining apporte des solutions pour l »extraction de connaissances à partir de données brutes. Ces données représentent des volumes de plus en plus importants et font partie intégrante du patrimoine de l »entreprise. Comment exploiter au mieux ce gisement ? Quelles techniques utiliser pour identifier les corrélations pertinentes entre les données ? Comment gérer un projet de cette nature ? Ce séminaire, qui allie principes théoriques et expériences pratiques, vous propose une synthèse claire et précise sur le Data Mining, ses applications, ses apports pour l »entreprise, ainsi que sur les méthodes et outils les plus utilisés.
Contenu de cette formation data mining:
-Rappels sur les fondamentaux du Système d »information Décisionnel (SID)
-Introduction au Data Mining (DM)
-Présentation de méthodes
-Mise en place d »une solution
-Architecte systèmes décisionnel
-Concepteur de systèmes décisionnels
Programme de Formation
Rappels sur les fondamentaux du Système d »information Décisionnel (SID)
-Les enjeux du SID : besoins des entreprises, domaines d »application.
-Architecture type d »un SID, état de l »art en matière d »architectures décisionnelles.
-Les différentes couches du SID : lien avec le système d »information opérationnel (SIO), état de l »art en matière d »architecture, synthèse sur les différentes couches de l »architecture: couche en lien avec le SIO, couche orientée informations décisionnelles, couche de présentation.
-Elaboration des informations décisionnelles, présentation.
-Conception d »un SID : les étapes, l »optimisation, l »organisation des données, le dictionnaire fonctionnel et technique.
-Panorama des outils décisionnels.
Introduction au Data Mining (DM)
Comprendre le Data Mining
-Définition et finalité du Data Mining (DM). A quoi sert le DM ?
-Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l »informatique ?
-Quelle différence entre le DM et OLAP (On Line Analitycal Processing) ?
-Historique du DM et travaux de recherche.
-Les attentes des entreprises, les réponses du DM.
Les techniques du Data Mining
-Les différentes familles du DM.
-Les méthodes prédictives et les méthodes descriptives.
-L »analyse factorielle, l »analyse typologique, la classification ou clustering, la détection de liens.
-Les arbres de décisions, les réseaux de neurones, les modèles paramétriques.
-Classification des techniques de DM : Quelle technique choisir pour un type de problème donné ?
Présentation de méthodes
La méthode descriptive du clustering
-Définition et méthodologie.
-Choix des critères pour structurer les données à classer. Combien de classes viser ?
-Utilisation de variables.
-Evaluation et validation des classes obtenues. Comment mesurer la qualité d »une bonne classification ?
-Les différentes sous famille du clustering.
-Exemple d »application du clustering
Le Scoring : un premier exemple d »application du DM
-Définition du Scoring.
-Dans quels domaines d »activité est-il utilisé ? Pour quel type de problèmes ?
-Quelle est la finalité ?
-Les catégories de Scoring (appétence, risque, octroi).
-La méthodologie de Scoring.
-Cas pratique de Scoring dans une banque ou assurance.
\r\n
Le géomarketing : un deuxième exemple d »application du DM
-Définition du géomarketing.
-Dans quels domaines d »activité est-il utilisé ? Pour quel type de problèmes ?
-Cas pratique de géomarketing dans une banque ou assurance.
Mise en place d »une solution
Les données de l »entreprise : entre qualité et quantité ?
-Rappel de la problématique des données du SI.
-Les différents types de données.
-Qualité des données et administration des données.
-Processus de collecte et d »exploration.
-Création d »agrégats et de nouvelles données.
-Transformation des données.
Méthodologie de projet
-Définition du problème métier à résoudre et des objectifs à atteindre.
-Inventaire, description et classement des données.
-Conception et alimentation de la base Data Mining.
-Exploration, segmentation des entités analysées.
-établissement du ou des modèles d »analyse.
-Application des modèles et validation des résultats.
-Itérations, déploiement auprès des utilisateurs (formation, accompagnement du changement…).
-Maintenance du modèle et logiciel associé.
Panorama des outils
-Les principaux outils : SAS, R, IBM SPSS, Oracle Data Mining, SQL Server DM…
-Zoom sur l »outil SAS de l »éditeur SAS.
-Zoom sur l »ETL Powercenter.
-Quels critères de choix pour ce type d »outils ?
Profil Stagiaires & Pré-requis
Responsables infocentre, responsables marketing, statisticiens, responsables informatiques, chefs de projets décisionnel, experts décisionnel. Utilisateurs et gestionnaires métiers de bases de données.
Connaissance de base en analyse décisionnelle. Connaissances générales en informatique.
Prix : 1880 € HT.
Paris, Lyon, Aix, Nantes, Rennes, Toulouse, Bordeaux, Bruxelles, Strasbourg, Lille, Geneve, Sophia-antipolis, Luxembourg
Dates de Formation
Nous consulter