Université du Québec en Outaouais Département d'informatique et d'ingénierie
Sigle : INF1473  Gr. 01
Titre : Entreposage et prospection de données
Session : Hiver 2019  Horaire et local
Professeur : Yapi, Daniel
1. Description du cours paraissant à l'annuaire :

Objectifs

L'objectif du cours est de familiariser, par la pratique, l'étudiante, l'étudiant avec les techniques de recherche, traitement et diffusion de l'information et des connaissances au sein de l'entreprise en vue de la prise de décision.

Contenu

Entreposage de données : étapes de construction d'un entrepôt de données (acquisition, stockage, traitement et accès), modélisation multidimensionnelle des données et cubes de données, techniques OLAP, types d'architectures des entrepôts de données, optimisation des performances, produits et applications. Prospection de données : étapes de découverte de connaissances (prétraitement, prospection de données et interprétation des résultats), techniques de classification (arbres de décision, etc.), techniques de regroupement (treillis de concepts, classification hiérarchique), règles d'association et mesures de qualité, techniques statistiques d'analyse de données, produits et applications. Ce cours comporte des séances obligatoires de travaux dirigés (TD) de deux heures par semaine.

Descriptif – Annuaire

2. Objectifs spécifiques du cours :
  • Familiariser l’étudiant(e) avec les techniques Business Intelligence.
  • Présenter les principales techniques de prétraitement, prospection et entreposage de données.
  • Illustrer ces techniques à l’aide du système SQL Server 2017 et particulièrement les modules SSIS (SQL Server Integration Services) et SSAS (SQL Server Analysis Services).
  • Permettre à l’étudiant(e) de mettre en pratique toutes les connaissances et techniques acquises durant le cours via des exercices et un projet de session portant sur le prétraitement, la prospection et l’entreposage de données.
3. Stratégies pédagogiques :

Les formules pédagogiques suivantes seront utilisées :

Logistique du cours

  • Accès en laboratoire à des postes de travail Windows XP, sur lesquels le client SQL 2017 est installé.
  • Accès à Moodle sur le Web pour la récupération des notes de cours, des énoncés de travaux, des consignes spécifiques et des résultats d’évaluation.

Plan synthétisé du cours

Les thèmes suivants seront étudiés :

  • Introduction à la veille économique (Business intelligence) et à la prospection de données (Data mining)
  • Techniques de prétraitement de données : 1- Épuration. 2 - Intégration et transformation. 3 - Sélection et réduction
  • Entreposage de données : raison d’être et concepts
  • Étapes de construction d’un entrepôt de données
  • Modélisation multidimensionnelle
  • Stratégies de conception
  • Techniques OLAP
  • Architectures des entrepôts de données
  • Optimisation des performances
  • Applications et produits
  • Découverte de connaissances : raison d’être et définitions
  • Étapes du processus de découverte de connaissances
  • Survol des techniques de prospection de données et des applications courantes
  • Classification et prédiction : 1- Définitions, principaux thèmes. 2 - Comparaison entre la classification et la prédiction. 3 - Arbres de décision et règles de classification. 4 - Réseaux bayésiens. 5 - Approches statistiques de prédiction (modèles de régression)
  • Regroupement : méthodes hiérarchiques comme K-Means, analyse formelle de concepts
  • Règles d’association et mesures de qualité
  • NOTE : Toutes les parties du cours seront illustrées avec les outils Business Intelligence de SQL Server 2017
4. Heures de disponibilité ou modalités pour rendez-vous :

Sur demande. L'étudiant(e) peut m'envoyer un courriel pour fixer un rendez-vous.

Courriel : yapida01@uqo.ca

5. Plan détaillé du cours sur 15 semaines :
Semaine Thèmes Dates
1   

Business Intelligence (Intelligence d'affaires)

SQL Server 2017 : Survol des composantes

10 jan. 2019 
2   

Prétraitement de données (Épuration, intégration, transformation, sélection et réduction de données)

Travaux dirigés 1 : Prétraitement et données (vendredi 18 janvier 2019)

17 jan. 2019 
3   

Construction dun entrepôt de données (Data Warehousing)

Travaux dirigés 2 : Prétraitement de données – SSIS (vendredi 25 janvier 2019)

24 jan. 2019 
4   

Modélisation multidimensionnelle et stratégies de conception

Travail à remettre : 1. Prétraitement de données – Pondération : 15 %

Travaux dirigés 3 : Modélisation de données (vendredi 01 février 2019)

31 jan. 2019 
5   

Modélisation multidimensionnelle et stratégies de conception

Travaux dirigés 4 : Modélisation de données (vendredi 08 février 2019)

07 fév. 2019 
6   

Techniques OLAP et optimisation

Travaux dirigés 5 : Création des cubes de données – SSAS (vendredi 15 février 2019)

14 fév. 2019 
7   

Examen de mi-session Pondération : 25 %

Travail à remettre : 2.1. Conception dun entrepôt de données – Pondération : 10%

Travaux dirigés 6 : Chargement et manipulation des entrepôts de données – SSAS (vendredi 22 février 2019)

21 fév. 2019 
8   

Produits et applications

Travaux dirigés 7 : Création des cubes de données – SSAS (vendredi 01 mars 2019)

28 fév. 2019 
9   

Semaine d’études

07 mars 2019 
10   

Découverte de connaissances (Data Mining)

Travaux dirigés 8 : Manipulation des cubes de données – SSAS (vendredi 15 mars 2019)

14 mars 2019 
11   

Classification

Travail à remettre : 2.2 Manipulation d'un entrepôt de données – Pondération : 5 %

Travaux dirigés 9 : Fouille de données – arbres de décision SSAS (vendredi 22 mars 2019)

21 mars 2019 
12   

Regroupement

Travaux dirigés 10 : Fouille de données – arbres de décision et regroupement – SSAS (vendredi 29 mars 2019)

28 mars 2019 
13   

Règles dassociation

Travail à remettre : 3.1 Construction dun modèle de classification – Pondération : 7 % et de règles d'associations 8 %

Travaux dirigés 11 : Fouille de données – Règles d'associations (vendredi 05 avril 2019)

04 avr. 2019 
14   

Révision et discussion générale sur le cours et les perspectives de recherche en intelligence d'affaires

Préparation pour l'examen final

11 avr. 2019 
15   

Examen final - Pondération: 30 %

Remise des derniers travaux

18 avr. 2019 
6. Évaluation du cours :

L'étudiant(e) dans ce cours sera évalué(e) par les examens de mi-session et final, ainsi que par des travaux pratiques. La pondération de la note finale sera comme suit :

  • Examen de mi-session semaine : 25 %
  • Examen final : 30 %
  • Travaux pratiques : 45 %

Les travaux pratiques comprendront les volets suivants : prétraitement, entreposage (deux sous-travaux) et prospection de données (deux sous-travaux).

Une moyenne générale inférieure à 50 % est éliminatoire et conduit automatiquement à l'échec de l'étudiant(e). Les travaux pratiques se feront par équipes de deux. La pénalité de retard pour la remise d'un travail est de 2 points par jour (y compris les jours fériés et les fins de semaine).

Les présences aux séances de cours et de travaux dirigés seront considérées. Un(e) étudiant(e) qui s'absente souvent et de manière injustifiée aura une diminution de la note finale d'un maximum de 5 points.

Des consignes sur l'échéancier et la réalisation des travaux pratiques seront précisées.

Des consultations de groupes seront organisées sur rendez-vous afin de guider et d'orienter les étudiant(e)s dans la réalisation de leurs travaux.

7. Politiques départementales et institutionnelles :
8. Principales références :
  1. Notes de cours disponibles sur Moodle (principale référence)
  2. Kimball, Ralph et al. The Data Warehouse Toolkit : The Definitive Guide to Dimensional Modeling, Ind., Wiley, 2013.
  3. Burquier, Bertrand. Business intelligence avec SQL Server 2005. Mise en oeuvre d’un projet décisionnel, Dunod, 2007.
  4. J. Han & M. Kamber. Data Mining: Concepts and Techniques, Morgan Kaufmann, 2nd edition, 2006.
  5. D. J. Hand, H. Mannila and P. Smyth. Principles of Data Mining, MIT Press, 2001.
  6. W.H. Inmon. Building the Data Warehouse, John Wiley, 3e édition, 2002.
  7. R. Kimball & M. Ross. Guide pratique de modélisation dimensionnelle, Vuibert informatique, Paris, 2002.
  8. R. Kimball, L. Reeves, M. Ross et W. Thornthwaite. Le Data warehouse, collection Blanche, 2005.
  9. R. Lefébure & G. Venturi. Le Data Mining. Eyrolles, 2001.
  10. W. R. Stanek. SQL Server 2005 : guide de l'administrateur, Microsoft Press, 2006.
  11. Z. Tang & J. MacLennan. Data Mining with SQL Server 2005, Wiley, 2005.
  12. S. Tufféry. Data mining et statistique décisionnelle - Lintelligence dans les bases de données, éditions TECHNIP, 2005.
9. Page Web du cours :
https://moodle.uqo.ca