Université du Québec en Outaouais Département d'informatique et d'ingénierie
Sigle : INF6193  Gr. 01
Titre : Intelligence d'affaires
Session : Automne 2018  Horaire et local
Professeur : Missaoui, Rokia
1. Description du cours paraissant à l'annuaire :

Objectifs

Permettre aux étudiants de maîtriser les fondements, concepts et problèmes reliés à l’intelligence d’affaires (veille économique ou Business intelligence) qui inclut trois facettes : la visualisation de l’information et de la connaissance, la fouille de données et l’entreposage de données.

Contenu

Fouille de données : étapes de découverte de connaissances (prétraitement, fouille de données et interprétation des résultats), techniques de classification (arbres de décision, etc.), techniques de regroupement (treillis de concepts, classification hiérarchique), règles d'association, motifs séquentiels, cas aberrants et fouille de données complexes (Web, texte, graphe). Entreposage de données : étapes de construction d'un entrepôt de données (acquisition, stockage, traitement et accès), modélisation multidimensionnelle des données, techniques OLAP, types d'architectures des entrepôts de données, optimisation des performances et matérialisation de cubes de données. Visualisation de l’information et de la connaissance. Intégration des deux technologies de fouille de données et entreposage de données. Applications et outils de la veille économique.

2. Objectifs spécifiques du cours :

Ce cours est destiné aux étudiants ayant suivi au préalable un ou des cours de bases de données au niveau baccalauréat et/ou qui ont une expérience pertinente en conception et utilisation des bases de données ou en apprentissage machine (machine learning). Ce cours vise à approfondir les connaissances de l'étudiant sur des thèmes reliés à l'intelligence d'affaires.

Ce cours a comme objectifs plus spécifiques de :

  • initier l'étudiant aux fondements, concepts et problèmes reliés à la veille économique;
  • permettre à l'étudiant d'approfondir ses connaissances sur les techniques de fouille et d'entreposage de données à travers les cours magistraux, les synthèses d'articles, le travail pratique et le projet de session;
  • initier l'étudiant à un travail de recherche similaire à la préparation d'un mémoire de maîtrise par la consultation de références bibliographiques, la préparation de synthèses d'articles et de présentations orales, et la rédaction d'un rapport de session.
3. Stratégies pédagogiques :

Il s'agit d'un cours magistral avec travaux individuels et travaux d'équipe.

4. Heures de disponibilité ou modalités pour rendez-vous :

Période de consultation sur rendez-vous : les mercredis de 15 h 30 à 17 h 30

5. Plan détaillé du cours sur 15 semaines :
Semaine Thèmes Dates
1   

Présentation du cours et introduction à l'intelligence d'affaires

05 sept. 2018 
2   

Techniques de prétraitement de données : épuration, intégration et transformation

12 sept. 2018 
3   

Découverte de connaissances : raison d'être et étapes

Formation des équipes

19 sept. 2018 
4   

Techniques de fouille de données et applications

Exercices : 5 points

26 sept. 2018 
5   

Classification et prédiction : arbres de décision, réseaux Bayésiens, régression et mesures de précision
Liste des projets de session

03 oct. 2018 
6   

Semaine d'études

10 oct. 2018 
7   

Examen intra : 20 points

17 oct. 2018 
8   

Regroupement (clustering) : classification hiérarchique, K-means, analyse formelle de concepts


TP en fouille de données : 10 points

24 oct. 2018 
9   

Règles d'association et mesures de qualité

31 oct. 2018 
10   

Étapes de construction d'un entrepôt de données


Ébauche du projet de session

07 nov. 2018 
11   

Modélisation multidimensionnelle et stratégies de conception

14 nov. 2018 
12   

Techniques OLAP

21 nov. 2018 
13   

Architectures des ED et optimisation des performances

TP en entreposage de données : 10 points

28 nov. 2018 
14   

Présentations orales :10 points

05 déc. 2018 
15   

Examen : 30 points


Rapport final : 15 points

12 déc. 2018 
6. Évaluation du cours :

Les normes de présentation de travaux (ex. page de garde, marge d'un pouce, interligne à 1.5, taille des caractères de 12 points) doivent être absolument respectées. Tout travail non conforme aux consignes se verra attribuer une pénalité de 10% de la note obtenue.

Tout travail soumis nécessairement via Moodle aura pour nom INF6193-TPX-EquipeY ou INF6193-TPX-Nom. Aucun travail remis par courriel ne sera pris en considération.

Liste des travaux :

  1. Exercices (travail individuel) pour le 26 septembre : 5 points
  2. Examen intra pour le 17 octobre : 20 points
  3. TP en fouille de données (travail d’équipe) pour le 24 octobre : 10 points. Il s’agit d’utiliser un outil pour expérimenter un ensemble de méthodes de fouille de données
  4. TP en entreposage de données (travail individuel) le 28 novembre : 10 points.
    Il s'agit de mettre en pratique des techniques de modélisation multidimensionnelle des entrepôts de données.
  5. Examen final le 12 décembre : 30 points
    L'examen final porte sur toute la matière étudiée dans le cours et peut être à livre ouvert ou fermé.
  6. Projet de session : 25 points
    Les étudiants sont invités à proposer et à réaliser un projet d'intelligence d'affaires en équipe de deux membres. Chaque équipe est responsable d'identifier le sujet de son projet et de valider ce sujet auprès du professeur.
    La liste des sujets de projets sera distribuée à la cinquième semaine de la session.

Le projet de session peut être soit théorique (synthèse d'articles), soit pratique (ex. conception et implantation d'algorithmes en intelligence d'affaires). Il comprend les trois composantes suivantes:

  • Ébauche du projet de session (7 novembre)
  • Présentations orales (5 décembre): 10 points
  • Rapport final de 15 pages au maximum (12 décembre): 15 points

Voici quelques suggestions de sujets de projets de session:

  • Intelligence d'affaires et données massives (big data)
  • Techniques avancées de l’OLAP
  • Power BI de Microsoft
  • Fouille du Web
  • Apprentissage profond (Deep learning)
  • Analyse et fouille de réseaux sociaux
  • Techniques de détection de fraudes
  • Optimisation des requêtes dans les entrepôts de données
  • Entrepôts de données (ED) temporels, spatiaux, distribués ou en temps réel
  • Nouvelles technologies en BI
  • Science de données

Les consignes de réalisation des divers travaux feront l'objet d'un document à part. Tout retard dans la remise d’un travail entraîne systématiquement une pénalité de 5 % par jour sur la note attribuée à ce travail.

À la discrétion du professeur, une pénalité maximale de 10 % de la note globale pourrait affecter la note de session si le professeur observe des absences fréquentes ou une passivité injustifiée et évidente au cours. La qualité du français sera considérée lors de la correction des travaux.

7. Politiques départementales et institutionnelles :
8. Principales références :

NOTES DE COURS : disponibles via Moodle.

Références recommandées pour le cours

Jiawei Han, Micheline Kamber, Jian Pei, (2011). Data Mining Concepts and Techniques, 3rd Edition, Morgan Kaufmann, 2011.

Ralph Kimball, Margy Ross, (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 2013.

Alejandro Vaisman & Estaban Zimanyi, (2014). Data Warehouse Systems - Design and Implementation, Springer, 2014. Une version électronique du livre existe sur le site Web de la bibliothèque de l'UQO.

Rick Sherman (2015). Business Intelligence Guidebook: From Data Integration to Analytics, 1st Edition, Morgan Kaufmann, 2015.

Références additionnelles

Carlo Batini & Monica Scannapieco, (2016). Data and Information Quality - Dimensions, Principles and Techniques, Springer, 2016.

Matteo Golfarelli & Stefano Rizzi, (2009). Data Warehouse Design: Modern Principles and Methodologies, McGraw-Hill, 2009.

W.H. Inmon & Dan Linstedt, (2015). Data Architecture: A Primer for the Data Scientist: Big Data, Data Warehouse and Data Vault, Morgan Kaufmann, 2015.

Krish Krishnan, (2013). Data Warehousing in the Age of Big Data - The Morgan Kaufmann Series on Business Intelligence, 2013.

Witten, H. & Frank, E., Hall, M.A. & Pal, C.J. (2017). Data Mining: Practical Machine Learning Tools and Techniques, 4th edition, Morgan Kaufmann.

Références en ligne

Site le plus complet sur la découverte de connaissances :
http://www.kdnuggets.com/index_kdm.html
Documents reliés au livre de J. Han et al.
http://www.cs.illinois.edu/~hanj/bk3/
Documentation sur le livre de Vaisman et al.
https://cs.ulb.ac.be/DWSDIbook/
The Data Warejousing Institute (TDWI)

9. Page Web du cours :
https://moodle.uqo.ca