Université du Québec en Outaouais Département d'informatique et d'ingénierie
Sigle : INF6193  Gr. 01
Titre : Intelligence d'affaires
Session : Automne 2017  Horaire et local
Professeur : Missaoui, Rokia
1. Description du cours paraissant à l'annuaire :

Objectifs

Permettre aux étudiants de maîtriser les fondements, concepts et problèmes reliés à l’intelligence d’affaires (veille économique ou Business intelligence) qui inclut trois facettes : la visualisation de l’information et de la connaissance, la fouille de données et l’entreposage de données.

Contenu

Fouille de données : étapes de découverte de connaissances (prétraitement, fouille de données et interprétation des résultats), techniques de classification (arbres de décision, etc.), techniques de regroupement (treillis de concepts, classification hiérarchique), règles d'association, motifs séquentiels, cas aberrants et fouille de données complexes (Web, texte, graphe). Entreposage de données : étapes de construction d'un entrepôt de données (acquisition, stockage, traitement et accès), modélisation multidimensionnelle des données, techniques OLAP, types d'architectures des entrepôts de données, optimisation des performances et matérialisation de cubes de données. Visualisation de l’information et de la connaissance. Intégration des deux technologies de fouille de données et entreposage de données. Applications et outils de la veille économique.
2. Objectifs spécifiques du cours :

Ce cours est destiné aux étudiants ayant suivi au préalable un ou des cours de bases de données au niveau baccalauréat et/ou qui ont une expérience pertinente en conception et utilisation des bases de données ou en apprentissage machine (machine learning). Ce cours vise à approfondir les connaissances de l'étudiant sur des thèmes reliés à l'intelligence d'affaires.

Ce cours a comme objectifs plus spécifiques de:
  • initier l'étudiant aux fondements, concepts et problèmes reliés à la veille économique;
  • permettre à l'étudiant d'approfondir ses connaissances sur les techniques de fouille et d'entreposage de données à travers les cours magistraux, les synthèses d'articles, le travail pratique et le projet de session;
  • initier l'étudiant à un travail de recherche similaire à la préparation d'un mémoire de maîtrise par la consultation de références bibliographiques, la préparation de synthèses d'articles et de présentations orales, et la rédaction d'un rapport de session.
3. Stratégies pédagogiques :
Il s'agit d'un cours magistral avec travaux individuels et travaux d'équipe.
4. Heures de disponibilité ou modalités pour rendez-vous :
Période de consultation sur rendez-vous : les mercredis de 15 h 30 à 17 h 30
5. Plan détaillé du cours sur 15 semaines :
Semaine Thèmes Dates
1    Présentation du cours et introduction à l'intelligence d'affaires 06 sept. 2017 
2    Techniques de prétraitement de données : épuration, intégration et transformation 13 sept. 2017 
3    Découverte de connaissances : raison d'être et étapes
Formation des équipes
20 sept. 2017 
4    Techniques de fouille de données et applications
Synthèse d'article: 10 points
27 sept. 2017 
5    Classification et prédiction : arbres de décision, réseaux Bayésiens, régression et mesures de précision
Liste des projets de session
04 oct. 2017 
6    Semaine d'études 11 oct. 2017 
7    Regroupement (clustering) : classification hiérarchique, K-means, analyse formelle de concepts
Exercices: 10 points
18 oct. 2017 
8    Règles d'association et mesures de qualité 25 oct. 2017 
9    Étapes de construction d'un entrepôt de données
Ébauche du projet de session
01 nov. 2017 
10    Modélisation multidimensionnelle et stratégies de conception 08 nov. 2017 
11    Techniques OLAP
15 nov. 2017 
12    Architectures des ED et optimisation des performances Exercices en ED: 10 points 22 nov. 2017 
13    Présentations orales: 15 points 29 nov. 2017 
14    Présentations orales (fin) 06 déc. 2017 
15    Examen: 30 points
Rapport final: 25 points
13 déc. 2017 
6. Évaluation du cours :

Les normes de présentation de travaux (ex. page de garde, marge d'un pouce, interligne à 1.5, taille des caractères de 12 points) doivent être absolument respectées. Tout travail non conforme aux consignes se verra attribuer une pénalité de 10% de la note obtenue.

Tout travail remis nécessairement via Moodle aura pour nom INF6193-TPX-EquipeY ou INF6193-TPX-Nom.

1. Synthèse et critique d'un article (travail individuel, 27 septembre): 10 points

La synthèse ne doit pas dépasser 1600 mots. L'étudiant doit indiquer le nombre de mots de sa synthèse.

2. Travail pratique (travail en équipe, 18 octobre: 10 points.
Il s'agit de réaliser un travail pratique en fouille en utilisant la plate-forme RapidMiner.

2. Exercices (travail en équipe, 22 novembre): 10 points
Il s'agit de mettre en pratique des techniques de modélisation multidimensionnelle des entrepôts de données.

4. Examen (13 décembre): 30 points
L'examen porte sur toute la matière étudiée dans le cours et peut être à livre ouvert ou fermé.

5. Projet de session (en équipe de deux si le nombre d'étudiants inscrits dépasse 8)
Les étudiants sont invités à proposer et à réaliser un projet d'intelligence d'affaires en équipes de deux à trois membres. Chaque équipe est responsable d'identifier le sujet de son projet et de valider ce sujet auprès du professeur.
La liste des sujets de projets sera distribuée à la cinquième semaine de la session.

Le projet de session peut être soit théorique (synthèse d'articles), soit pratique (ex. conception et implantation d'algorithmes en intelligence d'affaires). Il comprend les trois composantes suivantes:

  • Ébauche du projet de session (1er novembre)
  • Présentations orales (29 novembre et 6 décembre): 15 points
  • Rapport final (13 décembre): 25 points.

Voici quelques suggestions de sujets de projets de session:

  • Intelligence d'affaires et données massives (big data)
  • Power BI de Microsoft
  • Fouille du Web
  • Fouille de texte
  • Analyse et fouille de réseaux sociaux
  • Techniques de détection de fraudes
  • Internet des objets (IoT) et objets connectés
  • Entrepôts de données (ED) temporels, spatiaux, distribués ou en temps réel
  • Nouvelles technologies en BI
  • Science de données.

Les consignes de réalisation des divers travaux feront l'objet d'un document à part. Toute note inférieure à 52 % à l'examen entraîne systématiquement un échec au cours.
Tout retard dans la remise d'un travail entraîne une pénalité de 5 % par jour sur la note attribuée à ce travail.
À la discrétion du professeur, une pénalité maximale de 10 % de la note globale pourrait affecter la note de session si le professeur observe des absences fréquentes ou une passivité injustifiée et évidente au cours.
La qualité du français sera considérée lors de la correction des travaux.

7. Politiques départementales et institutionnelles :
8. Principales références :

NOTES DE COURS: disponibles via Moodle.

Références recommandées pour le cours

Jiawei Han, Micheline Kamber, Jian Pei, (2011). Data Mining Concepts and Techniques, 3rd Edition, Morgan Kaufmann, 2011.

Ralph Kimball, Margy Ross, (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 2013.

Alejandro Vaisman & Estaban Zimanyi, (2014). Data Warehouse Systems - Design and Implementation, Springer, 2014. Une version électronique du livre existe sur le site Web de la bibliothèque de l'UQO.

Rick Sherman (2015). Business Intelligence Guidebook: From Data Integration to Analytics, 1st Edition, Morgan Kaufmann, 2015.

Références additionnelles

Carlo Batini & Monica Scannapieco, (2016). Data and Information Quality - Dimensions, Principles and Techniques, Springer, 2016.

Matteo Golfarelli & Stefano Rizzi, (2009). Data Warehouse Design: Modern Principles and Methodologies, McGraw-Hill, 2009.

W.H. Inmon & Dan Linstedt, (2015). Data Architecture: A Primer for the Data Scientist: Big Data, Data Warehouse and Data Vault, Morgan Kaufmann, 2015.

Krish Krishnan, (2013). Data Warehousing in the Age of Big Data - The Morgan Kaufmann Series on Business Intelligence, 2013.

Witten, H. & E. Frank, (2011). Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, 3rd Edition, Morgan Kaufmann.

Références en ligne

Site le plus complet sur la découverte de connaissances :
http://www.kdnuggets.com/index_kdm.html
Documents reliés au livre de J. Han et al.
http://www.cs.illinois.edu/~hanj/bk3/
Documentation sur le livre de Vaisman et al.
https://cs.ulb.ac.be/DWSDIbook/
The Data Warejousing Institute (TDWI)
9. Page Web du cours :
https://moodle.uqo.ca