Université du Québec en Outaouais Département d'informatique et d'ingénierie
Sigle : INF6193  Gr. 01
Titre : Intelligence d'affaires
Session : Automne 2016  Horaire et local
Professeur : Missaoui, Rokia
1. Description du cours paraissant à l'annuaire :

Objectifs

Permettre aux étudiants de maîtriser les fondements, concepts et problèmes reliés à l’intelligence d’affaires (veille économique ou Business intelligence) qui inclut trois facettes : la visualisation de l’information et de la connaissance, la fouille de données et l’entreposage de données.

Contenu

Fouille de données : étapes de découverte de connaissances (prétraitement, fouille de données et interprétation des résultats), techniques de classification (arbres de décision, etc.), techniques de regroupement (treillis de concepts, classification hiérarchique), règles d'association, motifs séquentiels, cas aberrants et fouille de données complexes (Web, texte, graphe).Entreposage de données : étapes de construction d'un entrepôt de données (acquisition, stockage, traitement et accès), modélisation multidimensionnelle des données, techniques OLAP, types d'architectures des entrepôts de données, optimisation des performances et matérialisation de cubes de données. Visualisation de l’information et de la connaissance. Intégration des deux technologies de fouille de données et entreposage de données. Applications et outils de la veille économique.
2. Objectifs spécifiques du cours :

Ce cours est destiné aux étudiants ayant suivi au préalable un ou des cours de bases de données au niveau baccalauréat et/ou qui ont une expérience pertinente en conception et utilisation des bases de données ou en apprentissage machine (machine learning). Ce cours vise à approfondir les connaissances de l'étudiant sur des thèmes reliés à l'intelligence d'affaires.

Le cours a comme objectifs plus particuliers de:
  • initier l'étudiant aux fondements, concepts et problèmes reliés à la veille économique;
  • permettre à l'étudiant d'approfondir ses connaissances sur les techniques de fouille et d'entreposage de données à travers les cours magistraux, les synthèses d'articles, le travail pratique et le projet de session;
  • initier l'étudiant à un travail de recherche similaire à la préparation d'un mémoire de maîtrise par la consultation de références bibliographiques, la préparation de synthèses d'articles et de présentations orales, et la rédaction d'un rapport de session.
3. Stratégies pédagogiques :
Il s'agit d'un cours magistral avec travaux individuels et travaux d'équipe.
4. Heures de disponibilité ou modalités pour rendez-vous :
Période de consultation sur rendez-vous : les mercredis de 15 h 30 à 17 h 30
5. Plan détaillé du cours sur 15 semaines :
Semaine Thèmes Dates
1    Présentation du cours et introduction à l'intelligence d'affaires. 06 sept. 2016 
2    Techniques de prétraitement de données : épuration, intégration et transformation. 13 sept. 2016 
3    Découverte de connaissances : raison d'être et étapes.
Formation des équipes
20 sept. 2016 
4    Techniques de fouille de données et applications.
Synthèse d'article
27 sept. 2016 
5    Classification et prédiction : arbres de décision, réseaux Bayésiens, régression et mesures de précision.
Liste des projets de session
04 oct. 2016 
6    Semaine d'études 11 oct. 2016 
7    Regroupement (clustering) : classification hiérarchique, K-means, analyse formelle de concepts.
Synthèse d'article
18 oct. 2016 
8    Règles d'association et mesures de qualité. 25 oct. 2016 
9    Étapes de construction d'un entrepôt de données.
Ébauche du projet de session
01 nov. 2016 
10    Modélisation multidimensionnelle et stratégies de conception. 08 nov. 2016 
11    Techniques OLAP
Développement d'application : 10 points
15 nov. 2016 
12    Architectures des entrepôts de données et Optimisation des performances. 22 nov. 2016 
13    Présentations orales : 15 points 29 nov. 2016 
14    Présentations orales (fin) 06 déc. 2016 
15    Examen : 30 points
Rapport final : 25 points
13 déc. 2016 
6. Évaluation du cours :

Les normes de présentation de travaux (ex. page de garde, marge d'un pouce, interligne à 1.5, taille des caractères de 12 points) doivent être absolument respectées. Tout travail non conforme aux consignes se verra attribuer une pénalité de 10% de la note obtenue.

Tout travail remis nécessairement via Moodle aura pour nom INF6193-TPX-EquipeY ou INF6193-TXP-Nom.

1. Synthèse et critique de deux articles (travail individuel, 27 septembre et 18 octobre) : 2 X 10 points.
La synthèse ne doit pas dépasser TROIS pages (un maximum de 1600 mots). En cas de dépassement, seules les 3 premières pages seront prises en compte lors de la correction.

2. Développement d'application (travail individuel, 15 novembre) : 10 points.
Il s'agit d'implémenter une procédure de fouille de données.

3. Examen (13 décembre) : 30 points.
L'examen porte sur toute la matière étudiée dans le cours et peut être à livre ouvert ou fermé.

4. Projet de session (en équipe de deux si le nombre d'étudiants inscrits dépasse 8).
Les étudiants sont invités à proposer et à réaliser un projet d'intelligence d'affaires en équipes de deux ou trois membres. Chaque équipe est responsable d'identifier le sujet de son projet et de valider ce sujet auprès du professeur.
La liste des sujets de projets sera distribuée à la cinquième semaine de la session.

Le projet de session peut être soit théorique (synthèse d'articles), soit pratique (ex. conception et implantation d'algorithmes en intelligence d'affaires). Il comprend les deux composantes suivantes:

  • Ébauche du projet de session (1er novembre)
  • Présentations orales (29 novembre et 6 décembre) : 15 points
  • Rapport final (13 décembre) : 25 points

Voici quelques suggestions de sujets de projets de session :

  • Intelligence d'affaires et données massives (big data)
  • Fouille du Web
  • Fouille de textes
  • Analyse et fouille de réseaux sociaux
  • Détection de valeurs aberrantes dans les tables relationnelles ou les cubes de données
  • Techniques avancées de modélisation des entrepôts de données (cf. livre de Golfarelli et al.)
  • Entrepôts de données (ED) temporels, spatiaux, distribués ou en temps réel
  • Nouvelles technologies des ED (cf. chapitre 13 du livre de Vaisman et al.)
  • ED et Web sémantique.

Les consignes de réalisation des divers travaux feront l'objet d'un document à part. Toute note de moins de 52% à l'examen entraîne systématiquement un échec au cours.
Tout retard dans la remise d'un travail entraîne une pénalité de 5% par jour sur la note attribuée à ce travail.
À la discrétion du professeur, une pénalité maximale de 10% de la note globale pourrait affecter la note de session si le professeur observe des absences fréquentes ou une passivité injustifiée et évidente au cours.
La qualité du français sera considérée lors de la correction des travaux.

7. Politiques départementales et institutionnelles :
8. Principales références :

NOTES DE COURS
Disponibles via Moodle.

Références recommandées pour le cours

Jiawei Han, Micheline Kamber, Jian Pei, (2011). Data Mining Concepts and Techniques, 3rd Edition, Morgan Kaufmann, 2011.

Alejandro Vaisman & Estaban Zimanyi, (2014). Data Warehouse Systems - Design and Implementation, Springer, 2014.

Ralph Kimball, Margy Ross, (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 2013.

Références additionnelles

Carlo Batini & Monica Scannapieco, (2016). Data and Information Quality - Dimensions, Principles and Techniques, Springer, 2016.

Matteo Golfarelli & Stefano Rizzi, (2009). Data Warehouse Design: Modern Principles and Methodologies, McGraw-Hill, 2009.

W.H. Inmon & Dan Linstedt, (2015). Data Architecture: A Primer for the Data Scientist: Big Data, Data Warehouse and Data Vault, Morgan Kaufmann, 2015.

Krish Krishnan, (2013). Data Warehousing in the Age of Big Data - The Morgan Kaufmann Series on Business Intelligence, 2013.

Witten, H. & E. Frank, (2011). Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, 3rd Edition, Morgan Kaufmann, 2011.

Références en ligne

Site le plus complet sur la découverte de connaissances :
http://www.kdnuggets.com/index_kdm.html

Documents reliés au livre de J. Han et al.
http://www.cs.illinois.edu/~hanj/bk3/

9. Page Web du cours :
https://moodle.uqo.ca