Université du Québec en Outaouais Département d'informatique et d'ingénierie
Sigle : INF6143  Gr. 01
Titre : Bases de données avancées
Session : Hiver 2018  Horaire et local
Professeur : Missaoui, Rokia
1. Description du cours paraissant à l'annuaire :

Objectifs

Permettre aux étudiants de maîtriser les connaissances sur les fondements, concepts et problèmes reliés aux bases de données allant des bases de données conventionnelles (incluant les bases de données réparties) aux bases de données plus avancées comme les entrepôts de données et les bases multimédia (incluant les systèmes d’information géographique et les bases documentaires).

Contenu

Rappels sur les bases de données (BD). Contrôle et optimisation des performances dans un environnement centralisé. Bases de données réparties : principes, stratégies de conception, traitement des requêtes réparties, et gestion des transactions réparties. Veille économique (business intelligence) : fouille et entreposage de données. BD multimédia (particularités et exigences, stockage et exploitation, systèmes d’information géographique. BD documentaires). BD et Web (connexion à une BD via le Web, langage XML).
2. Objectifs spécifiques du cours :
Ce cours est destiné aux étudiants ayant suivi au préalable un ou des cours de bases de données au niveau baccalauréat et/ou qui ont une expérience pertinente en conception et utilisation des bases de données.

Ce cours vise à approfondir les connaissances de l'étudiant sur des thèmes avancés en bases de données tels les bases de données réparties, la fouille et l'entreposage de données (data mining et data warehousing, les bases de données multimédia et les BD sur le Web.

Ce cours a comme objectifs plus particuliers de:

  • initier l'étudiant aux fondements, concepts et problèmes reliés aux BD;
  • permettre à l'étudiant d'approfondir, à travers les travaux de session, quelques aspects des BD avancées;
  • initier l'étudiant à un travail de recherche à travers la préparation de synthèses d'articles et de présentations orales et la rédaction d'un rapport de session.
3. Stratégies pédagogiques :
Il s'agit d'un cours magistral avec travaux individuels et travaux d'équipe.
4. Heures de disponibilité ou modalités pour rendez-vous :
Bureau: B-2032, téléphone: 819 595-3900, poste 1709

Courriel: rokia.missaoui@uqo.ca

Page Web: http://w3.uqo.ca/missaoui

Consultation: Mercredi, de 15h30 à 17h30

5. Plan détaillé du cours sur 15 semaines :
Semaine Thèmes Dates
1    Présentation du cours, entente d'évaluation, ... 09 jan. 2018 
2   

Quelques rappels:

  • fonctionnalités des systèmes de gestion de BD (SGBD)
  • conception des bases de données
  • modèle relationnel
16 jan. 2018 
3   

Principes des bases de données réparties (BDR):

  • objectifs;
  • nouveaux défis;
  • formes de compatibilité;
  • architecture ANSI/SPARC étendue.

Modèle architecturaux des BDR selon les trois dimensions:

  • répartition;
  • hétérogénéité;
  • autonomie.

Architecture des systèmes répartis:

  • modèle client-serveur;
  • modèle poste à poste (peer-to-peer).
23 jan. 2018 
4   

Conception et catégories des BDR:

  • approche ascendante versus descendante;
  • fragmentation (horizontale, verticale et mixte);
  • allocation: principe et modèle.
Synthèse d'article: 10 points
30 jan. 2018 
5   

Veille économique (Business Intelligence): raison d'être, techniques et défis:

  • fouille de données (data mining);
  • entreposage de données(data warehousing).
06 fév. 2018 
6   

Veille économique Suite:

  • fouille de données (data mining)
Synthèse d'article: 10 points
13 fév. 2018 
7   

Veille économique Suite:

  • entreposage de données (data warehousing)
20 fév. 2018 
8    Semaine d'études 27 fév. 2018 
9   

Optimisation des requêtes dans les BD centralisées:

  • optimisation des sélections, projections et jointures;
  • optimisation dans SQL Server et Oracle.

Ébauche du projet de session

06 mars 2018 
10   

Optimisation des requêtes dans les BDR:

  • décomposition des requêtes
  • localisation des données
  • traitement local versus global
  • semi-jointure;
13 mars 2018 
11   

BD multimédia:

  • texte, image, audio et vidéo
  • particularités et exigences;
  • stockage et exploitation;
Développement d'applications: 10 points
20 mars 2018 
12    BD et Web
  • BD XML : description et exploitation
27 mars 2018 
13    Exposés

Présentations orales : 15 points

03 avr. 2018 
14    Exposés

Présentations orales

10 avr. 2018 
15    Examen: 30 points

Rapport final: 25 points

17 avr. 2018 
6. Évaluation du cours :
Synthèse et critique de deux articles (travail individuel, 4ème et 6ème): 2 * 10 points

La synthèse ne doit pas dépasser un maximum de 1600 mots. De même, les normes de présentation de travaux (ex.: page de garde, marge d'un pouce, interligne à 1.5, taille des caractères de 12 points) doivent être absolument respectées. Tout travail non conforme aux consignes se verra attribuer une pénalité de 10 % de la note obtenue.

Développement d'applications (11ème semaine) 10 points

Examen (15ème semaine) 30 points

Projet de session (en équipe de deux si le nombre d'étudiants inscrits dépasse 8)

Le projet de session peut être soit théorique (synthèse d'articles), soit pratique (conception et implantation de programmes). Il comprend les deux composantes suivantes:

  • Ébauche du projet de session (9ème semaine)
  • Présentations orales (13ème et 14ème semaines) 15 points;
  • Rapport final (15ème semaine) 25 points;

Voici quelques suggestions de sujets de projets de session:

  • Gestion de données massives (big data)
  • Fouille de données massives
  • Infonuagique (cloud computing)
  • Traitement parallèle (MapReduce & Hadoop)
  • Systèmes NoSQL
  • Techniques avancées d'indexation et de stockage de données
  • Analyse et fouille de réseaux sociaux (détection de communauté, prédiction de liens, déstabilisation de réseaux)
  • Algorithmes d'ordonnancement du Web (ex. HITS, PageRank, ...)
  • Entrepôts de données répartis
  • Fouille répartie des données (Distributed Data Mining)
  • Systèmes d'information géographique
  • Interactions entre les BD et le Web
  • Bases de données XML (XQuery, Xpath, XSLT, etc.)
  • Stockage et recherche de données spatiales
  • Bases de données temporelles
  • Traitement de l'imprécision dans les bases de données, etc.

Les consignes de réalisation des divers travaux feront l'objet d'un document à part.

Toute note de moins de 52 % à l'examen entraîne systématiquement un échec au cours.

Tout retard dans la remise d'un travail entraîne une pénalité de 5 % par jour sur la note attribuée à ce travail.

À la discrétion du professeur, une pénalité maximale de 10 % de la note globale pourrait affecter la note de session si le professeur observe des absences fréquentes ou une passivité injustifiée et évidente au cours.

La qualité du français sera considérée lors de la correction des travaux.

7. Politiques départementales et institutionnelles :
8. Principales références :

NOTE DE COURS

  • Disponibles via MOODLE

LIVRES RECOMMANDÉS

  • Elmasri, R. & Navathe S. B., Fundamentals of Database Systems, 7ème édition, Pearson Education, 2016.

MONOGRAPHIE

  • Atzeni, P., Ceri, S., Paraboschi, S., Torlone, R. (2000). Database Systems - Concepts, Languages and Architectures. McGraw-Hill.
  • Abiteboul, S., Buneman, P. & Suciu, D. (2000). Data on the Web, Morgan Kaufmann.
  • Carlo Batini & Monica Scannapieco (2016), Data and Information Quality - Dimensions. Principles and Techniques, Springer, 2016.
  • Chakrabarti, S. (2003). Mining the Web. Morgan Kaufmann.
  • Thomas Connolly & Carolyn Begg (2015), Database Systems: A Practical Approach to Design, Implementation and Management, 6ème édition, Pearson Education, 2015.
  • G. Coulouris, J. Dollimore & T. Kindberg (2005). Distributed Systems, 4th edition, Addison-Wesley
  • Date, C.J. (2004). An Introduction to Database Systems, 8th edition, Pearson Education.
  • Dunckley, L. (2003). Multimedia Databases: An Object-Relational Approach, 1st edition, Addison-Wesley.
  • Dunham, M.H. (2003). Data Mining: Introductory and Advanced Topics, Prentice Hall.
  • Garcia-Molina, H., Ullman, H.J. & Widom, J. (2009). Database Systems - The Complete Book,2nd edition Prentice-Hall.
  • Godin, R. (2006). Systèmes de gestion de bases de données par l'exemple, 2ème édition, Loze-Dion.
  • Matteo Golfarelli & Stefano Rizzi (2009), Data Warehouse Design : Modern Principles and Methodologies, McGraw-Hill, 2009.
  • Gray, J. and Reuter, A. (1993). Transaction Processing: Concepts and Techniques, Morgan Kaufmann Series in Data Management Systems, Jim Gray Series Editor.
  • Han, J., Kamber, M. & Pei, J. (2011). Data Mining: Concepts and Techniques, Morgan Kaufmann. 3rd edition, 2011.
  • W.H. Inmon & Dan Linstedt, (2015), Data Architecture : A Primer for the Data Scientist : Big Data, Data Warehouse and Data Vault, Morgan Kaufmann, 2015.
  • Ralph Kimball, Margy Ross, (2013), The Data Warehouse Toolkit : The Definitive Guide to Dimensional Modeling, 2013.
  • Lewis, P.M., Bernstein, A. & Kifer, M., (2002), Databases and Transaction Processing, Addison-Wesley
  • Liu, L. and Özsu, M.T. Eds, (2009), Encyclopedia of Database Systems, Springer US 2009.
  • Özsu, M. T. & Valduriez, P. (2011). Principles of Distributed Database Systems, 3rd edition, Prentice-Hall.
  • Ramakrishnan, R. & Gehrke, J. (2003) Database Management Systems,, 3rd edition, McGraw Hill.
  • Riccardi, G. (2003). Database System Concepts with Web Site Development Applications,, Addison-Wesley.
  • Riccardi, G. (2001), Principles of Database Systems with Internet and Java Applications, Addison Weswley.
  • Shasha, D. & Bonnet, P. (2002). Database Tuning: principles, experiments and troubleshooting techniques,, Morgan Kaufmann.
  • Silberschatz, A., Korth, H. and S. Sudarshan (2001), Database System Concepts, 4th edition, McGraw Hill Book Co.
  • Tanenbaum, A. (2003). Computer Networks, 4th edition, Prentice-Hall.
  • G. Weikum & G. Vossen (2002). Transactional Information Systems, Morgan Kaufmann.
  • Alejandro Vaisman & Esteban Zimanyi (2014), Data Warehouse Systems - Design and Implementation, Springer, 2014.
  • Witten, H. & E. Frank (2011). Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, 3rd edition, Morgan Kaufmann.

REVUES

  • Communications of ACM, Journal of ACM
  • ACM Computing surveys
  • Transactions On Database Systems (TODS), ACM
  • Transactions on Information Systems (TIS), ACM
  • ACM SIGMOD Record
  • IEEE database Engineering Bulletin, IEEE Computer
  • IEEE Transactions on Knowledge and Data Engineering

ACTES DE CONFÉRENCE

  • Proceedings of ACM International Conference On Management of Data (SIGMOD)
  • Proceedings of ACM Symposium on Principles of Database Systems (PODS)
  • Proceedings of Very Large Data Base (VLDB) Conference
  • Proceedings of the IEEE International Conference on Data Engineering
  • Proceedings of the International Conf. on Extending Database Technology (EDBT)
  • Proceeding of ACM International Conference On Knowledge Discovery from Databases (KDD)

QUELQUES SITES WEB UTILES:

  • http://gdt.oqlf.gouv.qc.ca/index.aspx (Grand dictionnaire terminologique de l’Office québécois de la langue française
  • http://www.sigmod.org/ (Groupe d'intérêt SIGMOD de l'ACM)
  • http://db.uwaterloo.ca/~tozsu/(site de Prof. Tamer Özsu)
  • www.cs.uiuc.edu/~hani/ (site de Prof. Jiawei Han)
  • http://www.info2.uqam.ca/~godin/ (site de Prof. R. Godin)
  • http://scholar.google.ca/ (Google scholar)
  • http://librarians.acm.org/digital-library (ACM Digital Library)
  • http://www.informatik.uni-trier.de/~ley/db/ (The DBLP Computer Science Bibliography)
9. Page Web du cours :
https://moodle.uqo.ca