Université du Québec en Outaouais Département d'informatique et d'ingénierie
Sigle : INF6243  Gr. 01
Titre : Techniques d'apprentissage
Session : Automne 2016  Horaire et local
Professeur : Allili, Mohand Saïd
1. Description du cours paraissant à l'annuaire :

Objectifs

Permettre aux étudiants de maîtriser les concepts fondamentaux de l’apprentissage automatique et d’appliquer ces notions à des problèmes concrets. Lui faire acquérir des connaissances sur les techniques d’apprentissage supervisé et non supervisé, les techniques d’apprentissage pour les données textuelles, les algorithmes de classement des pages Web.

Contenu

Concepts d’apprentissage supervisé : classification et régression, frontière de décision et fonctions discriminantes; Arbres de décision et techniques de traitement du sur-apprentissage (overfitting); Apprentissage par ensemble : (bagging), (boosting) et forêt d’arbres; Machine à noyaux : dimension VC et machines à supports vectorielles; Apprentissage non supervisé : (clustering), les mélanges de loi de distribution statistique, carte de Kohonen et algorithme SOFM; Apprentissage de données multidimensionnelles : techniques de réduction de la dimension, classification non supervisée dans les sous-espaces de dimension (subspace clustering); Fouille de données textuelles : modèle TF-IDF et analyse sémantique latente; Prospection du Web : algorithmes HITS et PageRank.
2. Objectifs spécifiques du cours :
Au terme de cette activité, l'étudiant(e) aura acquis des connaissances sur:
  • Les principes de l’apprentissage automatique;
  • Les principes de l’apprentissage supervisé et non supervisé;
  • Les méthodologies de classification et de validation;
  • Les techniques de classification et de groupement de données;
  • Les applications de l’apprentissage automatique.
3. Stratégies pédagogiques :
Les formules pédagogiques suivantes seront utilisées:
  • Cours magistraux (3 heures par semaine)
  • Présentation de la théorie et des exemples
4. Heures de disponibilité ou modalités pour rendez-vous :
Bureau :B-2022

Téléphone : 819-595-3900 poste 1601

Courriel : Mohandsaid.allili@uqo.ca

5. Plan détaillé du cours sur 15 semaines :
Semaine Thèmes Dates
1    Introduction à l'apprentissage par ordinateur
  • Données massives (Big data) et apprentissage.
  • Analyse de données et applications.
  • Rappel sur le calcul des probabilités et statistique.
09 sept. 2016 
2    Concepts et types d'apprentissage
  • Apprentissage supervisé et non-supervisé.
  • Apprentissage supervisé pour la régression.
  • Apprentissage supervisé pour la classification.
  • Études d’applications.
16 sept. 2016 
3    Apprentissage supervisé
  • Frontières de décision et fonctions discriminantes.
  • Surapprentissage et validation d'apprentissage.
  • Algorithme des K plus proches voisins (KPPV).
  • Arbres de décision.
23 sept. 2016 
4    Algorithmes d’apprentissage supervisé
  • Classification naïve de Bayes.
  • Analyse discriminante linéaire.
  • Analyse discriminante non-linéaire.
  • Classification par régression logistique.
30 sept. 2016 
5    Algorithmes d’apprentissage supervisé (suite)
  • Machine à vecteurs de support (SVM).
  • Réseaux de neurones.
  • Classificateurs à multiples classes.
07 oct. 2016 
6    Semaine d'études 14 oct. 2016 
7    Examen de mi-session 21 oct. 2016 
8    Algorithmes d’apprentissage non-supervisé
  • Algorithme des K-moyennes.
  • Groupement hiérarchique de données.
  • Mélanges de distribution Gaussiens.
  • Maximum de vraisemblance.
28 oct. 2016 
9    Techniques de réduction de dimensions
  • Concept de réduction de dimensions.
  • Analyse en composantes principales.
  • Techniques de sélection de caractéristiques.
  • Classification dans les sous-espaces de dimensions.
04 nov. 2016 
10    Fouille et analyse de données textuelles
  • Modèle TF-IDF.
  • Analyse sémantique latente.
  • Classification de documents textuels.
  • Analyse de spams.
11 nov. 2016 
11    Fouille et analyse de données visuelles
  • Description des images et vidéos.
  • Recherche d'images basées sur le contenu.
  • Détection et reconnaissance d'objets dans les images.
  • Détection et reconnaissance d'activités en vidéos.
18 nov. 2016 
12    Analyse du contenu Web
  • Algorithmes de Page-Ranking.
  • Filtrage collaboratif et suggestion de contenu.
  • Analyse des préférences d'utilisateurs.
25 nov. 2016 
13    Présentation des mini-projets 02 déc. 2016 
14    Révision générale 09 déc. 2016 
15    Examen final 16 déc. 2016 
6. Évaluation du cours :
L’étudiant(e) dans ce cours sera évalué(e) par les examens de mi-session et final, ainsi que par des projets de session. La pondération de la note finale sera comme suit :
  • Examen de mi-session : 30%
  • Examen final : 30%
  • Devoirs : 15%
  • projets: 25%

Pour les projets, l’évaluation sera répartie comme suit :

  • Devoirs : 15 points
  • Il s'agit de tester sur la plateforme Matlab des applications basées sur des techniques d'apprentissage. La plateforme Matlab est disponible dans les laboratoires de l'UQO ou téléchargée sur le Web.

  • Projets : 25 points
  • Il s'agit de tester/développer des projets sur l'apprentissage par ordinateur. Ces derniers peuvent être dans l'analyse de données textuelles, visuelles ou le Web. Quelques projets seront fournis pour le professeur. Néanmoins, les étudiants auront la liberté de choisir des projets dans des domaines d'applications qu'ils souhaitent.

    L'évaluation se fera sur deux volets:

    • Un rapport entre 10 et 15 pages. Les normes de présentation de travaux (ex. page de garde, marge d'un pouce, interligne à 1.5, taille des caractères de 12 points) doivent être absolument respectées.
    • Une présentation de 15 à 20 minutes sera faite en classe. Les projets se feront individuellement ou en équipes de deux si le nombre d'étudiants inscrits dépasse 8.

Une moyenne générale inférieure à 64% est éliminatoire et conduit automatiquement à l'échec de l’étudiant(e).

Tout retard dans la remise d'un travail entraîne une pénalité de 5 % par jour sur la note attribuée à ce travail. La qualité du français sera considérée lors de la correction des travaux.

7. Politiques départementales et institutionnelles :
8. Principales références :
  1. S. Rogers et M Girolami. A first Course in machine learning, CRC press, 2012.
  2. C. Bishop. Pattern Recognition and Machine learning. Springer 2006.
  3. R. Duda, P. Storck et D. Hart. Pattern Classification. Prentice Hall, 2002.
  4. T. Hastie and R. Tibshirani and J. Friedman. The Elements of Statistical Leaning Theory. Springer, 2009.
  5. C.D. Manning, P. Raghavan et H. Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
  6. S. Ceri, A. Bozzon, M. Brambilla,E. Della Valle,P. Fraternali et S. Quarteroni.Web Information Retrieval, Springer, 2013.
  7. E. Alpayedin. Introduction to Machine Learning. MIT Press, 2e Edition, 2010.

    http://ciml.info/
    http://www.sciencemag.org/site/feature/data/compsci/machine_learning.xhtml
    http://archive.ics.uci.edu/ml/
    https://work.caltech.edu/telecourse.html
    http://mlg.eng.cam.ac.uk/

9. Page Web du cours :
https://moodle.uqo.ca