UQO - DII - Plan du cours INF6243

Université du Québec en Outaouais

Département d'informatique et d'ingénierie

Sigle : INF6243 Gr. 01
Titre : Techniques d'apprentissage
Session : Automne 2016 Horaire et local
Professeur : Allili, Mohand Saïd

1. Description du cours paraissant à l'annuaire :

Objectifs

Permettre aux étudiants de maîtriser les concepts fondamentaux de l’apprentissage automatique et d’appliquer ces notions à des problèmes concrets. Lui faire acquérir des connaissances sur les techniques d’apprentissage supervisé et non supervisé, les techniques d’apprentissage pour les données textuelles, les algorithmes de classement des pages Web.

Contenu

Concepts d’apprentissage supervisé : classification et régression, frontière de décision et fonctions discriminantes; Arbres de décision et techniques de traitement du sur-apprentissage (overfitting); Apprentissage par ensemble : (bagging), (boosting) et forêt d’arbres; Machine à noyaux : dimension VC et machines à supports vectorielles; Apprentissage non supervisé : (clustering), les mélanges de loi de distribution statistique, carte de Kohonen et algorithme SOFM; Apprentissage de données multidimensionnelles : techniques de réduction de la dimension, classification non supervisée dans les sous-espaces de dimension (subspace clustering); Fouille de données textuelles : modèle TF-IDF et analyse sémantique latente; Prospection du Web : algorithmes HITS et PageRank.

2. Objectifs spécifiques du cours :

Au terme de cette activité, l'étudiant(e) aura acquis des connaissances sur:

Les principes de l’apprentissage automatique;
Les principes de l’apprentissage supervisé et non supervisé;
Les méthodologies de classification et de validation;
Les techniques de classification et de groupement de données;
Les applications de l’apprentissage automatique.

3. Stratégies pédagogiques :

Les formules pédagogiques suivantes seront utilisées:

Cours magistraux (3 heures par semaine)
Présentation de la théorie et des exemples

4. Heures de disponibilité ou modalités pour rendez-vous :

Bureau :B-2022

Téléphone : 819-595-3900 poste 1601

Courriel : Mohandsaid.allili@uqo.ca

5. Plan détaillé du cours sur 15 semaines :

Semaine

Thèmes

Dates

Introduction à l'apprentissage par ordinateur

Données massives (Big data) et apprentissage.
Analyse de données et applications.
Rappel sur le calcul des probabilités et statistique.

09 sept. 2016

Concepts et types d'apprentissage

Apprentissage supervisé et non-supervisé.
Apprentissage supervisé pour la régression.
Apprentissage supervisé pour la classification.
Études d’applications.

16 sept. 2016

Apprentissage supervisé

Frontières de décision et fonctions discriminantes.
Surapprentissage et validation d'apprentissage.
Algorithme des K plus proches voisins (KPPV).
Arbres de décision.

23 sept. 2016

Algorithmes d’apprentissage supervisé

Classification naïve de Bayes.
Analyse discriminante linéaire.
Analyse discriminante non-linéaire.
Classification par régression logistique.

30 sept. 2016

Algorithmes d’apprentissage supervisé (suite)

Machine à vecteurs de support (SVM).
Réseaux de neurones.
Classificateurs à multiples classes.

07 oct. 2016

Semaine d'études

14 oct. 2016

Examen de mi-session

21 oct. 2016

Algorithmes d’apprentissage non-supervisé

Algorithme des K-moyennes.
Groupement hiérarchique de données.
Mélanges de distribution Gaussiens.
Maximum de vraisemblance.

28 oct. 2016

Techniques de réduction de dimensions

Concept de réduction de dimensions.
Analyse en composantes principales.
Techniques de sélection de caractéristiques.
Classification dans les sous-espaces de dimensions.

04 nov. 2016

Fouille et analyse de données textuelles

Modèle TF-IDF.
Analyse sémantique latente.
Classification de documents textuels.
Analyse de spams.

11 nov. 2016

Fouille et analyse de données visuelles

Description des images et vidéos.
Recherche d'images basées sur le contenu.
Détection et reconnaissance d'objets dans les images.
Détection et reconnaissance d'activités en vidéos.

18 nov. 2016

Analyse du contenu Web

Algorithmes de Page-Ranking.
Filtrage collaboratif et suggestion de contenu.
Analyse des préférences d'utilisateurs.

25 nov. 2016

Présentation des mini-projets

02 déc. 2016

Révision générale

09 déc. 2016

Examen final

16 déc. 2016

6. Évaluation du cours :

L’étudiant(e) dans ce cours sera évalué(e) par les examens de mi-session et final, ainsi que par des projets de session. La pondération de la note finale sera comme suit :

Examen de mi-session : 30%

Examen final : 30%

Devoirs : 15%

projets: 25%

Pour les projets, l’évaluation sera répartie comme suit :

Devoirs : 15 points

Il s'agit de tester sur la plateforme Matlab des applications basées sur des techniques d'apprentissage. La plateforme Matlab est disponible dans les laboratoires de l'UQO ou téléchargée sur le Web.

Projets : 25 points

Il s'agit de tester/développer des projets sur l'apprentissage par ordinateur. Ces derniers peuvent être dans l'analyse de données textuelles, visuelles ou le Web. Quelques projets seront fournis pour le professeur. Néanmoins, les étudiants auront la liberté de choisir des projets dans des domaines d'applications qu'ils souhaitent.

L'évaluation se fera sur deux volets:

Un rapport entre 10 et 15 pages. Les normes de présentation de travaux (ex. page de garde, marge d'un pouce, interligne à 1.5, taille des caractères de 12 points) doivent être absolument respectées.
Une présentation de 15 à 20 minutes sera faite en classe. Les projets se feront individuellement ou en équipes de deux si le nombre d'étudiants inscrits dépasse 8.

Une moyenne générale inférieure à 64% est éliminatoire et conduit automatiquement à l'échec de l’étudiant(e).

Tout retard dans la remise d'un travail entraîne une pénalité de 5 % par jour sur la note attribuée à ce travail. La qualité du français sera considérée lors de la correction des travaux.

7. Politiques départementales et institutionnelles :

Politique du département d'informatique et d'ingénierie relative à la tenue des examens
Note sur le plagiat et sur la fraude
Politique relative à la qualité de l'expression française écrite chez les étudiants et les étudiantes de premier cycle à l'UQO
Absence aux examens : cadre de gestion, demande de reprise d'examen (formulaire)
SANS OUI
C'EST NON!
Travaillons ensemble pour développer une culture du respect ! La communauté universitaire de l’UQO se mobilise et lance un message haut et fort de tolérance zéro en matière de violence à caractère sexuel (pour de plus amples renseignements, veuillez consulter la page Web : uqo.ca/sansouicestnon).

8. Principales références :

S. Rogers et M Girolami. A first Course in machine learning, CRC press, 2012.
C. Bishop. Pattern Recognition and Machine learning. Springer 2006.
R. Duda, P. Storck et D. Hart. Pattern Classification. Prentice Hall, 2002.
T. Hastie and R. Tibshirani and J. Friedman. The Elements of Statistical Leaning Theory. Springer, 2009.
C.D. Manning, P. Raghavan et H. Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
S. Ceri, A. Bozzon, M. Brambilla,E. Della Valle,P. Fraternali et S. Quarteroni.Web Information Retrieval, Springer, 2013.
E. Alpayedin. Introduction to Machine Learning. MIT Press, 2e Edition, 2010.

9. Page Web du cours :

https://moodle.uqo.ca

Objectifs

Contenu

SANS OUIC'EST NON!

SANS OUI
C'EST NON!