ECTS
6 crédits
Composante
ENSEIRB-MATMECA
Code interne
EI9IAB
Liste des enseignements
Apprentissage automatique
Composante
ENSEIRB-MATMECA
Fondamentaux de l'apprentissage automatique : apprentissage supervisé/non-supervisé, classification/régression, optimisation, surapprentissage, généralisation, etc.
Régression linéaire et modélisation probabiliste (maximum de vraisemblance, maximum a posteriori)
Classifieurs linéaires : régression logistique, descente de gradient, classifieur bayésien
SVM et méthodes à noyaux
Arbres de décision et combinaison de modèles (bagging, boosting, etc).
Apprentissage non-supervisé (clustering) et réduction de dimension
Traitement de séries temporelles, chaînes de Markov
Introduction au traitement du langage naturel (NLP)
Apprentissage profond
Composante
ENSEIRB-MATMECA
Réseaux de neurones et perceptron multicouches : architectures, fonctions d'activation, algorithme de rétropropagation du gradient, fonctions de perte
Techniques d'apprentissage profond : momentum, batch normalization, dropout, data augmentation, etc.
Réseaux de neurones convolutifs
Réseaux de neurones récurrents
Apprentissage de représentations, modèles génératifs : auto-encodeurs, GANs, etc.
Introduction au traitement du langage naturel (NLP)
Mécanisme d'attention et architectures type Transformers
Les élèves suivront également une partie du cours EI9IS324 Outils pour l'apprentissage en commun avec l'option CISD (15h).
Apprentissage par renforcement
Composante
ENSEIRB-MATMECA
Ce cours est une introduction à une branche de l'apprentissage automatique ("machine learning") appelée apprentissage par récompense ("reinforcement learning", RL). Dans ce cours nous aborderons les modèles principaux utilisés en RL : les bandits manchots ("multi-armed bandits"), les processus de décision Markoviens ("Markov decision process"), et leurs extensions multi-agents et à observation partielle, à la fois dans le cadre dynamique et dans le cadre d'approximation de fonctions (par réseaux de neurones en particulier). Nous étudierons les algorithmes les plus importants : value iteration, strategy iteration, Q-learning, DQN (Deep Q-learning). Ils seront implémentés en Python.