ECTS
6 crédits
Composante
ENSEIRB-MATMECA
Code interne
EI9IAB
Liste des enseignements
Apprentissage automatique
Composante
ENSEIRB-MATMECA
Fondamentaux de l'apprentissage automatique : apprentissage supervisé/non-supervisé, classification/régression, optimisation, surapprentissage, généralisation, etc.
Régression linéaire et modélisation probabiliste (maximum de vraisemblance, maximum a posteriori)
Classifieurs linéaires : régression logistique, descente de gradient, classifieur bayésien
SVM et méthodes à noyaux
Arbres de décision et combinaison de modèles (bagging, boosting, etc).
Apprentissage non-supervisé (clustering) et réduction de dimension
Traitement de séries temporelles, chaînes de Markov
Introduction au traitement du langage naturel (NLP)
Apprentissage profond
Composante
ENSEIRB-MATMECA
Réseaux de neurones et perceptron multicouches : architectures, fonctions d'activation, algorithme de rétropropagation du gradient, fonctions de perte
Techniques d'apprentissage profond : momentum, batch normalization, dropout, data augmentation, etc.
Réseaux de neurones convolutifs
Réseaux de neurones récurrents
Apprentissage de représentations, modèles génératifs : auto-encodeurs, GANs, etc.
Introduction au traitement du langage naturel (NLP)
Mécanisme d'attention et architectures type Transformers
Apprentissage par renforcement
Composante
ENSEIRB-MATMECA
Ce cours est une introduction à une branche de l'apprentissage automatique ("machine learning") appelée apprentissage par récompense ("reinforcement learning", RL). Dans ce cours nous aborderons les modèles principaux utilisés en RL : les bandits manchots ("multi-armed bandits"), les processus de décision Markoviens ("Markov decision process"), et leurs extensions multi-agents et à observation partielle, à la fois dans le cadre dynamique et dans le cadre d'approximation de fonctions (par réseaux de neurones en particulier). Nous étudierons les algorithmes les plus importants : value iteration, strategy iteration, Q-learning, DQN (Deep Q-learning). Ils seront implémentés en Python.