ECTS
7 crédits
Composante
ENSEIRB-MATMECA
Code interne
EI9CISD
Liste des enseignements
Traitement des données in-situ
Composante
ENSEIRB-MATMECA
L'objectif principal de cette formation est de comprendre le fonctionnement des modèles de visualisation in-situ et de prendre en main un ensemble d'outils permettant leur mise en œuvre. Le cours prend la forme d'une série de TP, clôturé par un mini-projet (application des apprentissages du TP). Nous utiliserons en particulier le logiciel Paraview et la bibliothèque Catalyst. Le mini-projet consistera en la mise en œuvre d'une instrumentation in situ sur un système gravitationnel corpusculaire (un système stellaire en l’occurrence). Si le temps le permet, nous essaierons également d'instrumenter un code de simulation de tokamak (évolution du plasma au sein d'un réacteur à fusion nucléaire).
Fouille, extraction et visualisation
Composante
ENSEIRB-MATMECA
Le but de ce cours est double et s'articulera autour de deux projets.
Le premier projet a pour but de présenter et de mettre en oeuvre quelques techniques d'extraction d'information issues de données textuelles.
Nous verrons dans un premier temps comment des algorithmes éprouvés tels que le modèle Bag-of-Word et le TF-IDF permettent d'extraire des données pertinentes de documents.
Nous aborderons ensuite les méthodes d'embedding vectoriels, en étudiant le modèle Word2Vec, qui permet d'extraire des données contextuelles.
Enfin nous verrons comment exploiter ces informations pour identifier des textes sémantiquement proches ou encore les catégoriser au moyen d'algorithmes de clustering.
Le second projet s'intérressera à un problème similaire, mais dans le cadre de données visuels.
Les cours seront accompagnés de TDs/TPs permettant la mise en oeuvre effective des algorithmes présentés ci-dessus.
Deux projets, l'un sur les données textuelles et l'autre sur les données visuelles, adossés à des données réelles, permettront aux élèves de mettre en application les algorithmes vu en cours, tout en mettant en oeuvre leurs compétences en calcul distribué pour traiter la volumétrie du jeu de données en un temps raisonnable.
Projet Application HPC
Composante
ENSEIRB-MATMECA
L'objectif consiste à étudier les différents niveaux de parallélisation d'une application HPC: vectorisation, multi-thread, mémoire distribuée au sein d'une seule et même application. L'application choisie consiste en l'implémentation de noyaux d'algèbre linéaire eux-même fréquemement au coeur des application de simulation et d'apprentissage à grande échelle.