L’enseignement est structuré en 20 cours (certains sont dispensés en anglais), répartis en 4 modules pour une durée totale de 325 heures. Sont intégrés dans les cours les travaux pratiques en salle machine permettant de résoudre des exercices et de traiter des études de cas concrets. Les étudiants pourront accéder au cluster du LAMSADE, à des ordinateurs équipés de processeurs GPU pour le deep learning, ainsi qu'à des ressources cloud comme Amazon Web Services. La plupart des cours prévoient des exercices à résoudre entre deux séances de formation et des projets sur des cas d'utilisation réels.
Module 1 : Les bases de l’IA, de l'algorithmique, des bases de données et des architectures distribuées60h
- Statistiques et probabilités, algèbre linéaire
- Architectures centralisées et distribuées
- Algorithmes et structures de données en Python
- Données relationnelles et SQL
Une partie du module sera consacrée à un renforcement en algorithmique et architectures distribuées, en préambule à la présentation de techniques utilisant de l'algorithme avancé ainsi que des notions d’architectures complexes, qui sont indispensables au traitement des données massives ainsi que pour l'exécution d’algorithmes d’apprentissage s'appuyant sur les architectures multi-cœurs et éventuellement des GPU.
Le module prévoit enfin une remise à niveau sur les données relationnelles et SQL afin d'introduire des techniques fondamentales pour comprendre et manipuler les données modélisées (tables et associations entre elles). Le cours permet de comprendre les types de données largement répandus dans le cadre de l’IA et de l’analyse de données, et prépare à la compréhension d’autres modèles de données et d’autres paradigmes de manipulation.
Module 2 : Machine Learning110h
L’apprentissage automatique est à l’origine du renouveau de l’IA et de l’engouement actuel pour ce domaine. Le but de ce module est d’introduire aux étudiants les concepts et outils fondamentaux pour développer et analyser des algorithmes d'apprentissage automatique. Le module présentera les fondements de l'apprentissage automatique, passera en revue les algorithmes les plus efficaces et discutera de leur application dans des problèmes réels.
- Fondements de l'apprentissage supervisé et non supervisé
- Deep learning
- Systèmes de recommandation
- NLP (Natural Language Processing)
- Apprentissage par renforcement
- Optimisation et apprentissage
Module 3 : Données massives105h
Comme déjà souligné, les techniques et les approches récentes adoptées dans le cadre de l’IA sont caractérisées par l’utilisation de collections de données, souvent massives et provenant de sources hétérogènes via des traitements préliminaires. Ces techniques doivent prendre en compte des aspects cruciaux : le passage à l'échelle, la qualité des données et la présence de données hétérogènes. Cela nécessite l’utilisation de techniques non-conventionnelles comme les systèmes et paradigmes du traitement distribué ainsi que des nouveaux modèles de type NoSQL, en s'appuyant sur des architectures éventuellement de type Cloud. Le module met également l'accent sur l'implémentation d’algorithmes d’IA présentés dans le module 2.
- Qualité et préparation des données
- Traitement distribué de données massives sur Hadoop, Spark et Kafka
- Machine Learning sur les Big Data en Spark et TensorFlow
- SQL avancée, NoSql et NewSQL
- Données sur le Cloud
- Analyse de graphes
Module 4 : Cas d’utilisation et projet IA50h
Ce module a pour vocation de traiter en profondeur des cas d’utilisation typiques et particulièrement importants de l’intelligence artificielle aujourd'hui, sur des domaines stratégiques tels que la finance et l’assurance, la santé et le management.
- IA dans la finance
- IA et santé
- IA et management
- Projet IA
Modalités pédagogiques
- Les intervenants s’assurent que les auditeurs disposent d’un ordinateur personnel et des logiciels nécessaires mis à jour.
- Les auditeurs ont accès au cluster informatique du LAMSADE ainsi qu'à des ressources du Cloud pour les travaux pratiques et projets qui le nécessitent.
- Des études de cas et projets font l’objet de travaux individuels ou collectifs en intersession.
- Ponctuellement, des conférences viennent compléter la formation, durant lesquelles des académiques et professionnels présentent leurs résultats de recherche et développement au sein de leur laboratoire de recherche ou entreprises.
- Plusieurs projets rythment la formation, permettant de s’exercer à l’implémentation et à l’interprétation des techniques rencontrées, avec un focus particulier sur l'analyse expérimentale des implémentations réalisées.
Modalités d'évaluation
La validation des acquis se fait tout au long de l'Executive Master Intelligence artificielle et science des données :
- Devoirs sur table
- Examen oral
- Mémoire
- Travaux de groupe
- Travaux personnels
Laurence Lelièvre
06 26 71 77 67
contact.executive-master.iasd@dauphine.psl.eu