La formation comprend un volume horaire de 300 heures de cours à l’exclusion du temps consacré aux évaluations. Il est possible de rentrer directement en module 2 (un test de prérequis est organisé). Certains documents de cours sont en anglais.
L’enseignement de l’Executive Master Statistique & Intelligence artificielle se répartie en 3 modules :
- Module 1 : Remise à niveau en mathématiques et bases de la statistique
- Module 2 : Modélisation statistique avancée
- Module 3 : Machine Learning et Intelligence artificielle
Module 1 : Remise à niveau en mathématiques et bases de la statistique57h
Ce module constitue une remise à niveau en mathématique pour pouvoir se familiariser avec « la culture de la donnée ». Il aborde le concept de modélisation aléatoire et les techniques élémentaires de la statistique. Une initiation à la programmation R est intégrée au module, notamment pour illustrer les concepts formels étudiés.
- Remise à niveau en mathématiques
- Remise à niveau en probabilités
- Statistique
- Programmation R
NB : Les titulaires d’un diplôme de niveau bac + 4 sanctionnant un bon niveau en modélisation aléatoire, en probabilité et en statistique pourront être dispensés de ce premier module.
Module 2 :Modélisation statistique avancée111h
Les titulaires d’un diplôme de niveau Bac + 4 sanctionnant un bon niveau en modélisation aléatoire, en probabilité et en statistique peuvent être dispensés du module 1. Un test mathématique spécifique est proposé aux candidats pour l'accès direct au module 2.
Ce module est dédié à la modélisation statistique dans toute sa généralité. Il commence par le modèle linéaire gaussien pour formuler de manière élémentaire de nombreuses situations concrètes de modélisation et mettre en œuvre les concepts étudiés dans le module 1. Les limites du modèle linéaire sont identifiées afin de conduire naturellement à ses généralisations. Le reste du module propose un très large panorama des techniques modernes à la fois sur les plans méthodologiques et pratiques. L'objectif est notamment d’être en capacité d’effectuer des choix de modèles probants et de les appliquer de manière pertinente selon les résultats et objectifs attendus. En complément de la modélisation statistique, ce module aborde la gestion des données avec SQL et la visualisation d'information comme outil d'exploration de données et de restitution de résultats d'analyse.
- Modèle linéaire gaussien
- Modèles linéaires généralisés et choix de modelès
- Modèles à variables latentes
- Bases de données
- Valeurs extrêmes
- Données censurées et données manquantes
- Statistique bayésienne
- Séries temporelles
- Visualisation de données
NB : Les auditeurs dispensés du Module 1 pourront se voir offrir une formation accélérée au logiciel R sur proposition des directeurs de la formation.
Module 3 : Machine Learning et Intelligence artificielle132h
Il est possible d'intégrer directement le module 3, sous réserve d'avoir réussi le test d'entrée.
Ce module aborde d'un point de vue mathématique la notion d'optimisation qui est centrale en Machine Learning et en Intelligence Artificielle. Il inclut aussi une introduction à la programmation Python, langage de référence pour le Deep Learning. En complément des stratégies de mise œuvre ciblées pour les champs applicatifs retenus, le module s'intéresse au déploiement en général des modèles de Machine Learning et au cadre réglementaire de leur utilisation.
- Programmation Python
- Optimisation
- Apprentissage supervisé
- Deep Learning
- Apprentissage non supervisé
- RGPD et RIA
- MLOps
- Mise en pratique en actuariat
- Mise en pratique en marketing
- Case studies in finance
(Les étudiant·e·s valident au choix « Mise en pratique en actuariat » ou « Mise en pratique en marketing » ou « Case studies in finance ».)
Modalités pédagogiques

Les cours en présentiel et en distanciel sont illustrés par des jeux de données artificielles et réelles avec une mise en œuvre directe sur machine :
- Les intervenants s’assureront que les auditeurs disposent d’ordinateur personnel et des logiciels nécessaires mis à jour
- Les auditeurs auront accès au cluster informatique du CEREMADE pour les cours qui le nécessitent
- Des études de cas feront l’objet de travaux individuels ou collectifs en inter-session
- La diversité des pratiques professionnelles et le développement de la recherche en statistique imposent que les auditeurs assurent un travail d’analyse et de synthèse sur la base d’une bibliographie préparée par les responsables de la formation, ainsi que des recherches documentaires
- Plusieurs projets rythment la formation, afin de s’exercer à l’implémentation et à l’interprétation des techniques rencontrées
Modalités d'évaluation
La validation des acquis se fait tout au long du programme :
- Module 1 : devoirs sur table
- Modules 2 et 3 : travaux pratiques et mise en application sur données réelles, projets individuels et de groupes
Focus sur
Webinaire sur la thématique de la décision algorithmique | Dauphine-PSL
Laurence Lelièvre
06 26 71 77 67
contact.stat-ia@dauphine.psl.eu