La formation comprend un volume horaire de 300 heures de cours à l’exclusion du temps consacré aux évaluations. Il est possible de rentrer directement en module 2 (un test de prérequis est organisé). Certains documents de cours sont en anglais.
L’enseignement de l’Executive Master Statistique & Intelligence artificielle se répartie en 3 modules :
- Module 1 : Remise à niveau en mathématiques et bases de la statistique
- Module 2 : Modélisation statistique avancée
- Module 3 : Machine Learning et Intelligence artificielle
Le programme de la formation en statistique et intelligence artificielle
Module 1 : Remise à niveau en mathématiques et bases de la statistique57h
Avant d’explorer les outils avancés du Machine Learning, ce module vous permet de consolidervos bases en mathématiques, essentielles pour « la culture de la donnée » et de comprendreles mécanismes de la modélisation aléatoire. Une initiation à la programmation en R permet d’illustrer concrètement les concepts théoriques et de développer une première approche pratique de l’analyse de données.
- Remise à niveau en probabilités
- Estimation classique, tests, régions de confiance
- Modèle linéaire gaussien
- Mise en pratique statistique sous le logiciel R
NB : Les titulaires d’un diplôme de niveau bac + 4 sanctionnant un bon niveau en modélisation aléatoire, en probabilité et en statistique pourront être dispensés de ce premier module.
Module 2 : Modélisation statistique avancée111h
Les titulaires d’un diplôme de niveau Bac + 4 sanctionnant un bon niveau en modélisation aléatoire, en probabilité et en statistique peuvent être dispensés du module 1. Un test mathématiques spécifique est proposé aux candidats pour l'accès direct au module 2.
Ce module vous permet d’approfondir la modélisation statistique dans toute sa diversité. Les concepts du module 1 seront notamment mobilisés par le modèle linéaire gaussien, base incontournable pour formaliser de manière élémentaire de nombreuses situations concrètes, et ses généralisations, indispensables pour pallier les limites du modèle linéaire.
Grâce à une approche progressive et pratique, vous explorerez un large panorama de techniques statistiques modernes, à la fois sur le plan méthodologique et appliqué, toujours via une mise en pratique sous R. Vous apprendrez notamment à choisir, ajuster et interpréter les modèles les plus pertinents selon les objectifs et les résultats attendus.
En complément de la modélisation statistique, ce module aborde la gestion des données avec SQL et la visualisation d'information comme outil d'exploration de données et de représentation et valorisation d’une analyse.
- Choix de modèles
- Modèles linéaires généralisés
- Régression non-paramétrique
- Analyse de données
- Bases de données sous SQL
- Valeurs extrêmes
- Approche bayésienne
- Séries temporelles
- Données manquantes et données censurées
- R avancé
- Python
NB : Les auditeurs dispensés du Module 1 pourront se voir offrir une formation accélérée au logiciel R sur proposition des directeurs de la formation.
Module 3 : Machine Learning et Intelligence artificielle132h
Il est possible d'intégrer directement le module 3, sous réserve d'avoir réussi le test d'entrée.
Ce module aborde la notion d’optimisation, clé de voûte du Machine Learning et de l’Intelligence Artificielle, à travers une approche mathématique et appliquée. Vous découvrirez comment entraîner efficacement les modèles prédictifs et améliorer leurs performances. Une introduction à la programmation Python, langage de référence du Deep Learning, vous permettra de mettre en œuvre ces principes.
Le module aborde également les stratégies de déploiement des modèles de Machine Learning pour différents champs applicatifs, ainsi que le cadre réglementaire et éthique de leur utilisation.
- Programmation Python
- Optimisation
- Apprentissage supervisé
- Deep Learning
- Apprentissage non supervisé
- RGPD et RIA
- MLOps
- Mise en pratique en actuariat*
- Mise en pratique en marketing*
- Case studies in finance*
NB : Les étudiant·e·s valident au choix « *Mise en pratique en actuariat » ou « *Mise en pratique en marketing » ou « *Case studies in finance ».
Modalités pédagogiques

Les cours en présentiel et en distanciel sont illustrés par des jeux de données artificielles et réelles avec une mise en œuvre directe sur machine :
- Les intervenants s’assureront que les auditeurs disposent d’ordinateur personnel et des logiciels nécessaires mis à jour
- Les auditeurs auront accès au cluster informatique du CEREMADE pour les cours qui le nécessitent
- Des études de cas feront l’objet de travaux individuels ou collectifs en inter-session
- La diversité des pratiques professionnelles et le développement de la recherche en statistique imposent que les auditeurs assurent un travail d’analyse et de synthèse sur la base d’une bibliographie préparée par les responsables de la formation, ainsi que des recherches documentaires
- Plusieurs projets rythment la formation, afin de s’exercer à l’implémentation et à l’interprétation des techniques rencontrées
Modalités d'évaluation
La validation des acquis se fait tout au long du programme :
- Module 1 : devoirs sur table
- Modules 2 et 3 : travaux pratiques et mise en application sur données réelles, projets individuels et de groupes
Focus sur
Webinaire sur la thématique de la décision algorithmique | Dauphine-PSL
Laurence Lelièvre
06 26 71 77 67
contact.stat-ia@dauphine.psl.eu

