Formation Continue

Programme | Certificat Data Science

Langages, Modèles et Systèmes & Applications24h

Introduction à l’analyse de grandes masses de données
Architectures avec parallélisme massif
L’écosystème Hadoop et MapReduce
Architectures et langages NoSQL
Intégrer HADOOP dans un Système d’Information d’Entreprise
Stockage des données (base de données classiques et base de données Nosql)

Machine Learning & Data Mining21h

Introduction à l’apprentissage automatique
Apprentissage supervisé (modèles prédictifs) : régression, arbres de décision, bagging, SVM, réseaux de neurones
Apprentissage non-supervisé (modèles explicatifs/exploratoires) : changement de représentation, réduction de dimensionnalité, analyse par composantes principales, décomposition en valeurs singulières, clustering
Sessions pratiques sous Python avec les librairies ScikitLearn et PyTorch (Deep Learning)

Graph Data Analytics12h

Bases de données graphes : modélisation des données en graphe, architecture, Neo
Langages de requête pour les graphes (Cypher)
Frameworks pour l’analyse des graphes (Pregel, GraphFrames)

Projet6h

Les participants auront l’occasion de mettre en oeuvre les connaissances acquises dans les modules du certificat dans le cadre d’un projet pratique.

Modalités pédagogiques

Picto rouge sur fond blanc symbolisant l'Université Paris Dauphine PSL et Dauphine Executive Education (formation continue)

Des infrastructures matérielles adaptées à la pratique de la data science

Afin d'assurer le bon déroulement des travaux pratiques et l'application des techniques abordées pendant le certificat sur des jeux de données de grande taille, les participants ont accès à un cluster composé de 10 serveurs, dont la capacité de mémoire vive atteint 40 GO de RAM par serveur et la capacité de stockage secondaire totale du cluster atteint 10 TO.

Un apprentissage en effectif réduit

Le Certificat Data Science accepte un maximum de 15 participants par promotion afin de garantir une meilleure compréhension et un suivi individuel rapproché de chaque participant tout au long de la formation.

Langue d'enseignement

La formation est dispensée en français (des supports en anglais pourront être utilisés).

Contrôle des connaissances

La validation des acquis des enseignements et la délivrance du certificat Data Science est conditionnelle à plusieurs types d’épreuves :

Un QCM (avec des questions libres) pour chacune des 3 matières au programme, permettant de valider l’acquisition des connaissances vues tout au long de la formation.
La construction et la soutenance d’un projet.

Planning prévisionnel 2026

Jeudi 4 juin : 18h00 à 21h00 - Ouverture
Jeudi 11 juin : 18h00 à 21h00
Jeudi 18 juin : 9h30 à 16h30
Mardi 23 juin : 18h00 à 21h00
Jeudi 25 juin : 18h00 à 21h00
Mardi 30 juin : 18h00 à 21h00
Jeudi 2 juillet : 18h00 à 21h00
Mardi 7 juillet : 18h00 à 21h00
Jeudi 9 juillet : 18h00 à 21h00
Vacances d'été
Jeudi 3 septembre : 18h00 à 21h00
Mardi 8 septembre : 18h00 à 21h00
Jeudi 10 septembre : 18h00 à 21h00
Jeudi 17 septembre : 9h30 à 16h30
Mardi 22 septembre : 18h00 à 21h00
Jeudi 24 septembre : 18h00 à 21h00
Mardi 29 septembre : 18h00 à 21h00
Jeudi 1er octobre : 18h00 à 21h00
Mardi 13 octobre : 18h00 à 20h00 - Examen sur table
Jeudi 15 octobre : 17h00 à 21h00 - Soutenances des projets

Responsable de la formation & intervenant·es

La formation est assurée par des conférenciers et des professeurs de classe internationale qui participent à différents enseignements au sein d'établissements de PSL (Université Paris Dauphine-PSL et ENS), de l'Ecole Centrale et de l'Ecole Polytechnique.

Khalid Belhajjame

Maître de conférences en informatique et membre du LAMSADE, Université Paris Dauphine-PSL

Khalid Belhajjame est spécialiste en pay-as-you data integration, e-Science, scientific workflow management, provenance tracking & exploitation et semantic web services.

Théo Lopès-Quintas

Manager Leader Data Fraude au sein du groupe BPCE et enseignant vacataire à l'Université Paris Dauphine - PSL

Théo Lopès-Quintas est responsable de l'équipe Produit Data Fraude au sein de la direction Opérations & Lutte Contre La Fraude (LCLF) aux moyens de paiement du groupe BPCE.
Auparavant, il a été data-scientist pour la LCLF aux moyens de paiement pendant quatre ans.
Théo enseigne à l'Université Paris Dauphine - PSL dans diverses formations depuis plus de quatre années sur divers sujets : Machine Learning, Deep Learning, recherche contemporaine et intelligence artificielle générative.

Dario Colazzo sur LinkedIn

Dario Colazzo

Professeur d'informatique et membre du LAMSADE, Université Paris Dauphine - PSL

Professeur en informatique au sein du LAMSADE, Dario Colazzo est spécialisé dans les domaines de l’algorithmique et de l'optimisation des traitements de données massives.
Il a créé et dirigé le pôle Data Science du LAMSADE pendant 4 ans.
Depuis 2019, il dirige l’Executive Master Intelligence artificielle et science des données de Dauphine Executive Education.

Daniela Grigori

Professeure des universités en informatique, Université Paris Dauphine - PSL

Daniela Grigori est spécialiste en business process Management, workflow technology, web services, SOA et data mining.
Elle est par ailleurs directrice du LAMSADE (Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision) de l'Université Paris Dauphine - PSL.

Contact

Florence Biéret
06 12 65 16 62
contact.data-science@dauphine.psl.eu

Retrouvez-nous aussi sur les réseaux sociaux

* Data science : science des données

Nous contacter

Florence Biéret
06 12 65 16 62
contact.data-science@dauphine.psl.eu