Formation Continue

Programme | Certificat Data Science

Langages, Modèles et Systèmes & Applications22h

  • Introduction à l’analyse de grandes masses de données
  • Architectures avec parallélisme massif
  • L’écosystème Hadoop et MapReduce
  • Architectures et langages NoSQL
  • Intégrer HADOOP dans un Système d’Information d’Entreprise
  • Stockage des données (base de données classiques et base de données Nosql)

Machine Learning & Data Mining22h

  • Introduction à l’apprentissage automatique
  • Apprentissage supervisé (modèles prédictifs) : régression, arbres de décision, bagging, SVM, réseaux de neurones
  • Apprentissage non-supervisé (modèles explicatifs/exploratoires) : changement de représentation, réduction de dimensionnalité, analyse par composantes principales, décomposition en valeurs singulières, clustering
  • Sessions pratiques sous Python avec les librairies ScikitLearn et PyTorch (Deep Learning)

Graph Data Analytics13h

  • Bases de données graphes : modélisation des données en graphe, architecture, Neo
  • Langages de requête pour les graphes (Cypher)
  • Frameworks pour l’analyse des graphes (Pregel, GraphX)

Projet6h

Les participants auront l’occasion de mettre en oeuvre les connaissances acquises dans les modules du certificat dans le cadre d’un projet pratique.

Modalités pédagogiques

Contrôle des connaissances

La validation des acquis des enseignements et la délivrance du certificat Data Science est conditionnelle à plusieurs types d’épreuves :

  • Un QCM (avec des questions libres) pour chacune des 3 matières au programme, permettant de valider l’acquisition des connaissances vues tout au long de la formation.
  • La construction et la soutenance d’un projet.

Planning prévisionnel


Responsable de la formation & intervenants

Khalid Belhajjame

Maître de conférences en informatique et membre du LAMSADE, Université Paris Dauphine-PSL

Khalid Belhajjame est spécialiste en pay-as-you data integration, e-Science, scientific workflow management, provenance tracking & exploitation et semantic web services.

Jamal Atif

Professeur des Universités en informatique, Université Paris Dauphine-PSL

Jamal Atif est chercheur en Machine learning. Il est chargé de mission IA au CNRS et directeur scientifique adjoint de l'institut PRAIRIE.

Dario Colazzo

Professeur et membre du LAMSADE, Université Paris Dauphine-PSL

Professeur en informatique au sein du LAMSADE, Dario Colazzo est spécialisé dans les domaines de l’algorithmique et de l'optimisation des traitements de données massives.
Il a créé et dirigé le pôle Data Science du LAMSADE pendant 4 ans.
Depuis 2019, il dirige l’Executive Master Intelligence artificielle et science des données de Dauphine Executive Education.

Daniela Grigori

Professeure des universités en informatique, Université Paris Dauphine-PSL

Daniela Grigori est spécialiste en business process Management, workflow technology, web services, SOA et data mining.
Elle est par ailleurs directrice du LAMSADE (Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision) de Dauphine-PSL.

Nous contacter


Florence Biéret  
06 12 65 16 62
contact.data-science@dauphine.psl.eu