Formation Continue

Langages, Modèles et Systèmes & Applications3,5 jours

  • Introduction à l’analyse de grandes masses de données
  • Architectures avec parallélisme massif
  • L’écosystème Hadoop et MapReduce
  • Architectures et langages NoSQL
  • Intégrer HADOOP dans un Système d’Information d’Entreprise
  • Stockage des données (Base de données classiques et base de données Nosql)

Machine Learning & Data Mining3 jours

  • Introduction à l’apprentissage automatique
  • Apprentissage supervisé (modèles prédictifs) : Régression, arbres de décision, bagging, SVM, réseaux de neurones
  • Apprentissage non-supervisé (modèles explicatifs/exploratoires) : Changement de représentation/ Réduction de dimensionnaté, analyse par composantes principales, décomposition en valeurs singulières, clustering
  • Sessions pratiques sous Python avec les librairies ScikitLearn et PyTorch (deep learning)

Graph Databases1,5 jours

  • Bases de données graphes : modélisation des données en graphe, architecture, Neo4j
  • Langages de requête pour les graphes (Cypher)
  • Frameworks pour l’analyse des graphes ( Pregel, GraphX)

Projet1 jour

Les participants auront l’occasion de mettre en oeuvre les connaissances acquises dans les modules du certificat dans le cadre d’un projet pratique.

Modalités pédagogiques

Responsable de la formation & intervenants

Khalid Belhajjame

Maître de conférences en informatique et membre du LAMSADE, Université Paris Dauphine-PSL

Spécialiste en pay-as-you data integration, e-Science, scientific workflow management, provenance tracking & exploitation et semantic web services.

Jamal Atif

Professeur d'Universités d'informatique à l'Université Paris Dauphine-PSL et Chargé de mission intelligence artificielle et infrastructures numériques au CNRS

Spécialiste en Knowledge representation, Machine learning et brain mapping.

Photo de Dario Colazzo intervenant en formation continue (Dauphine Executive Education, Université Paris Dauphine-PSL)

Dario Colazzo

Professeur à l’Université Paris Dauphine-PSL au sein du LAMSADE, ainsi que Professeur chargé de cours à l’École Polytechnique au sein du CMAP

Il est responsable du Pôle Data Science du LAMSADE depuis octobre 2015. Depuis janvier 2018 il est co-directeur du département MIDO à Dauphine, et responsable pour l’Informatique. Ses recherches et ses intérêts se situent à l’intersection des bases de données et des langages de programmation, avec un focus récent sur des aspects de traitement sûr et efficace pour les données massives et semi- structurées - Big Data.

Daniela Grigori

Professeure des universités en informatique, Directrice du LAMSADE (Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision) Université Paris Dauphine-PSL

Spécialiste en Business Process management, workflow technology, web services, SOA et data mining.

Focus sur

Webinar sur la thématique de la décision algorithmique | Dauphine-PSL