Formation Continue

Langages, Modèles et Systèmes & Applications3,5 jours

  • Introduction à l’analyse de grandes masses de données
  • Architectures avec parallélisme massif
  • L’écosystème Hadoop et MapReduce
  • Architectures et langages NoSQL
  • Intégrer HADOOP dans un Système d’Information d’Entreprise
  • Stockage des données (Base de données classiques et base de données Nosql)

Machine Learning & Data Mining3 jours

  • Introduction à l’apprentissage automatique
  • Apprentissage supervisé (modèles prédictifs) : Régression, arbres de décision, bagging, SVM, réseaux de neurones
  • Apprentissage non-supervisé (modèles explicatifs/exploratoires) : Changement de représentation/ Réduction de dimensionnaté, analyse par composantes principales, décomposition en valeurs singulières, clustering
  • Sessions pratiques sous Python avec les librairies ScikitLearn et PyTorch (deep learning)

Graph Databases1,5 jours

  • Bases de données graphes : modélisation des données en graphe, architecture, Neo4j
  • Langages de requête pour les graphes (Cypher)
  • Frameworks pour l’analyse des graphes ( Pregel, GraphX)

Projet1 jour

Les participants auront l’occasion de mettre en oeuvre les connaissances acquises dans les modules du certificat dans le cadre d’un projet pratique.

Modalités pédagogiques

Responsable de la formation & intervenants

Khalid Belhajjame

Maître de conférences en informatique et membre du LAMSADE, Université Paris Dauphine-PSL

Spécialiste en pay-as-you data integration, e-Science, scientific workflow management, provenance tracking & exploitation et semantic web services.

Jamal Atif

Professeur des Universités en informatique - Université Paris Dauphine-PSL

Chercheur en Machine learning. Professeur des Universités à l'Université Paris Dauphine-PSL, Chargé de mission IA au CNRS, directeur scientifique adjoint de l'institut PRAIRIE.

Dario Colazzo

Professeur à l’Université Paris Dauphine-PSL au sein du LAMSADE, ainsi que Professeur chargé de cours à l’École Polytechnique au sein du CMAP

Il est responsable du Pôle Data Science du LAMSADE depuis octobre 2015. Depuis janvier 2018 il est co-directeur du département MIDO à Dauphine, et responsable pour l’Informatique. Ses recherches et ses intérêts se situent à l’intersection des bases de données et des langages de programmation, avec un focus récent sur des aspects de traitement sûr et efficace pour les données massives et semi- structurées - Big Data.

Daniela Grigori

Professeure des universités en informatique, Directrice du LAMSADE (Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision) Université Paris Dauphine-PSL

Spécialiste en Business Process management, workflow technology, web services, SOA et data mining.

Focus sur

Webinar sur la thématique de la décision algorithmique | Dauphine-PSL