Objectifs

Dans de nombreux domaines scientifiques, tels que la biologie ou les sciences de l'environnement, l'évolution rapide des instruments scientifiques, ainsi que le recours intensif à la simulation informatique, ont conduit à une production importante de données ces dernières années. Les applications scientifiques sont aujourd'hui confrontées à de nouveaux problèmes liés au stockage et à l'exploitation de ces grands volumes de données. La problématique est sensiblement la même dans le cadre de la gestion des données collectées par les réseaux sociaux, avec cette fois-ci des objectifs d'optimisation commerciale.

L’enseignement proposé permettra de découvrir 3 grandes technologies emblématiques du traitement des big-data (MongoDB, Hadoop et Spark), qui sont largement utilisées par les entreprises ou les institutions qui ont à gérer de telles volumes de données.

Programme

  • 3 séances de cours de 2h portant sur MongoDB, Hadoop et Spark.
  • 4 séances de TP sur MongoDB, Hadoop et Spark.
BE
14h
 
Cours
6h
 

Responsables

  • Alexandre SAIDI
  • Daniel MULLER
  • Mohsen ARDABILIAN
  • Stéphane DERRODE

Langue

Français

Mots-clés

Big Data, NoSQL, MongoDB, Hadoop, Spark, python