Technologies informatiques du Big Data

Objectifs

Dans de nombreux domaines scientifiques, tels que la biologie ou les sciences de l'environnement, l'évolution rapide des instruments scientifiques, ainsi que le recours intensif à la simulation informatique, ont conduit à une production importante de données ces dernières années. Les applications scientifiques sont aujourd'hui confrontées à de nouveaux problèmes liés au stockage et à l'exploitation de ces grands volumes de données. La problématique est sensiblement la même dans le cadre de la gestion des données collectées par les réseaux sociaux, avec cette fois-ci des objectifs d'optimisation commerciale.

L’enseignement proposé permettra de découvrir 3 grandes technologies emblématiques du traitement des big-data (MongoDB, Hadoop et Spark), qui sont largement utilisées par les entreprises ou les institutions qui ont à gérer de telles volumes de données.

Programme

3 séances de cours de 2h portant sur MongoDB, Hadoop et Spark.
4 séances de TP sur MongoDB, Hadoop et Spark.

14h

Cours

Code

24_I_G_S09_MSO_INFO_3_1

Responsables

Alexandre SAIDI
Daniel MULLER
Mohsen ARDABILIAN
Stéphane DERRODE

Langue

Français

Mots-clés

Big Data, NoSQL, MongoDB, Hadoop, Spark, python

Offre de formation