Dans de nombreux domaines scientifiques, tels que la biologie ou les sciences de l'environnement, l'évolution rapide des instruments scientifiques, ainsi que le recours intensif à la simulation informatique, ont conduit à une production importante de données ces dernières années. Les applications scientifiques sont aujourd'hui confrontées à de nouveaux problèmes liés au stockage et à l'exploitation de ces grands volumes de données. La problématique est sensiblement la même dans le cadre de la gestion des données collectées par les réseaux sociaux, avec cette fois-ci des objectifs d'optimisation commerciale.
L’enseignement proposé permettra de découvrir 3 grandes technologies emblématiques du traitement des big-data (MongoDB, Hadoop et Spark), qui sont largement utilisées par les entreprises ou les institutions qui ont à gérer de telles volumes de données.