Dans de nombreux domaines scientifiques, tels que la biologie ou les sciences de l'environnement, l'évolution rapide des instruments scientifiques ainsi que le recours intensif à la simulation informatique ont conduit, ces dernières années, à une production importante de données. Les applications scientifiques sont confrontées à de nouveaux problèmes liés essentiellement au stockage et à l'exploitation de ces données. L’enseignement proposé permettra de découvrir les grandes problématiques soulevées par l’émergence de ces flots de données (stockage, interrogation, analyse et visualisation), et d’aborder certaines solutions technologiques actuellement proposées. Les questionnements d’ordre éthique et juridique que soulèvent la collecte et l’exploitation de ces données seront également examinés.
• Big Data : une introduction aux enjeux, perspectives et applications • Problématique des grandes bases de données (NoSql, NewSql) • Big Data et modèle économique : le cas de l’intermédiation • Open Data : données publiques ouvertes • Big-Data Analytics : les bases de l’analyse de grands volumes de données • Représentation et visualisation des données • Trois BEs sur la visualisation, sur Apache/Hadoop et sur le web des données (SparQL).
Activité contextualisée par rapport aux problématiques de développement durable et de responsabilité sociétale et/ou illustrée par des exemples, exercices, applications.