Objectifs

Dans de nombreux domaines scientifiques, tels que la biologie ou les sciences de l'environnement, l'évolution rapide des instruments scientifiques ainsi que le recours intensif à la simulation informatique ont conduit, ces dernières années, à une production importante de données. Les applications scientifiques sont confrontées à de nouveaux problèmes liés essentiellement au stockage et à l'exploitation de ces données. L’enseignement proposé permettra de découvrir les grandes problématiques soulevées par l’émergence de ces flots de données (stockage, interrogation, analyse et visualisation), et d’aborder certaines solutions technologiques actuellement proposées. Les questionnements d’ordre éthique et juridique que soulèvent la collecte et l’exploitation de ces données seront également examinés.

Programme

• Big Data : une introduction aux enjeux, perspectives et applications • Problématique des grandes bases de données (NoSql, NewSql) • Big Data et modèle économique : le cas de l’intermédiation • Open Data : données publiques ouvertes • Big-Data Analytics : les bases de l’analyse de grands volumes de données • Représentation et visualisation des données • Trois BEs sur la visualisation, sur Apache/Hadoop et sur le web des données (SparQL).

Développement durable

Niveau 1 : Activité contextualisée par rapport aux problématiques de développement durable et de responsabilité sociétale et/ou illustrée par des exemples, exercices, applications.

DD&RS niveau 1

Activité contextualisée par rapport aux problématiques de développement durable et de responsabilité sociétale et/ou illustrée par des exemples, exercices, applications.

BE
12h
 
Cours
16h
 

Code

22_I_G_S09_MOD_02_1

Responsables

  • Stéphane DERRODE
  • Alexandre SAIDI
  • Céline HARTWEG-HELBERT

Langue

Français

Mots-clés

Big Data, Data scientist, NoSQL, Hadoop, Big Data analytics, Open Data, Web des données