L'objectif de ce cours est de fournir les outils classiques de la statistique mathématique qui permettent d'aborder le choix du modèle probabiliste, son estimation et son évaluation. Nous nous intéresserons tout particulièrement au modèle linéaire et à ses extensions dans le contexte d'apprentissage statistique en grande dimension (LASSO, RIDGE, PCR PLS), au modèle logistique et aux modèles à base d'arbres (CART, RF, Boosting etc.). Le but de ce cours est aussi d'assurer une formation à la manipulation de données et à la mise en oeuvre pratique des modèles étudiés. Pour cela, une partie conséquente du cours est orienté vers la mise en oeuvre des différents modèles à l'aide du logiciel R à travers l'étude d'un grand nombre d'exemples.
Les trois BE seront consacrés à l'apprentissage des techniques des modèles de régression sur des supports informatiques performants (logiciel R) et à des études de cas.
Activité contextualisée par rapport aux problématiques de développement durable et de responsabilité sociétale et/ou illustrée par des exemples, exercices, applications.