Objectifs

L'objectif de ce cours est de fournir les outils classiques de la statistique mathématique qui permettent d'aborder le choix du modèle probabiliste, son estimation et son évaluation. Nous nous intéresserons tout particulièrement au modèle linéaire et à ses extensions dans le contexte d'apprentissage statistique en grande dimension (LASSO, RIDGE, PCR PLS), au modèle logistique et aux modèles à base d'arbres (CART, RF, Boosting etc.). Le but de ce cours est aussi d'assurer une formation à la manipulation de données et à la mise en oeuvre pratique des modèles étudiés. Pour cela, une partie conséquente du cours est orienté vers la mise en oeuvre des différents modèles à l'aide du logiciel R à travers l'étude d'un grand nombre d'exemples.

Programme

  1. Rappel sur la régression linéaire. Validités et limites de la méthode. Sélection de modèles.
  2. Plans d'expériences : criblage et surface de réponses
  3. Régression logistique
  4. Apprentissage en grande dimension (régression LASSO, Ridge etc, modèles à base d'arbres)
  5. Classification

Activités pratiques

Les trois BE seront consacrés à l'apprentissage des techniques des modèles de régression sur des supports informatiques performants (logiciel R) et à des études de cas.

Développement durable

Objectifs de développement durable

Niveau 1 : Activité contextualisée par rapport aux problématiques de développement durable et de responsabilité sociétale et/ou illustrée par des exemples, exercices, applications.

DD&RS niveau 1

Activité contextualisée par rapport aux problématiques de développement durable et de responsabilité sociétale et/ou illustrée par des exemples, exercices, applications.

BE
12h
 
Cours
16h
 

Responsables

  • Céline HARTWEG-HELBERT
  • Alexandre SAIDI

Langue

Français

Mots-clés

Regression linéaire et logistique. Sélection de modèles. Plans d'expériences. Régression pénalisée L1, L2. Modèles à base d'arbres.