Objectifs

Dans le domaine de la classification de données, on se focalise sur la famille des méthodes bayésiennes, qui se distingue par son optimalité au sens de certains critères, par son coût réduit d’un point de vue algorithmique et par l’interprétabilité de ses résultats. Nous étudierons aussi les solutions qui s’offrent au Data Scientist lorsque l’échantillon d’apprentissage est peu important au regard du nombre de paramètres à apprendre, ou lorsque l’apprentissage doit se faire de manière non supervisée. En termes d’application, nous mettrons l’accent sur l'exploration d'un corpus textuel pour découvrir par exemple de nouveaux clients éligibles à la vente d'un service/produit, de prévoir les sentiments (avis) des clients ou comprendre les comportements qui prédisent une fraude.

Programme

  • Décision bayésienne (2h)
  • Modèle de mélange gaussien (2h)
  • Chaîne de Markov cachée (2h)
  • BE sur l’apprentissage bayésien (4h)
  • Technologies et méthodes de traitement de langues naturelles et fouille de texte (8h)
  • Restitution d’une lecture scientifique par groupe (4h)
BE
8h
 
Cours
12h
 

Responsables

  • Alexandre SAIDI
  • Stéphane DERRODE

Langue

Français

Mots-clés

Théorie de la décision bayésienne, Apprentissage non supervisé, Modèles de Markov cachés, Fouille de textes, Analyse de sentiments, Chatbot, Traitement de Langues Naturelle.