Apprentissage en grande dimension (HDL)

Description

Ce module présente les fondations mathématiques de l'apprentissage statistique moderne en décrivant les bases théoriques et les outils conceptuels nécessaires pour analyser et justifier les algorithmes. L'accent est mis sur les problématiques liée à la grande dimension et aux grands volumes de données, et aux techniques de réduction de dimension qui permettent de les aborder.

Mots-clés

PAC (probably approximately correct), VC-dimension (Vapnik and Chervonenkis), complexité de Rademacher, SVM (support vector machines), regression, méthode à noyaux, deep learning

Contenu

  • Le cadre PAC (probably approximately correct) pour l'apprentissage statistique
  • Mesurer la complexité d'un problème d'apprentissage
  • Notion de stabilité algorithmique
  • Réduction de dimension
  • Parcimonie et optimisation convexe pour l'apprentissage

Compétences acquises

  • Comprendre les liens entre complexité et sur-apprentissage
  • Connaître les outils de mesure de complexité en apprentissage
  • Comprendre les enjeux statistiques et algorithmiques liés à la grande dimension en apprentissage
  • Comprendre les outils de réduction de dimension pour l'apprentissage

Enseignants

Rémi Gribonval (responsable), Aline Roumy