Ceci est une ancienne révision du document !


Atelier T8.A05

Porteurs :

Alexandre Boucaud (CNRS, APC) & Laurent Risser (CNRS, ANITI/3IA & IMT)

Titre :

Python pour la préparation des données et l'apprentissage automatique avec pandas et scikit-learn.

Prérequis :

Maîtrise de la programmation scientifique sous Python

Une connaissance des fondamentaux du machine learning est appréciable.

Objectifs :

Etude complète d'un jeu de données hétérogène et mise en place d'une chaîne de traitement par apprentissage supervisé. Vous apprendrez notamment à utiliser de manière efficace les librairies `pandas` et `scikit-learn`.

Notions abordées :

  • Exploration et visualisation des données avec la librairie `pandas`.
  • Pré-traitement des données en fonction de leur type.
  • Mise en place d'une chaîne de traitement pour faire de l'apprentissage supervisé sur les données, combinant le pré-traitement des données et l'entrainement des modèles prédictifs.
  • Evaluation des modèles par cross-validation.
  • Optimisation des paramètres des modèles (hyperparamètres) vis-à-vis des performances.

_Mots clés :_

machine learning, apprentissage automatique, frameworks, pandas, scikit-learn, python, jupiter.

 
jdev2020/t8.a05.1595587827.txt.gz · Dernière modification: 2020/07/24 12:50 par etienne.gondet@get.obs-mip.fr
 
Recent changes RSS feed Powered by PHP Powered by Pxxo Driven by DokuWiki