Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

apsem2019 2019/04/06 12:27 apsem2019 2019/08/01 16:34 version actuelle
Ligne 3: Ligne 3:
l’apport croisé et les nouvelles perspectives des technologies du web des données et de la recherche par les données. l’apport croisé et les nouvelles perspectives des technologies du web des données et de la recherche par les données.
-Environnements de travail pour la convergence de l'apprentissage automatique et de l’ingénierie des connaissances. Constitution et utilisation d’éco-systèmes composés d’e-infrastructures et d’environnements de recherche virtuels.+Le fil conducteur de cette action sera le support à l'utilisateur dans le processus de traitement, d'analyse des données ou dans la mise en place de l'apprentissage automatique. 
 + 
 +Nous nous intéresserons particulièrement à l'intégration des technologies du web des données dans les éco-systèmes pour la science ouverte.
Cette action fait suite à l'édition [[http://devlog.cnrs.fr/apsem2018|APSEM 2018]] Cette action fait suite à l'édition [[http://devlog.cnrs.fr/apsem2018|APSEM 2018]]
-MOTS-CLEFS  : e-infrastructures, environnements de recherche virtuel, apprentissage automatique profond, ingénierie des connaissances, web des données, données massives et complexes, science reproductible+MOTS-CLEFS  :  
 +  * Support à l'utilisateur 
 +  * Eco-système pour l'analyse et l'apprentissage automatique profond 
 +  * Recherche par les données 
 +  * Science ouverte et reproductible 
 +  * EVR 
 +  * E-infrastructure
[[pascal.dayre@enseeiht.fr?subject=[APSEM2019]| Contact]] [[pascal.dayre@enseeiht.fr?subject=[APSEM2019]| Contact]]
  * **Lieu: ** - Toulouse à [[http://www.enseeiht.fr| ENSEEIHT]]   * **Lieu: ** - Toulouse à [[http://www.enseeiht.fr| ENSEEIHT]]
-  * **Date: ** - date prévisionnelle du 14-18 octobre (Semaine 42) - 4 jours+  * **Date: ** - du mardi 15 au vendredi 18 octobre (Semaine 42) - 4 jours
  * Nb personne: environ 40   * Nb personne: environ 40
  * Date limite d'inscription : --   * Date limite d'inscription : --
-  * Appel à contribution à venir: +  * [[https://apsem2019.sciencesconf.org| Appel à contribution]]
-L'organisation se fait en collaboration avec l'Inra.+====== Constat ====== 
 + 
 +De plus en plus de données sont disponibles et la recherche par les données connaît un intérêt croissant dans un objectif de valorisation ou de réutilisation des données dans de très nombreux domaines. 
 + 
 +Lors de l'édition [[http://devog.cnrs.fr/Apsem2018| APSEM 2018]], nous avons étudié l'apport croisé et l'intérêt de l'apprentissage automatique et du web des données pour conduire une analyse. 
 + 
 +Conduire une analyse valide nécessite une grande expertise mathématique et informatique. Les experts en science des données sont rares en rapport aux besoins.  
 + 
 +La mise en place d'un environnement opérationnel, facilement accessible et utilisable par le plus grand nombre est également un fort enjeu.
====== Objectifs scientifiques et techniques ====== ====== Objectifs scientifiques et techniques ======
 +
 +Nous étudierons le support à l'utilisateur dans le processus de traitement, d'analyse des données ou dans le processus d'apprentissage automatique:
 +  * Système de gestion, d'aide et/ou de recommandation pour l'élaboration de processus d'analyse
 +  * La mise en oeuvre du système de support dans un processus de recherche et un éco-système technique.
 +
 +Nous étudierons ce que le web des données peut apporter à la construction de ces éco-systèmes.
 +
 +
 +**Il importe de pouvoir:**
 +
 +  * **Faciliter l'accès et le partage des ressources entre utilisateurs (données, codes, calcul, expérimentations, services, configurations,...) (principes FAIR)**
 +  * **Faciliter l'activité des experts.**
 +  * **Rendre possible la conduite d'analyses de données valides par des acteurs moins expérimentés.**
 +  * **Offrir des capacités d'analyse des données au plus grand nombre.**
 +  * **Faciliter la formation des individus et des communautés.**
 +
 +
 +
 +====== Comité d'organisation ======
 +  * CNRS (MITI/DEVLOG)
 +  * INRAE (L'organisation se fait avec le soutien d'Ingenum)
 +  * ENSEEIHT
 +
 +
 +====== Comité de programme ======
 +  * Christophe Baehr - CNRS/CNRM
 +  * Romain David - INRA
 +  * Pascal Dayre - CNRS/IRIT
 +  * Dominique Desbois - INRA
 +  * Etienne Gondet -  CNRS/OMP
 +  * Alban Gaignard - CNRS
 +  * Franck Michel - CNRS
 +  * Christophe Biernacki - INRIA
 + 
 +
 +
 +
 +====== Description ======
 +
 +Environnements de travail pour la convergence de l'apprentissage automatique et de l’ingénierie des connaissances.  Constitution et utilisation d’éco-systèmes composés d’e-infrastructures et d’environnements de recherche virtuels.
-  - panorama des écosystèmes technologiques pour la science des données +  * panorama des écosystèmes technologiques pour la science des données 
-  - outils et méthodes de l'apprentissage ; +  * outils et méthodes de l'apprentissage ; 
-  - outils de structuration sémantique des données, le web sémantique et ingénierie des connaissances; +  * outils de structuration sémantique des données, le web sémantique et ingénierie des connaissances; 
-  - apports croisés +  * apports croisés 
-  - usages et communautés de recherche  +  * usages et communautés de recherche  
-  - architecture des services d’e-infrastructure et fonctionnalités des environnements virtuels de recherche pour les scénarios d’usages des laboratoires.+  * architecture des services d’e-infrastructure et fonctionnalités des environnements virtuels de recherche pour les scénarios d’usages des laboratoires.
    * Cycle de vie de la donnée     * Cycle de vie de la donnée
    * Accès aux calculs et aux référentiels de ressources     * Accès aux calculs et aux référentiels de ressources
    * Traçabilité des calculs et des ressources numériques dans une perspective de science ouverte     * Traçabilité des calculs et des ressources numériques dans une perspective de science ouverte
    * Intégration des technologies de l’intelligence artificielle, de la reconnaissance des formes et de l'ingénierie des connaissances     * Intégration des technologies de l’intelligence artificielle, de la reconnaissance des formes et de l'ingénierie des connaissances
 +
 +====== Programme ======
 +
 +
 +=====J1: Le processus de traitement, d'analyse des données et le processus d'apprentissage automatique=====
 +  * **Objectifs:** expliciter le processus d'analyse des données et  la validation des résultats. Nous nous intéresserons aux recommandations pour mener  correctement une  analyse, de  la préparation des données à la validation voire à l'explicabilité des résultats.
 +  * **Mots clé:** cycle de vie de la données et de leur préparation pour l'analyse, l'apprentissage et l'IA, traçabilité (PROV-O). Formalisation du processus et base de données des traces d'apprentissage
 +  * **Invités:**
 +    * **10H30-11h30** - le Processus d'analyse et la validation des résultats - **Sébastien Déjean** / IMT
 +    * **14h00-15h00** - "Interprétabilité de modèles boites-noires en Apprentissage Machine"  - **Laurent Risser** / [[https://www.math.univ-toulouse.fr/|IMT]] / [[http://aniti.univ-toulouse.fr/|ANITI]]
 +
 +Cette présentation portera sur les problématiques et les solutions récentes liées à l'interprétation des décisions prises par des modèles boites-noires en Apprentissage Machine. Ces problématiques sont d'autant plus critiques en France que le RGPD a rendu obligatoire l'an dernier le fait de pouvoir expliquer ce type de décisions en cas de discrimination potentielle. Au delà des aspects techniques, les aspects sociétaux et légaux liés à cette problématique seront évoqués.
 +
 +
 +
 +=====J2: Support à l'utilisateur=====
 +  * **Objectifs:** nous nous intéresserons à tous les aspects pouvant aider l'utilisateur dans sa démarche de recherche par les données: le format des données pour leur exploitation par des algorithmes d'IA, la maîtrise de son environnement de travail, le suivi de ses travaux, la socialisation des expérimentations dans une communauté par le partage des traces et des bases d'apprentissage voire le parallèle avec les EIAH, le support à l'utilisateur, les systèmes de recommandation et d'aide à la décision, ergonomie.
 +  * **Mots clés:** framework, format de données,  trace, base d'apprentissage, scénario, trace, support à l'utilisateur, systèmes de recommandation
 +  * **Invités:**
 +    * **10h30-11h30** - Les systèmes de recommandation / Aide à la décision - Julien Aligon / IRIT
 +
 +
 +=====J3: Synthèse des environnements d'analyse et de ML et leur intégration dans des ENT / ERV / VRE (Environnement Virtuel de Recherche)=====
 +  * **Objectifs:** nous nous intéresserons ici à la couches d'intermédiation des utilisateurs, aux frameworks d'analyse et d'apprentissage automatique et à leur intégration dans les VRE (Environnement Virtuelle de Recherche).
 +  * **Mots clés:** framework, VRE  (Environnement Virtuelle de Recherche), source de données, service de traitement dans le CLOUD, sémantisation
 +  * **Invités:**
 +    * **11h30-12h30** - la [[https://massiccc.lille.inria.fr/|plateforme web MASSICCC]] pour classifier des données complexes (mixtes, manquantes, fonctionnelles, haute dimension) -  Pr. Christophe Biernacki, math.univ-lille1.fr/~biernack ; responsable  scientifique de l'équipe MODAL (modal.lille.inria.fr).
 +
 +
 +
 +=====J4:  Les éco-systèmes pour la science ouverte=====
 +  * **Objectifs:** les plateformes de big data se développent. Elles sont souvent synonymes de solutions centralisées. Nous nous intéresserons ici aux solutions ouvertes et distribuées.  Nous nous intéresserons aux éco-systèmes pour la science ouverte intégrant des e-infrastructures de données et des services de traitement, des socles et des services de calcul, les couches d'intermédiations que sont les EVR (Environnement Virtuel de Recherche).
 +
 +Nous voyons que nous sommes à la convergence du calcul-données, HPC-cloud.
 +
 +Nous avons d'un côté des centres de calcul et de l'autre des e-infrastructure de données.
 +allons-nous vers une architecture centralisée ou une architecture distribuée, une solution intégrée bornée genre plateforme ou une solution évolutive avec des standards ouverts, des e-infrastructures et des socles de calcul pour le backbone et le "back office" et des VRE pour le "front office" et la couche d'intérmédiation pour l'accès aux différents services de données, de traitement et d'analyse.
 +
 +Nous nous poserons également comme question lors de ces journées la mise en place de ces éco-systèmes, de l'offre des GAFAM tel que Google Earth Engine à des environnements co-construits par des communautés utilisatrices comme celle des sciences de la terre avec Pangeo.
 +
 +Nous nous intéresserons également à l'apport du web sémantique dans ces solutions.
 +
 +  * **Mots clés:** éco-systèmes, communautés, e-infrastructures, services de données, services de calcul,  communauté, big data, IA, CLOUD, EOSC.
 +  * **Invités:**
 +    * **09h00-10h00** - Portage de Pangeo sur un centre de calcul (Ifremer) - Guillaume Eynard-Bontemps / CNES (https://pangeo.io/, A community platform for Big Data, CLOUD,geoscience)
 +    * 10h30-11h30 Mise en place d'un service de calcul - REX du GT calcul Inria - - Pr. Christophe Biernacki, math.univ-lille1.fr/~biernack ; Délégué scientifique du Centre Inria de Lille (inria.fr/en/centre/lille)
 
apsem2019.1554546475.txt.gz · Dernière modification: 2019/04/06 12:27 par pascal.Dayre@enseeiht.fr
 
Recent changes RSS feed Powered by PHP Powered by Pxxo Driven by DokuWiki