Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

apsem2018 2018/10/11 15:08 apsem2018 2018/11/20 15:40 version actuelle
Ligne 4: Ligne 4:
-  * **Lieu: ** - Toulouse+  * **Lieu: ** - Toulouse à [[http://www.enseeiht.fr| ENSEEIHT]]
  * **Date: ** - du 12-15 novembre (Semaine 46) - 4 jours   * **Date: ** - du 12-15 novembre (Semaine 46) - 4 jours
  * Nb personne: 30-40   * Nb personne: 30-40
Ligne 54: Ligne 54:
  * [[http://www.cote-azur.cnrs.fr/Formation-permanente/;view|La formation permanente de la DR20]]   * [[http://www.cote-azur.cnrs.fr/Formation-permanente/;view|La formation permanente de la DR20]]
  * en collaboration avec l'Inra avec le soutien financier [[https://www.ingenum.inra.fr/|d'Ingenum]] pour la prise en charge des frais d'inscription pour les agents Inra.   * en collaboration avec l'Inra avec le soutien financier [[https://www.ingenum.inra.fr/|d'Ingenum]] pour la prise en charge des frais d'inscription pour les agents Inra.
-  * Pascal Dayre +  * Pascal Dayre / CNRS 
-  * [[http://www6.versailles-grignon.inra.fr/economie_publique/PagesPerso2/Dominique-Desbois|Dominique Desbois]] +  * [[http://www6.versailles-grignon.inra.fr/economie_publique/PagesPerso2/Dominique-Desbois|Dominique Desbois]] / INRA-AgroParisTech
  * [[http://www.enseeiht.fr|Les services de l'ENSEEIHT]]   * [[http://www.enseeiht.fr|Les services de l'ENSEEIHT]]
Ligne 78: Ligne 78:
=====Jour1===== =====Jour1=====
-  * **09h30-10h00 :** - Accueil +  * **09h20-10h00 :** - Accueil 
-  * **10h00-10h15 :** - Présentation et objectif de l'action - Quels apports croisés de l'apprentissage et du web sémantique? - **Pascal Dayre / CNRS/IRIT ** +  * **10h00-10h15 :** - Présentation et objectif de l'action - Quels apports croisés de l'apprentissage et du web sémantique? - **Pascal Dayre / CNRS/IRIT ** {{:apsem2018_presentationouverture04dayre.pdf|pdf}} 
-  * **10h15-10h45 :** - Recherche par les données : des données aux représentations des connaissances exploration, préparation des données d'apprentissage pour éviter les biais (données manquantes, classes sureprésentées, bonne distribution, données erronnées), mise en forme et structuration des données - **Sébastien Déjean / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]**+  * **10h15-10h45 :** - Recherche par les données : des données aux représentations des connaissances exploration, préparation des données d'apprentissage pour éviter les biais (données manquantes, classes sureprésentées, bonne distribution, données erronnées), mise en forme et structuration des données - **Sébastien Déjean / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]** {{:donnees_sdejean_apsem_nov_2018.pdf|pdf}}
  * **10h45-11h15 :** - Pause   * **10h45-11h15 :** - Pause
-  * **11h15-12h15 :** Synthèse de la science des données et de l'apprentissage automatique. Les points de vue maths/info de l'ingénieur - **Laurent Risser / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]**+  * **11h15-12h15 :** Synthèse de la science des données et de l'apprentissage automatique. Les points de vue maths/info de l'ingénieur - **Laurent Risser / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]** {{:apsem2018_machinelearning_laurentrisser.pdf|pdf}}
    * Exemple introductif qui pose le vocabulaire (observation/variable/label/apprentissage supervisé ou non).     * Exemple introductif qui pose le vocabulaire (observation/variable/label/apprentissage supervisé ou non).
    * Evolution des tendances en science des données (de la statistique classique à l'apprentissage machine).     * Evolution des tendances en science des données (de la statistique classique à l'apprentissage machine).
Ligne 93: Ligne 93:
  * **12h15-13h30 :** - Pause repas   * **12h15-13h30 :** - Pause repas
  * **13h30-14h30 :** - Synthèse de la science des données et de l'apprentissage automatique. Les points de vue maths/info de l'ingénieur - **Laurent Risser / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]** (suite)   * **13h30-14h30 :** - Synthèse de la science des données et de l'apprentissage automatique. Les points de vue maths/info de l'ingénieur - **Laurent Risser / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]** (suite)
-  * **14h30-15h15 :** - Un point sur l'explicabilité et l'interprétabilité en machine learning - **Mathieu Serrurier / IRIT**+  * **14h30-15h15 :** - Un point sur l'explicabilité et l'interprétabilité en machine learning - **Mathieu Serrurier / IRIT** {{:apsem2018_explicabiliteml_serrurier_xai.pdf|pdf}}
  * **15h15-15h45 :** - Pause café   * **15h15-15h45 :** - Pause café
-  * **15h45-16h15 :** - Apport des graphes pour structurer les données et pour l'apprentissage -  +  * **15h45-16h30 :** - Comment faire émerger un graphe du décodage de vos données. Mise en oeuvre pour l'analyse de la structure du discours dans les tchats. Méthode, approches classiques et extraction automatique de représentation avec le deep learning. - **Stergos Afantenos / IRIT** {{:apsem2018_structurepredictions_stergosafantenos.pdf|pdf}} 
-  * **16h15-17h00 :** - Méthodes supervisée par les graphes. PB du tagage des données d'apprentissage -  +  * **16h30-17h15 :** - Apprentissage et représentation jointe dans une base connaissance pour la désambiguation d'entités. Application à une collection de texte. - **Jose Moreno / IRIT** {{:apsem2018_apprentissagereprésentationtextuelle_morenoslides.pdf|pdf}} 
-  * **19h30-21h30 :** - Evénement social dinatoîre+  * **20h00-22h00 :** - Evénement social dinatoîre
Ligne 119: Ligne 119:
===== Planning ===== ===== Planning =====
-  * **09h00-10h00** : Introduction à l'Ingénierie des Connaissances, ses usages, ses intérêts : web des données, données liées, ontologies, aperçu des standards du web sémantique (RDF/RDFS/OWL/SPARQL). Liage d'instances, alignement d'ontologies. **Franck Michel**.+  * **09h00-10h00** : Introduction à l'Ingénierie des Connaissances, ses usages, ses intérêts : web des données, données liées, ontologies, aperçu des standards du web sémantique (RDF/RDFS/OWL/SPARQL). **Franck Michel** / [[http://www.cnrs.fr | CNRS]]. {{:apsem2018.j2_session-1_franck-michel_intro-sw.pdf|pdf}}
-  * **10h00-10h45** : Décrire ses données par l'utilisation/extension de vocabulaires génériques, créer des ontologies de domaine. **Nathalie Hernandez**. +  * **10h00-10h45** : Réutiliser/créer des vocabulaires contrôlés, des ontologies de domaine: LOV, BioPortal... **Nathalie Hernandez, Alban Gaignard**. {{:apsem2018_lesvocabulariesnathaliehernandez_albangaignard.pdf|pdf}}
  * **10h45-11h15 :** Pause café   * **10h45-11h15 :** Pause café
-  * **11h15-11h35** : Les vocabulaires pour décrire les jeux de données et les catalogues (VOID, HCLS, DCAT, schema.org), les outils pour les publier (data.gouv.fr, portails CKAN...) . **Franck Michel**.+  * **11h15-11h40** : Comment annoter sémantiquement des données existantes (Web Annotation, CSV on the Web, JSON-LD...). **Nathalie Hernandez**. {{:apsem2018_commentdecrirenathaliehernandez.pdf|pdf}}
-  * **11h35-12h00** : Comment annoter sémantiquement des données existantes. **Nathalie Hernandez**. +  * **11h40-12h00** : Décrire et Publier des jeux de données sur le web: vocabulaires, catalogues et portails. **Franck Michel**. {{:apsem2018_jour2_session-4_franck-michel_vocabs-datasets-catalogues.pdf|pdf}}.
-  * **12h00-12h30** : Vocabulaire liés aux statistiques, formaliser les activités d'analyse. **Franck Cotton, INSEE**.+  * **12h00-12h30** : Vocabulaires liés aux statistiques : description de la structure des données - **Franck Cotton, INSEE**. {{:apsem2018_sessions-5-et-7_métadonnées-statistiques_frankcotton.pdf|pdf}}
  * **12h30-14h00** : Déjeuner   * **12h30-14h00** : Déjeuner
-  * **14h00-14h45** : - Exploration et visualisation des données (définition du jeu de données/mise en oeuvre du web sémantique) - **Franck Cotton / INSEE** (ESAN - statistiques des entreprises européennes - cas avec des entreprises de l'agroalimentaire )+  * **14h00-14h30** : La mise en oeuvre du machine learning à partir d'un problème, de son modèle et du jeu de données. Quel choix de workflow pour quel explicabilité des paramètres de l'apprentissage - **Gabriel Ferrettini** / [[http://www.irit.fr | IRIT]] {{:apsem2018_système-de-recommandation-pour-l-aide-à-l-élaboration-de-processus-d-analyse_ferrettini.pdf|pdf}}
-  * **14h45-15h30** : Description sémantique d'un service de traitement/analyse/apprentissage et comment composer les services ? (SOA sémantique). \\ Traçabilité/provenance des données avec [[https://www.w3.org/TR/prov-o/|PROV-O]], [[http://schema.org/docs/actions.html|actions schema.org]]. **Alban Gaignard**.+  * **14h30-15h15** : Vocabulaires liés aux statistiques : documentation des jeux de données - **Franck Cotton / INSEE** {{:apsem2018_sessions-5-et-7_métadonnées-statistiques_frankcotton.pdf|pdf}}
-  * **15h30-16h30** : Pause café+  * **15h15-15h45** : Pause café
-  * **16h30-17h00** : Les langages de description de workflow pour formaliser sa chaîne de traitement -  La base des expériences passées, des worflows de traitement (open Workflow) / vers une proposition de sémantisation (Google group ML schema -Pays-Bas- (Comment et pourquoi?) - **GF et WR / IRIT à confirmer ou APPEL à contribution** +  * **15h45-16h30** : Workflows scientifiques, provenance, et données liées du web pour la reproductibilité en sciences dirigées par les données. **Alban Gaignard**.{{:apsem2018-gaignard-provenance.pdf|pdf}}
- +
-  * **17h00-17h30** : Table ronde “Comment spécifier et comment utiliser des infrastructures de recherche et les ENTC? Quel apport du web des données ?” ou comment les e-infrasructures se saisissent de la problématique de l'ouverture des données, de l'apprentissage, de l'IA (Invités IFB, huma-num, FLI, ...).+
 +  * **16h30-17h00** : Table ronde “Quel apport du web des données pour l'usage des données dans un processus d'apprentissage?"
 +//Quel apport du web des données pour la préparation, la structuration et l'usage des données dans un processus d'apprentissage?  Quels intérêts pour les infrastructures de recherche et les ENTC? ou comment les e-infrastructures se saisissent de la problématique de l'ouverture des données, de l'apprentissage et de l'IA.
 +//
=====Jour3===== =====Jour3=====
Ligne 148: Ligne 149:
  * **09h00-10h30** : Construction de graphes valués à partir des données   * **09h00-10h30** : Construction de graphes valués à partir des données
-    * Méthodes pour la construction de graphes valués: aperçu des méthodes et illustration par l'approche PLS-PM sur des données reliant agriculture et environnement - **Dominique Desbois (INRA/Versailles)** +    * Méthodes pour la construction de graphes valués: aperçu des méthodes et illustration par l'approche PLS-PM sur des données reliant agriculture et environnement - **Dominique Desbois / INRA-AgroParisTech** {{:apsem2018_introduction_approche_plspm_avec_r_dominiquedesbois.pdf|pdf}} 
-    * Construction de graphes à partir des variables décrivant l'environnement et la biodiversité - **Romain David / IMBE / IndexMEED**+    * Construction de graphes à partir des variables décrivant l'environnement et la biodiversité - **Romain David / IMBE / IndexMEED** {{:apsem2018_indexmeed_graph_romain_david.pdf|pdf}}
  * **10h30-11h00** : Pause   * **10h30-11h00** : Pause
-  * **11h00-12h30** : Gestion et intégration de connaissance -Sémantique des Données génomiques des plantes et phénotypage-. Utilisation de graphes pour l'apprentissage "classique" - **Pascal Neveu / UMR INSTA / INRA Montpellier**+  * **11h00-12h30** : Gestion et intégration de connaissance -Sémantique des Données génomiques des plantes et phénotypage-. Utilisation de graphes pour l'apprentissage "classique" - **Pascal Neveu / UMR INSTA / INRA Montpellier** {{:apsem2018_integrationdedonnees_pascalneveu.pdf|pdf}}
  * **12h30-14h00** : Déjeuner   * **12h30-14h00** : Déjeuner
  * **14h00-15h30** : Table ronde sur la convergence Apprentissage/Représentation des connaissances- Pascal Neveu +   * **14h00-15h30** : Table ronde sur la convergence Apprentissage/Représentation des connaissances- Pascal Neveu +
-    * **14h00-15h00** : Les panélistes : donnez votre point du vue sur la convergence en 2 slides et en 5 minutes (Donner une série de question sur la convergence: 10*5min)+    * **14h00-15h00** : Les panélistes : donnez votre point du vue sur la convergence
 +      * Le développement d'un algorithme d'apprentissage pour définir une ontologie et une cartographie sémantique - **Frédéric Assié / [[http://www.mshsud.org| MSHSUD]] ** {{:apsem2018_apprentissageetconstructionontologie_assie.pdf|pdf}} 
 +      * Fusion de données d'imagerie médicale et réduction de dimensionnalité par apprentissage à noyaux multiples - **Nicolas Duchateau / [[http://creatis.insa-lyon.fr| CREATIS]]** {{:apsem2018_imagerieetapprentissage_duchateau.pdf|pdf}} 
 +      * La composition de services Web sémantiques et l'interopérabilité - **Thierry Louge / Calmip**[[http://irap.omp.eu | OMP/IRAP ]] {{:apsem2018_compositiondeservice-louge.pdf|pdf}} 
 +      * Apprentissage symbolique et ressources sémantiques - **Bernard Espinasse / lis-lab** {{:apsem2018_apprentissagesymbolique_ontoilper-13nov2018-espinasse.pdf|pdf}}
    * **15h00-15h30** : Les questions (Demander les questions à l'inscription)      * **15h00-15h30** : Les questions (Demander les questions à l'inscription) 
  * **15h30-16h00** : Pause café   * **15h30-16h00** : Pause café
-  * **16h00-16h30** : * Quel apport de l'Approche bio-div pour l'apprentissage : mélanger des objets de différentes natures dans le même graphe. - **Romain David /  IMBE et GDR Madics** (curation et fouille en fonction des différents contextes) Génération de graphes de décision. ou autre? +  * **16h00-16h30** : * Quel apport de l'Approche bio-div pour l'apprentissage : mélanger des objets de différentes natures dans le même graphe. - **Romain David /  IMBE et GDR Madics** (curation et fouille en fonction des différents contextes) Génération de graphes de décision. ou autre? {{:apsem2018_indexmeed_graph_romain_david.pdf|pdf}} 
-  *  +  * **16h30-18h** - **Atelier Graminé / GDR Madics** - **Stéphane Perennes /Directeur de Recherche au CNRS Équipe Coati (CNRS/UCA/INRIA)** {{:apsem2018.ateliermadics-graminee-perennes.pdf|pdf}}
-  * **16h30-18h** - **Atelier Graminé (Madics)** +
-Atelier de programmation GRAMINEES (GRAphe data Mining In Natural, Ecological and Environnemental Sciences, Responsables Romain David, IMBE, INEE, Luc Hogie, I3S, INS2i durée 1h30 à 2 h) +[[http://www.madics.fr/actions/actions-en-cours/graminees/|Atelier de programmation GRAMINEES]] (GRAphe data Mining In Natural, Ecological and Environnemental Sciences, Responsables Romain David, IMBE, INEE, Nathan Cohen, I3S, INS2i)
-http://www.madics.fr/actions/actions-en-cours/graminees/ +
-https://www6.bordeaux-aquitaine.inra.fr/biogeco/Personnel/Annuaire/D-F/Franc-Alain +
- +
- +
-**Atelier Graminé / GDR Madics** +
- +
-Atelier de programmation GRAMINEES (GRAphe data Mining In Natural, Ecological and Environnemental Sciences, Responsables Romain David, IMBE, INEE, Luc Hogie, I3S, INS2i durée 1h30 à 2 h) +
-http://www.madics.fr/actions/actions-en-cours/graminees/+
Cet atelier GRAMINEES, labellisé et soutenu par le GDR MaDICS, est proposé par le consortium IndexMEED. Organisé en marge de APSEM2018 ,il est néanmoins ouvert aux participants à l’ANF, et a pour objectif de préparer les étapes et la répartition des rôles nécessaires à l’élaboration d’un programme de recherche concernant la fouille de données environnementale hétérogènes et réparties basée sur la visualisation et la fouille de graphe. Les défis à relever sont le passage à l'échelle et l’utilisation simultanée de bases de données de disciplines différentes : des données thématiques (exemple : biodiversité) et des bases de données dites “de contexte” (exemple : altitude, température, pluviométrie) administrées par des organismes différents. Cet atelier GRAMINEES, labellisé et soutenu par le GDR MaDICS, est proposé par le consortium IndexMEED. Organisé en marge de APSEM2018 ,il est néanmoins ouvert aux participants à l’ANF, et a pour objectif de préparer les étapes et la répartition des rôles nécessaires à l’élaboration d’un programme de recherche concernant la fouille de données environnementale hétérogènes et réparties basée sur la visualisation et la fouille de graphe. Les défis à relever sont le passage à l'échelle et l’utilisation simultanée de bases de données de disciplines différentes : des données thématiques (exemple : biodiversité) et des bases de données dites “de contexte” (exemple : altitude, température, pluviométrie) administrées par des organismes différents.
Ligne 175: Ligne 171:
=====Jour4===== =====Jour4=====
- 
-**Appel à contribution :  
-  * notamment interrogation/exploitation d'entrepôts RDF à partir des outils d'analyse (Python, R, ENTC, datalift-R, ….).  
-  * Framework 
-** 
- 
Le matin :3 REX : 45 min de présentation puis 15 minutes d'échange Le matin :3 REX : 45 min de présentation puis 15 minutes d'échange
-  * **09h00-10h00** - Apprentissage automatique / web sémantique/ retours d'expérience. Présentation d'une méthodologie d'alignement automatique avec Geonames et de désambiguisation d'entités géographiques en utilisant une méthode par apprentissage automatique (words embeddings avec AdaGram en Julia). Dans le réservoir ISTEX des entité nommées on été extraites. Nous nous focalisons sur les entités géographiques (de type place name) que nous cherchons à aligner automatiquement avec Geonames. La désambiguisation des entités est alors une étape importante qui peut être résolue grace à des méthodes d'apprentissage automatique et de vectorisation de mots.Nous nous basons sur l'algorithme AdaGram développé en Julia. Nous présenterons la problématique, la méthodologie et illustrerons avec quelques exemples. - **Pascal Cuxac** / INIST / CNRS +  * **09h00-10h00** - Apprentissage automatique / web sémantique/ retours d'expérience. Présentation d'une méthodologie d'alignement automatique avec Geonames et de désambiguisation d'entités géographiques en utilisant une méthode par apprentissage automatique (words embeddings avec AdaGram en Julia). Dans le réservoir ISTEX des entité nommées on été extraites. Nous nous focalisons sur les entités géographiques (de type place name) que nous cherchons à aligner automatiquement avec Geonames. La désambiguisation des entités est alors une étape importante qui peut être résolue grace à des méthodes d'apprentissage automatique et de vectorisation de mots. Nous nous basons sur l'algorithme AdaGram développé en Julia. Nous présenterons la problématique, la méthodologie et illustrerons avec quelques exemples. - **Pascal Cuxac** / INIST / CNRS {{:apsem2018_méthodo_disamb_cuxac.pdf|pdf}} {{:adg_learning2.mp4.zip|vidéo ADG learning}} {{:disamb_portsmouth5.mp4.zip|| vidéo désambiguation}}  
-  * **10h00-11h00** - Mise en oeuvre d'une infrastructure de données et ses usages - +  * **10h00-11h00** - Le langage Julia - **Dennis Wilson** / {{:apsme2018.julia_denniswilson.pdf|pdf}}[[http://www.irit.fr | IRIT]] [[https://github.com/d9w/julia_presentation|Jupyter notebooks for Julia]]
  * **11h00-11h15** - Pause   * **11h00-11h15** - Pause
-  * **11h15-12h15** - REX3+  * **11h15-12h15** - Ressources numériques et pratiques de la connaissance - **Pascal Dayre/IRIT** {{:apsem2018.j4.rex.ressourcesnumeriquespratiquesdelaconnaissancedayre_08.pdf|pdf}}
  * **12h15-13h30** - Repas   * **12h15-13h30** - Repas
-  * **13h30-15h00** - Atelier par groupe autour de mots clé (apprentissage et représentation de données; représentation de données et apprentissage). Autour de 12 personnes par atelier +  * **13h30-15h00** - Ateliers: 
 +    * A1 - Extraction de la sémantique et indexation de documents textes selon un modèle métier. Apport croisé de l'apprentissage et de la sémantique - **Pascal Cuxac** / INIST / CNRS 
 +    * A2 - Méthodes et mise en oeuvre du machine learning par les non spécialistes. Choix du modèle, des données et du workflow. Evaluation du résultat - **Gabriel Ferrettini** / [[http://www.irit.fr|IRIT]] 
 +    * A3 -  Mise en oeuvre d'une infrastructure de données et de ses usages (Problématiques des infrastructures ouvertes / FAIR / Interopérabilité horizontale / Apprentissage pour apprendre des représentations / Représentations pour supporter l'apprentissage / apprentissage et IA) - **Pascal Dayre/IRIT**
  * **15h00-15h30** - Restitution   * **15h00-15h30** - Restitution
  * **15h30-16h00** - Bilan des journées   * **15h30-16h00** - Bilan des journées
 
apsem2018.1539263308.txt.gz · Dernière modification: 2018/10/11 15:08 par pascal.dayre@enseeiht.fr
 
Recent changes RSS feed Powered by PHP Powered by Pxxo Driven by DokuWiki