Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

apsem2018 2018/07/20 15:20 apsem2018 2018/10/16 15:21 version actuelle
Ligne 7: Ligne 7:
  * **Date: ** - du 12-15 novembre (Semaine 46) - 4 jours   * **Date: ** - du 12-15 novembre (Semaine 46) - 4 jours
  * Nb personne: 30-40   * Nb personne: 30-40
 +  * Date limite d'inscription : 12 octobre
Ligne 18: Ligne 19:
[[http://agora.inp-toulouse.fr/limesurvey/index.php/976354/lang-fr|====== Appel à contribution ====== [[http://agora.inp-toulouse.fr/limesurvey/index.php/976354/lang-fr|====== Appel à contribution ======
]] ]]
 +
 +L'organisation se fait en collaboration avec l'Inra avec le soutien financier d'Ingenum pour la prise en charge des frais d'inscription pour les agents Inra.
===== Objectifs et enjeux ===== ===== Objectifs et enjeux =====
Ligne 47: Ligne 50:
  * aux outils, langages et environnements de travail   * aux outils, langages et environnements de travail
  * aux processus et méthodes de travail   * aux processus et méthodes de travail
 +
 +===== Comité d'organisation =====
 +  * [[http://www.cote-azur.cnrs.fr/Formation-permanente/;view|La formation permanente de la DR20]]
 +  * en collaboration avec l'Inra avec le soutien financier [[https://www.ingenum.inra.fr/|d'Ingenum]] pour la prise en charge des frais d'inscription pour les agents Inra.
 +  * Pascal Dayre
 +  * [[http://www6.versailles-grignon.inra.fr/economie_publique/PagesPerso2/Dominique-Desbois|Dominique Desbois]]
 +  * [[http://www.enseeiht.fr|Les services de l'ENSEEIHT]]
 +
 +===== Comité de programme =====
 +  * Pascal Dayre
 +  * [[http://www6.versailles-grignon.inra.fr/economie_publique/PagesPerso2/Dominique-Desbois|Dominique Desbois]] 
 +  * [[http://modalis.i3s.unice.fr/fmichel|Frank Michel]]
 +  * Nathalie Hernandez
 +  * Romain David
 +
 +
====== Pré-programme  ====== ====== Pré-programme  ======
Ligne 60: Ligne 79:
  * **09h30-10h00 :** - Accueil   * **09h30-10h00 :** - Accueil
-  * **10h00-10h20 :** - Présentation et objectif de l'action - Quels apports croisés de l'apprentissage et du web sémantique? - **Pascal Dayre / CNRS/IRIT ** +  * **10h00-10h15 :** - Présentation et objectif de l'action - Quels apports croisés de l'apprentissage et du web sémantique? - **Pascal Dayre / CNRS/IRIT ** 
-  * **10h20-10h45 :** - Recherche par les données : de la données au représentation des connaissances exploration, préparation des données d'apprentissage pour éviter les biais (données manquantes, classes sureprésentées, bonne distribution, données erronnées), mise en forme et structuration des données - FC / INSEE ou SD / IMT (à confirmer)+  * **10h15-10h45 :** - Recherche par les données : des données aux représentations des connaissances exploration, préparation des données d'apprentissage pour éviter les biais (données manquantes, classes sureprésentées, bonne distribution, données erronnées), mise en forme et structuration des données - **Sébastien Déjean / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]**
  * **10h45-11h15 :** - Pause   * **10h45-11h15 :** - Pause
-  * **11h15-12h15 :** Synthèse de la science des données et de l'apprentissage automatique. Les points de vue maths/info de l'ingénieur - Laurent Risser / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]+  * **11h15-12h15 :** Synthèse de la science des données et de l'apprentissage automatique. Les points de vue maths/info de l'ingénieur - **Laurent Risser / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]**
    * Exemple introductif qui pose le vocabulaire (observation/variable/label/apprentissage supervisé ou non).     * Exemple introductif qui pose le vocabulaire (observation/variable/label/apprentissage supervisé ou non).
    * Evolution des tendances en science des données (de la statistique classique à l'apprentissage machine).     * Evolution des tendances en science des données (de la statistique classique à l'apprentissage machine).
Ligne 73: Ligne 92:
  * **12h15-13h30 :** - Pause repas   * **12h15-13h30 :** - Pause repas
-  * **13h30-14h30 :** - Synthèse de la science des données et de l'apprentissage automatique. Les points de vue maths/info de l'ingénieur - Laurent Risser / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]] (suite) +  * **13h30-14h30 :** - Synthèse de la science des données et de l'apprentissage automatique. Les points de vue maths/info de l'ingénieur - **Laurent Risser / [[https://www.math.univ-toulouse.fr/?lang=fr|IMT]]** (suite) 
-  * **14h30-15h15 :** - Le deep learning sur les données structurée (apprentissage structuré) - **Mathieu Serrurier / IRIT**+  * **14h30-15h15 :** - Un point sur l'explicabilité et l'interprétabilité en machine learning - **Mathieu Serrurier / IRIT**
  * **15h15-15h45 :** - Pause café   * **15h15-15h45 :** - Pause café
-  * **15h45-16h15 :** - Apport des graphes pour structurer les données et pour l'apprentissage -  +  * **15h45-16h30 :** - Comment faire émerger un graphe du décodage de vos données. Mise en oeuvre pour l'analyse de la structure du discours dans les tchats. Méthode, approches classiques et extraction automatique de représentation avec le deep learning. - **Stergos Afantenos / IRIT** 
-  * **16h15-17h00 :** - Méthodes supervisée par les graphes. PB du tagage des données d'apprentissage - **CL / CERFACS**+  * **16h30-17h15 :** - Apprentissage et représentation jointe dans une base connaissance pour la désambiguation d'entités. Application à une collection de texte. - **Jose Moreno / IRIT**
  * **19h30-21h30 :** - Evénement social dinatoîre   * **19h30-21h30 :** - Evénement social dinatoîre
Ligne 102: Ligne 121:
  * **09h00-10h00** : Introduction à l'Ingénierie des Connaissances, ses usages, ses intérêts : web des données, données liées, ontologies, aperçu des standards du web sémantique (RDF/RDFS/OWL/SPARQL). Liage d'instances, alignement d'ontologies. **Franck Michel**.   * **09h00-10h00** : Introduction à l'Ingénierie des Connaissances, ses usages, ses intérêts : web des données, données liées, ontologies, aperçu des standards du web sémantique (RDF/RDFS/OWL/SPARQL). Liage d'instances, alignement d'ontologies. **Franck Michel**.
-  * **10h00-10h45** : Décrire ses données par l'utilisation/extension de vocabulaires génériques, créer des ontologies de domaine. **Nathalie Hernandez**. \\ //Les métadonnées servent à décrire/structurer/indexer les données et les contenus. Il importe de partager des vocabulaires communs de métadonnées entre les disciplines pour faciliter l'utilisation des données dans des contextes interdisciplinaires. Peut-on étendre le Dublin Core ? Comment s'y prend-on ? Quels sont les vocabulaires, les initiatives ? Comment agréger des vocabulaires autour du Dublin Core (pour décrire des images, des séries temporelles, des informations de localisation, …) ? Quelles recommandations suivre ? Comment faire du sens à partir de l'existant ? Un panel de l'existant sera présenté: schema.org (annotation massive des pages web) et ses extensions possibles comme Bioschemas.org, catalogue des vocabulaires (LOV, BioPortal, AgroPortal, ontobee), … Illustrations utilisant JSON-LD, RDFa, micro-data, micro-format.//+  * **10h00-10h45** : Décrire ses données par l'utilisation/extension de vocabulaires génériques, créer des ontologies de domaine. **Nathalie Hernandez**.
  * **10h45-11h15 :** Pause café   * **10h45-11h15 :** Pause café
Ligne 108: Ligne 127:
  * **11h15-11h35** : Les vocabulaires pour décrire les jeux de données et les catalogues (VOID, HCLS, DCAT, schema.org), les outils pour les publier (data.gouv.fr, portails CKAN...) . **Franck Michel**.   * **11h15-11h35** : Les vocabulaires pour décrire les jeux de données et les catalogues (VOID, HCLS, DCAT, schema.org), les outils pour les publier (data.gouv.fr, portails CKAN...) . **Franck Michel**.
-  * **11h35-12h00** : Comment annoter sémantiquement des données existantes. **Nathalie Hernandez**. \\ //Il s'agit ici de faire le point sur comment des méta-données peuvent être associées à des données publiées sur le web (données légataires hétérogènes) pour y ajouter de la sémantique. Par exemple les vocabulaires d'annotations seront étudiés tels que le “Web annotation vocabulary”, ou CSV-on-the-Web/JSON-LD qui permettent d'interpréter un document CSV/JSON comme un graphe RDF.//+  * **11h35-12h00** : Comment annoter sémantiquement des données existantes. **Nathalie Hernandez**.
  * **12h00-12h30** : Vocabulaire liés aux statistiques, formaliser les activités d'analyse. **Franck Cotton, INSEE**.   * **12h00-12h30** : Vocabulaire liés aux statistiques, formaliser les activités d'analyse. **Franck Cotton, INSEE**.
Ligne 130: Ligne 149:
  * **09h00-10h30** : Construction de graphes valués à partir des données   * **09h00-10h30** : Construction de graphes valués à partir des données
    * Méthodes pour la construction de graphes valués: aperçu des méthodes et illustration par l'approche PLS-PM sur des données reliant agriculture et environnement - **Dominique Desbois (INRA/Versailles)**     * Méthodes pour la construction de graphes valués: aperçu des méthodes et illustration par l'approche PLS-PM sur des données reliant agriculture et environnement - **Dominique Desbois (INRA/Versailles)**
-    * Construction de graphes à partir des variables décrivant l'environnement et la biodiversité - **Romain David / IMBE / IndexMED**+    * Construction de graphes à partir des variables décrivant l'environnement et la biodiversité - **Romain David / IMBE / IndexMEED**
  * **10h30-11h00** : Pause   * **10h30-11h00** : Pause
  * **11h00-12h30** : Gestion et intégration de connaissance -Sémantique des Données génomiques des plantes et phénotypage-. Utilisation de graphes pour l'apprentissage "classique" - **Pascal Neveu / UMR INSTA / INRA Montpellier**   * **11h00-12h30** : Gestion et intégration de connaissance -Sémantique des Données génomiques des plantes et phénotypage-. Utilisation de graphes pour l'apprentissage "classique" - **Pascal Neveu / UMR INSTA / INRA Montpellier**
Ligne 140: Ligne 159:
  * **16h00-16h30** : * Quel apport de l'Approche bio-div pour l'apprentissage : mélanger des objets de différentes natures dans le même graphe. - **Romain David /  IMBE et GDR Madics** (curation et fouille en fonction des différents contextes) Génération de graphes de décision. ou autre?   * **16h00-16h30** : * Quel apport de l'Approche bio-div pour l'apprentissage : mélanger des objets de différentes natures dans le même graphe. - **Romain David /  IMBE et GDR Madics** (curation et fouille en fonction des différents contextes) Génération de graphes de décision. ou autre?
  *   *
-  * **16h30-18h** - **Atelier Graminé / pub vers Madics** +  * **16h30-18h** - **Atelier Graminé (Madics)**
Atelier de programmation GRAMINEES (GRAphe data Mining In Natural, Ecological and Environnemental Sciences, Responsables Romain David, IMBE, INEE, Luc Hogie, I3S, INS2i durée 1h30 à 2 h) Atelier de programmation GRAMINEES (GRAphe data Mining In Natural, Ecological and Environnemental Sciences, Responsables Romain David, IMBE, INEE, Luc Hogie, I3S, INS2i durée 1h30 à 2 h)
Ligne 165: Ligne 184:
Le matin :3 REX : 45 min de présentation puis 15 minutes d'échange Le matin :3 REX : 45 min de présentation puis 15 minutes d'échange
  * **09h00-10h00** - Apprentissage automatique / web sémantique/ retours d'expérience. Présentation d'une méthodologie d'alignement automatique avec Geonames et de désambiguisation d'entités géographiques en utilisant une méthode par apprentissage automatique (words embeddings avec AdaGram en Julia). Dans le réservoir ISTEX des entité nommées on été extraites. Nous nous focalisons sur les entités géographiques (de type place name) que nous cherchons à aligner automatiquement avec Geonames. La désambiguisation des entités est alors une étape importante qui peut être résolue grace à des méthodes d'apprentissage automatique et de vectorisation de mots.Nous nous basons sur l'algorithme AdaGram développé en Julia. Nous présenterons la problématique, la méthodologie et illustrerons avec quelques exemples. - **Pascal Cuxac** / INIST / CNRS   * **09h00-10h00** - Apprentissage automatique / web sémantique/ retours d'expérience. Présentation d'une méthodologie d'alignement automatique avec Geonames et de désambiguisation d'entités géographiques en utilisant une méthode par apprentissage automatique (words embeddings avec AdaGram en Julia). Dans le réservoir ISTEX des entité nommées on été extraites. Nous nous focalisons sur les entités géographiques (de type place name) que nous cherchons à aligner automatiquement avec Geonames. La désambiguisation des entités est alors une étape importante qui peut être résolue grace à des méthodes d'apprentissage automatique et de vectorisation de mots.Nous nous basons sur l'algorithme AdaGram développé en Julia. Nous présenterons la problématique, la méthodologie et illustrerons avec quelques exemples. - **Pascal Cuxac** / INIST / CNRS
-  * **10h00-11h00** - REX2+  * **10h00-11h00** - Mise en oeuvre d'une infrastructure de données et ses usages -
  * **11h00-11h15** - Pause   * **11h00-11h15** - Pause
  * **11h15-12h15** - REX3   * **11h15-12h15** - REX3
 
apsem2018.1532092828.txt.gz · Dernière modification: 2018/07/20 15:20 par pascal.dayre@enseeiht.fr
 
Recent changes RSS feed Powered by PHP Powered by Pxxo Driven by DokuWiki