T2 - Ingénierie et web des données

Objectifs

Solutions d'ingénierie nécessaires à la maîtrise des masses de données et à leur valorisation sur le web. De la modélisation à la conception des systèmes d'information internet. Des données structurées et semi-structurées au web sémantique.

Description

Nous vivons une révolution des données. La quantité produite de données augmente de manière exponentielle. Le web a donné naissance à notre monde interconnecté et rend accessible ces masses de données au plus grand nombre.

Comment intégrer ces sources de données dans les projets scientifiques et comment valoriser les nouveaux résultats de recherche produits?

Nous nous intéresserons aux différentes solutions du processus d'informatisation, du développement et de la maintenance des systèmes d'information.

De la modélisation du domaine avec UML en passant par le modèle entité-association, nous ferons le point sur l'apport du modèle du web sémantique.

Au-delà des moteurs relationnels et des moteurs NOSQL, nous verrons l'apport de SparQL.

Nous étudierons en quoi ce nouveau paradigme permet ou non d'expliciter, de représenter, de construire et de capitaliser les connaissances pour différentes communautés scientifiques et techniques. Nous serons attentifs à la rétro-ingénierie, à la capitalisation et à l'évolution de l'existant, à l'ingénierie des systèmes d'information internet.

Mots clés

  • Modélisation des données
  • web sémantique
  • RDFS/RDF
  • OWL
  • Thésaurus/Ontologie
  • SGBDR
  • NOSQL
  • SPARQL
  • Recherche d'information
  • Combinaison de ressource (mashup)
  • Alignement de données
  • ETL
  • Graph mining
  • Raisonneur
  • Sécurité
  • Qualité des données
  • Visualisation des données
  • Modéliser les traitements
  • Prototypage rapide

Public

  • communautés : réseaux DEVLOG, Calcul, RBDD, RENATIS, science des données, développement web

Planning

  • Mardi 4/07 Matin: AP01,A04
  • Mercredi 5/07 Matin: Plénière(présentations)
  • Mercredi 5/07 après-midi: A01,A05,GT01/
  • Jeudi 6/07 Matin: A02,A03,GT04/GT06
  • Jeudi 6/07 après-midi: A06

Présentations

  • 09h00-10h00 : Tutoriel sur le Linked Data - Manuel Atencia (LIG & Inria Grenoble Rhône-­Alpes)
  • 10h00-10h40 : Best Practices & Design Patterns pour l'ingénierie des données avec les langages du Web sémantique - Olivier Corby (INRIA, I3S, Sophia Antipolis)
  • 10h40-11h00 : Pause
  • 11h00-11h40 : Intégrer des Sources de Données Hétérogènes dans le Web de Données - Franck Michel (I3S, CNRS, Université Côte d'Azur)
  • 11h40-12h05 : REX
  • 12h05-12h30 : Retour d'expérience sur DOREMUS : données musicales en réutilisation (http://www.doremus.org/) - Kostantin Todorov (LIRMM/Université de Montpellier)

Ateliers

Le durée d'un atelier est de 3h.

Voir agenda :

  • T2.AP01 : Prise en main de SPARQL avec Wikidata - ma première requête - Karima Rafes (BorderCloud)
  • T2.A01 : Modéliser les ontologies : cas d'application d'une ontologie pour l'annotation de photos - Manuel Atencia (LIG & Inria Grenoble Rhône-­Alpes)
  • T2.A02 : Comment faire une application avec des données liées: annotation de photo en utilisant les technos du web sémantique avec Jena et l'ontologie faite en T2.A01 - Jérôme David (Enseignant-­chercheur à l’Université Grenoble Alpes. Membre de l’équipe MoEx, LIG & Inria Grenoble Rhône-­Alpes)
  • T2.A03 : Alignement d’ontologies et interconnexion de données du web - Kostantin Todorov (LIRMM/Université de Montpellier) & Franck Michel (I3S, CNRS, Université Côte d'Azur)
  • T2.A04 : Atelier SparQL, niveau avancé - Karima Rafes (BorderCloud)
  • T2.A05 : STTL, un langage de transformation de graphes RDF basé sur SPARQL (analoque à XSLT) qui permet de concevoir des navigateurs hypertexte sur le Web de données - Olivier Corby (INRIA, I3S, Sophia Antipolis)
  • T2.A06 : Accès à des sources de données hétérogènes : accès à des bases de données relationnelles avec Sparql avec Ontop (cas d'usage du système d'information d'une université) - Benjamin Cogrel (Post-doctorant, KRDB, Université Libre de Bozen-Bolzano)

Groupes de travail

Intervention de 30 à 45 min - Un groupe de travail permet de discuter, présenter, animer autour d'un sujet.

  • T2.GT01 : : Utiliser des vocabulaires contrôlés pour vérifier des données. Baptiste Laporte (CESAB/FRB) & Marie-Claude Quidoz (CEFE/CNRS)
  • T2.GT02 : graph mining et graph matching
  • T2.GT03 : Requêtage, accès aux données : federée/distribuée au niveau sparql, SQL (clause Service, merge local et données distant)
  • T2.GT04 : Quelles technologies du Web Sémantique choisir pour son système d'information ? Benjamin Cogrel (Post-doctorant, KRDB, Université Libre de Bozen-Bolzano)
  • T2.GT05 : Devenir référent pour un schéma de données - comment on les nomme pour être pérenne. URI, DOI, ARK
  • T2.GT06 : Utilisation des technologies du Web Sémantique pour l'urbanisation et l'ouverture d’une infrastructure de recherche. Adrien Desseigne (CNRS TGIR Huma-Num)
 
jdev2017/t2.txt · Dernière modification: 2017/04/26 17:35 par marie-claude.quidoz@cefe.cnrs.fr
 
Recent changes RSS feed Powered by PHP Powered by Pxxo Driven by DokuWiki