T5 - Infrastructures logicielles et science ouverte

Objectifs

Comprendre l'enjeu des infrastructures numériques scientifiques en émergence. Apprendre à les architecturer et à contribuer à leur développement. Comprendre et développer son projet avec les infrastructures numériques dans le contexte du big data et de l'open-access.

Comprendre pourquoi et comment développer une infrastructure logicielle. Comment organiser une communauté de développement pour co-construire une infrastructure. Comment m'appuyer sur une infrastructure de données et/ou de calcul pour développer des applications web pour mes utilisateurs.

Description

L'explosion du volume des données, leur répartition dans le nuage nécessitent de réfléchir aux infrastructures facilitant leur interopérabilité, leurs usages et leurs valorisations.

Dans un contexte de convergence des ressources de calcul et de données, du web des données, les infrastructures numériques permettent l'automatisation de la collecte et des traitements des données indispensable pour assimiler de grands volumes, certifier, fiabiliser les traitements en vue de rendre les expérimentations, les simulations numériques et la science reproductibles.

Nous nous intéresserons à comprendre l'enjeu des infrastructures numériques scientifiques en émergence, à apprendre à les utiliser pour mettre en place ses solutions et aussi à contribuer à leur essor en proposant des ressources de données et des ressources de calcul additionnelles.

En complément à leur développement, nous apprendrons à les architecturer (architectures orientées ressources, pilotage par processus, référentiels de contenu, référentiel de type, méta-données, indexation…). Nous parlerons de leur urbanisation avec en ligne de mire la convergence du HPC et du cloud (OpenStack, SaaS, PaaS…) et la bonne utilisation des infrastructures matérielles sous-jacentes.

Nous ferons un focus particulier sur les données liées et l'open-access, les humanités numériques et l'utilisation des ressources dans les systèmes d'information scientifique.

Mots clés

  • Infratructures numériques
  • Big data
  • Référencement, traitement et analyse des données
  • Architecture micro-service, SOA, ROA
  • Fondamentaux du Big Data (algorithmes pour le Big Data)
  • Ouverture des données de la recherche (open-access)
  • Ressources de données (BD , persistance)
  • Ressources de calcul
  • Open-access, open-data, open-édition
  • Humanités numériques
  • Sécurité,
  • Systèmes d'Information, patterns et urbanisation
  • SOA
  • ROA
  • Intergiciel, bus logiciel
  • Micro-service
  • Orchestration, chorégraphie
  • Infrastructures et IOT
  • RDA
  • LIMS Laboratory Information Management System
  • Web API
  • Openstack, IAAS, PAAS, SAAS, virtualisation

Public

  • Réseaux: Devlog, Calcul, RBDD
  • GDR GPL, MADICS

Presentations

  • 14h00-14h30: - Les infrastructures numériques, les services de calcul et de données, état de l'art et perspective - Alain Tchana
  • 14h30-14h55: Les concepts d'une infratructures logicielles- apis, scalabilité, résilience, couche métier, couche données,intéropérabilité - Olivier Sallou
  • 14h55-15h20: Illustration de la mise en oeuvre d'une infrastructure logicielle dans le monde des SHS - perspective et impact sur les pratiques de dev - Nicolas Larrousse
  • 15h20-15h40: - SOA, late-binding et agilité technique - linagora
  • 15h40-16h00: - Pause
  • 16h00-16h35: - SOA/WOA/ROA tenants et aboutissants- linagora
  • 16h35-17h00: - Portage d'une architecture SOA sous Docker, exemple du système d'information du réseau d'observation ReefTEMPS - Sylvie Fiat
  • 17h00-17h30: - Logisland, Event Mining libre basée sur Spark & Kafka - Thomas Baillet

Ateliers préparatoires

Ateliers

  • T5.A01 : Usage des données et des API ISTEX - http://www.istex.fr/ (INIST) - nicolas thouvenin
  • T5.A02 : Usage des API, des méta-données et des données. Indexation et RI.
  • T5.A03 : RI à partir de plusieurs referentiel - Alexandre Delanoë travaille sur le projet Gargantext à l'ISC (analyse du réseau et raitement automatique des langues)
  • T5.A04 : Déployement avec Docker (Treeptik)
  • T5.A05 : Decouverte d'elastic search: beats + elasticsearch + kibana (david pilato.fr)
  • T5.A06 : TP BD orientée graph - Fouille de données et jointure - (neo4j cedric.fauvet)
  • T5.A07: Openstack : configurer un tenant/configurer un IAAS. Utilisation de Cloudwatt ou de la POC de Philippe.saby@obs-mip.fr et Objectif Libre.
  • T5.A08 : Roboconf, Orchestration de conteneurs pour l'intégration continue avec : Linagora J.P Lorré. Encapsulation de composants logiciels ou de machines virtuelles pour leur liaison avec le Cloud. Déploiement hybride -privé et public-(en lien avec la T8 ateliet T8.A01) -
  •  T5.A09 : Atelier Flux d'évenement massif: mettre en place une chaîne de traitement, collecte, acqusiition, configurer, création et execution d'un algo de matching learning, plugin - LogIsland, bailet thomas

Groupes de travail

* Groupe 1

  • T5.GT01 : Openstack pour modéliser et tester son architecture SOA ou ROA - Olivier Sallou et Philippe Saby
  • T5.GT09 Quels usages pour la recherche du traitement temps réel de flux massifs d'événements (LogIsland - bailet thomas)

* Groupe 2

  • T5.GT03 : Infrastructure numérique et communauté de développement - Stephane Ribas
  • T5.GT08 : Comment protéger son jeu de données dans une infrastructure ouverte? (comité éthique, représentation des données interface, embargo, …) - Yvan Le Bras

* Groupe 3

  • T5.GT04 Strategie de publication pour l'openscience (publication, code et données)

- Marie Farge

  • T5.GT02 : Urbaniser/architecturer une infrastructure numérique, fédération de communauté de développement et fédérer une communauté d'utilisateur. Yvan Le Bras.

* Groupe 4

  • T5.GT06 :: Recherche textuelle - Patrick Bellot
  • T5.GT07 : Les API pour la recherche et la fouille de documents scientifiques et techniques - Nicolas Thouvenin

* Groupe 5

  • T5.GT05 : La question de la pérennité des données de la recherche : les plateformes et les infrastructures - Nicolas Larrousse
  • T5.GT10 Proposition du CLEO “Mise en place d'une architecture robuste / Sécurité & scalabilité : Retour d’expérience sur la plate-forme Hypothèse”

* Groupe 6

  • T5.GT11 : Intégrer ses développements au sein d'une infrastructure - Yvan Le Bras
 
jdev2017/t5.txt · Dernière modification: 2017/04/24 11:34 par nicolas.larrousse@huma-num.fr
 
Recent changes RSS feed Powered by PHP Powered by Pxxo Driven by DokuWiki