Précédentes éditions > Webinaire Janvier 2021

Les systèmes d'information agro-environmentaux

à l'ère du Big Data

29 Janvier 2021

CONNEXION

Le webinaire sera diffusé à cette adresse: https://greenlight.supagro.fr/visio/vin-7ut-3l7-tmm

Le webinaire a été enregistré. L'enregistrement sera disponible jusqu'au 29 février sur ce lien : https://bbb-scal.supagro.fr/playback/presentation/2.0/playback.html?meetingId=2137f3a7788971867b07b698d285434aec0b1dc7-1611904773648

PROGRAMME

8h30-8h45 INTRODUCTION slides

8h45-9h15 TITRE : Etude d’une solution d’interopérabilité pour l’exploitation et l’analyse de données hétérogènes animales
- DESCRIPTION : Les scientifiques de l’unité GenPhySE utilisent des données qui peuvent être catégorisées en deux parties : (i) Des données de mesures enregistrées sur l'animal (phénotypes) organisées dans plusieurs bases de données relationnelles. Des données biologiques mesurées à partir d'une prise de sang ou d’une biopsie et stockées dans différents entrepôts via l’enregistrement de métadonnées. La conception d’un data lake, basée sur des technologies Big Data, doit permettre aux scientifiques d’accéder et d’exploiter facilement à l’ensemble de ces données.
- AUTEUR : Alexandre JOURNAUX. UMR1388 GenPhySE Génétique Physiologie et Systèmes d'Elevage - INRAE
- slides

9h15-10h00 TITRE : Variety-aware analysis of document-oriented databases
- DESCRIPTION : Document-oriented databases are preferred to relational ones for storing heterogeneous data with variable schemas and structural forms. However, the absence of a unique schema adds complexity to analytical applications, in which a single analysis often involves large sets of data with different schemas. In this talk we introduce an original approach to OLAP on collections stored in document-oriented databases. The basic idea is to stop fighting against schema variety and welcome it as an inherent source of information wealth in schemaless sources
- AUTEUR : Stefano RIZZI, University of Bologna (Italie)
- slides

10h00-10h15 PAUSE

10h15-11h00 TITRE : PHIS - un système d'information open source dédié aux données de phénotypage haut débit
- DESCRIPTION : Les expériences phénotypiques sont coûteuses et ne peuvent pas être reproduites car on ne retrouvera jamais le climat exact dans lesquelles elles ont été réalisées. Il est donc nécessaire de pouvoir les ré-analyser conjointement avec d'autres, soit dans la même installation soit en combinant des expériences au champ et en serre. Le système d'informations PHIS (Phenotyping Hybrid Information System) permet d'organiser et de stocker ces jeux de données. Il s'appuie sur des ontologies et des graphes sémantiques pour identifier et relier tous les objets, évènements et caractères phénotypiques mesurés lors d'une expérience. Il s'appuie également sur une base de données NoSQL pour la gestion des données brutes et le système de stockage distribué irods pour le stockage des fichiers. PHIS est utilisé dans les installations de l'infrastructure nationale de phénomique végétale PHENOME-EMPHASIS.
  Il est le résultat d'une collaboration entre deux équipes de recherche de l'INRAE de Montpellier : l'IUMR MISTEA (Mathématiques, Informatique et Statistiques pour l'Environnement et l'Agronomie) et l'UMR LEPSE (Laboratoire des réponses écophysiologiques des plantes aux stress environnementaux)
- AUTEURS : Vincent NEGRE. UMR0759 LEPSE Laboratoire d'Écophysiologie des Plantes sous Stress environnementaux - INRAE ; Anne TIREAU UMR MISTEA Mathématiques, Informatique et STatistique pour l'Environnement et l'Agronomie - INRAE
- slides

11h00-11h45 TITRE : Nouveaux paradigmes de modélisation - le NoSQL orienté-document
- DESCRIPTION : Cette présentation traitera de la modélisation NoSQL orienté-document. Nous présenterons les principes fondammentaux de cette approche, puis nous présentarons comment mettre prendre en compte ces derniers pour mettre en place dans ce contexte des entrepôts de données multidimensionnelles. Nous présenterons également l'accés aux données strcuturellement hétérogènes.
- AUTEUR : Olivier TESTE, universités à Toulouse, IRIT
- slides

11h45-12h15 DISCUSSION slides

Une compilation des présentations est disponible ici

AUTEURS

Alexandre JOURNAUX, ingénieur d’études INRAE. Animateur de plusieurs groupes de travail au sein du Cati Sicpa : gestion de projet, Big Data, groupe technique développeurs, charte graphique, …

Stefano RIZZI is Full Professor at the University of Bologna since 2005. He has published more than 150 papers in international refereed journals and conferences mainly in the fields of data warehousing, business intelligence, and pattern recognition, and a research book on data warehouse design. He is member of the steering committee of DOLAP. His current research interests include data warehouse design and business intelligence, in particular OLAP on NoSQL data, social business intelligence, and analysis services for big data.

Vincent NEGRE est ingénieur à l'Institut National de Recherche pour l'Agriculture, l'Alimentation et l'Environnement. Il travaille depuis des années sur des plateformes de phénotypage de plantes à haut débit sur les aspects gestion des données. Il est impliqué dans la conception et le déploiement d'une e-infrastructure électronique dédiée à la communauté du phénotypage des plantes.

Anne TIREAU est ingénieure à l'Institut National de Recherche pour l'Agriculture, l'Alimentation et l'Environnement. Elle est responsable des développements de systèmes d'information et de connaissances (OpenSILEX, ALFIS, ...). Elle est spécialiste en ingénierie logicielle, systèmes d'Information et ingénierie des connaissances.

Olivier TESTE est professeur des universités à Toulouse où il est responsable de l'équipe de recherche Systèmes d'Informations Généralisées à l'IRIT (CNRS-UMR5505). Ces travaux de recherche se situent en Data Management (intégration automatique des données et des connaissances, et modélisations non-conventionnelles des données massives) et Machine Learning (analyses prédictives dans les séries temporelles).

QUESTIONNAIRE

https://docs.google.com/forms/d/e/1FAIpQLSfrj3TvwImornICQkwu-qH21ts2jYx6_jrEq1fgRmrZ6QjOHQ/viewform?usp=sf_link

INSCRIPTION A LA MAILING LISTING

Une liste de diffusion est disponible: sysinfoinrae@groupes.renater.fr

- méthode web https://groupes.renater.fr/sympa/subscribe/sysinfoinrae

- sinon par mail envoyer un mail à sympa@groupes.renater.fr avec comme sujet : subscribe sysinfoinrae $prenom $nom

Vie privée | Accessibilité