PresentationPDF Available

Bilan Juin 2015 – Février 2016 du Projet VIGI-GEEK : VIsualisation of Graph In trans-disciplinary Global Ecology, Economy and Sociology data-Kernel.

Authors:
  • Research fellow - Data Manager at ERINHA AISBL (European Research Infrastructure on Highly Pathogenic Agents)

Abstract and Figures

” VIGI-GEEK ” propose de construire un outil de représentation sous forme de graphes des données de différents champs disciplinaires (écologie, sociologie, économie) et d’élaborer des méthodes de création de scénarios par approches successives (coévolution de facteurs), basée sur des concepts actuellement décrits par les approches globales. L’objectif est de construire des graphes paramétrables avec des données hétérogènes (de la molécule à l’écosystème, en passant par les traits de vie, jusqu’aux paysages et aux interactions homme-milieu) concernant l’écologie méditerranéenne et d’analyser les données grâce à des algorithmes utilisés dans d’autres disciplines. « VIGI-GEEK » doit dans le cadre d’un consortium multidisciplinaire appelé « IndexMed » développer à moyen terme les usages de ces graphes pour l’aide à la décision en gestion environnementale dans le cadre d’un projet de recherche à soumettre aux appels à projets européens (BiodivERsA, FEDER, SeasEra, H2020).
No caption available
… 
No caption available
… 
No caption available
… 
No caption available
… 
No caption available
… 
Content may be subject to copyright.
Bilan Juin 2015 Février 2016 du Projet VIGI-GEEK :
VIsualisation of Graph In trans-disciplinary Global
Ecology, Economy and Sociology data-Kernel.
Prototype d’indexation, de visualisation de données hétérogènes en
environnement dans le cadre du consortium IndexMed
Soutenu dans le cadre du défi IMAG’IN (AAP2015)
romain.david@imbe.fr thierry.tatoni@imbe.fr jean-pierre.feral@imbe.fr
Christian Surace Cyrille Blanpain Julien Lecubin (et les membres du projet déposé)
Consortium : Coordonné par :
Journée de restitution IMAG IN, 24 - 25 février 2016
1. Genèse du projet
Le consortium
Créé lors d’un appel à projet
MASTODONS (2013)
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
1. Genèse du projet
Le consortium
Créé lors d’un appel à projet
MASTODONS (2013)
Projet non retenu…
… mais …
Les participants (15 équipes)
décident de persévérer
L’IMBE (INEE), le SIP de l’OSU
Pythéas (INSU) et le LAM (INSU)
mettent en commun des
moyens propres pour cela
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
1. Genèse du projet
Les objectifs du consortium
Objectif principal d’IndexMed:
développer la culture des bases de données et leur accessibilité
Mais surtout de nouvelles méthodes d’utilisation efficace des données
dans le milieu de la recherche en écologie et biodiversité.
Conditions :
Des bases de données ouvertes, interopérables, stables (et donc
recensées) et des données traçables et bien qualifiées,
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
1. Genèse du projet
Les objectifs du consortium
Objectif principal d’IndexMed:
développer la culture des bases de données et leur accessibilité
Mais surtout de nouvelles méthodes d’utilisation efficace des données
dans le milieu de la recherche en écologie et biodiversité.
Conditions :
Des bases de données ouvertes, interopérables, stables (et donc
recensées) et des données traçables et bien qualifiées,
en adaptant les méthodes issues d’autres disciplines
Astronomie, Physique, Mathématiques, Economie, Informatique, Fouille de données…
-> INTEROPERABLES et MULTIDISCIPLINAIRES
MOYENS :
L'indexation,
l'identification
pérenne des données
avec le consortium
IndexMed
(écologie
méditerranéenne)
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
1. Genèse du projet
Contributeurs 2015 IndexMed
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
1. Genèse du projet
Un site pour fédérer la communauté IndexMed
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
2. Contexte multidisciplinaire
Le contexte : données sur la biodiversité et l’environnement ?
Multi-échelles Multi formats Multi-sources…
Echelle chimie/physique
C
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : données sur la biodiversité et l’environnement ?
Multi-échelles Multi formats Multi-sources…
Echelle chimie/physique
Génomique, cellules, transcriptomique Protéomique, métabolimique, épigénétique
Echelle de l’organisme
C
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : données sur la biodiversité et l’environnement ?
Multi-échelles Multi formats Multi-sources…
Echelle chimie/physique
Echelle des habitats / populations
Phylogeographie,
Fonctionnement
Ecosystemes
Echelle de l’organisme
C
Génomique, cellules, transcriptomique Protéomique, métabolimique, épigénétique
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : données sur la biodiversité et l’environnement ?
Multi-échelles Multi formats Multi-sources…
Echelle chimie/physique
Echelle des habitats / populations
Phylogeographie,
Fonctionnement
Ecosystemes
Echelle des paysages, des régions et des interactions humaines
Sociologie,
Economie,
Droit, bien être……
Echelle de l’organisme
C
Génomique, cellules, transcriptomique Protéomique, métabolimique, épigénétique
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : données sur la biodiversité et l’environnement ?
Multi-échelles Multi formats Multi-sources…
Echelle chimie/physique
Echelle des habitats / populations
Phylogeographie,
Fonctionnement
Ecosystemes
Echelle des paysages, des régions et des interactions humaines
Sociologie,
Economie,
Droit, bien être……
Quelle approche intégrative pour ce patchwork de contextes à chaque niveau d’organisation?
Echelle de l’organisme
C
Génomique, cellules, transcriptomique Protéomique, métabolimique, épigénétique
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : systèmes de gestion de données sur la biodiversité
Mono-échelles Mono-disciplinaires et peu connectés…
Human
sciences
History
Archeology
Law
Economy
Sociology
Vegetal
biology
Botany
Taxonomy
Palinology
Dendrology
Phyto-
sociology
Animal
biology
Comportement
al biology
Anatomy
Taxonomy
Species
interactions
Trophic
studies
Molecular
Sciences
Phylogenetic
Phyloge
ography
Polulation
genetic
Metage
nomic
Ecology
Functionning
Structure
study
GES
approaches
Indicators
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : systèmes de gestion de données sur la biodiversité
Mono-échelles Mono-disciplinaires et peu connectés…
Human
sciences
History
Archeology
Law
Economy
Sociology
Vegetal
biology
Botany
Taxonomy
Palinology
Dendrology
Phyto-
sociology
Animal
biology
Comportement
al biology
Anatomy
Taxonomy
Species
interactions
Trophic
studies
Molecular
Sciences
Phylogenetic
Phyloge
ography
Polulation
genetic
Metage
nomic
Ecology
Functionning
Structure
study
GES
approaches
Indicators
Lié à une spécialisation excessive?
( ) x Région x Habitat…
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : Quelles analyses fréquentes sur la biodiversité?
Pourtant, il faut décrire
Un système fortement interconnecté et interdépendant
Echelle physico-chimique
Echelle
moléculaire
Echelle de
l’organisme
Echelle des
habitats et des
communautés
Echelle des
interactions
humaines(droit,
écolomie,
sociologie…)
Echelle allant
des paysages
au global
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : Quelles analyses fréquentes sur la biodiversité?
Pourtant, il faut décrire
Un système fortement interconnecté et interdépendant
Echelle physico-chimique
Echelle
moléculaire
Echelle de
l’organisme
Echelle des
habitats et des
communautés
Echelle des
interactions
humaines(droit
, écolomie,
sociologie…)
Echelle allant
des paysages
au global + Effets antagonistes
+ Effets « potentialisateurs »
+ Effets de cascades
… dépendants des contextes
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : Quelles analyses fréquentes sur la biodiversité?
Comprendre les contextes…
Un patchwork de contextes
particuliers
significativité et la
signification des mesures ?
- échelle géographique et temporelle ?
- quels facteurs ?
- quelle importance relative de chaque facteur ?
- quelles interactions entre facteurs?
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : Quelles analyses fréquentes sur la biodiversité?
Comprendre les contextes…
Un patchwork de contextes
particuliers
significativité et la
signification des mesures ?
Nombreux, Grande variabilité
locale
Mélangés Pas évidents (ou impossibles
actuellement) à mesurer…
Et eux aussi interagissent
effets antagonistes, « potentialisateurs »,
de cascades…
- échelle géographique et temporelle ?
- quels facteurs ?
- quelle importance relative de chaque facteur ?
- quelles interactions entre facteurs?
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : Quelles analyses fréquentes sur la biodiversité?
Base quantitative
+ Surtout « contemplative » (X species, Y taxa…) - spp. richness
++ Parfois comparative
+++ plus de 2 paramètres… multi-variées mais ensembles peu précis
?
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : quel Big Data pour la biodiversité
Données peu structurées et peu accessibles
Les données sur la biodiversité (présence d’espèces, abondances,
abondances relatives, biomasses …, code barre, gènes …, valeurs
économique, patrimoniale …) sont :
-coûteuses à produire
- très diversifiées (format, grain géographique et temporel)
- peu comparables et peu automatisées
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le contexte : quel Big Data pour la biodiversité
Données peu structurées et peu accessibles
Les données sur la biodiversité (présence d’espèces, abondances,
abondances relatives, biomasses …, code barre, gènes …, valeurs
économique, patrimoniale …) sont :
- coûteuses à produire
- très diversifiées (format, grain géographique et temporel)
- peu comparables et peu automatisées
- Les normes changent beaucoup trop vite par rapport aux capacités
d’adaptations des Systèmes de Gestion des Données
- Les compétences pour conserver les données et les partager sont
souvent absentes des laboratoires
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Pourtant, sur
certaines
variables, un
début de
structuration
Regional nodal point (naturalist data)
SINP regional platform
SINP
National agregator
transmission
Research tools
on the INEE environment - Provide technical assistance
- Support good practices
-
Organize nodal points
Manage
International nodal points
Ocean
Biodiversity
Regional and national scale
International scale
Actors network
Marine stations (benthos and pelagos)
National nodal point
Database network
(all research establishment)
= interconnected information system in the environmental domain
Thematics networks
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Le Big Data en écologie? Diversité et complexité…
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
Quantité/Infrastru
cture
Complexité
Diversité
TraitementAccès
Re-utilisation
Préservation
Physique des Particules
Astrophysique
Ecologie
Comparaison de trois domaines dans le Big Data (Source PREDON)
2. Contexte multidisciplinaire
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Comment ne pas réussir à construire
une analyse avec des données
hétérogènes et non liées ?
3. Méthodes et outils
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Quel système intégratif ?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Quel système intégratif ?
Tout le monde veut les données de tout le monde
Besoins de mutualisation, partage
Pour les outils de conservation et d’utilisation des données
My PREEEECIOUSS DATABASE
1
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Quel système intégratif ?
2
Peu de centres de ressources
se donnent les moyens d’être vraiment accessibles
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Quel système intégratif ?
3
Les objectifs fixés pour la mise en places
de systèmes d’information métiers sont souvent pharaoniques
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Quel système intégratif ?
3
Les objectifs fixés pour la mise en places
de systèmes d’information métiers sont souvent pharaoniques
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Quel système intégratif ?
3
Les objectifs fixés pour la mise en places
de systèmes d’information métiers sont souvent pharaoniques
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
4
Les systèmes les plus complexes sont… désordonnés
Quel système intégratif ?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
5
Quel système intégratif ? Question : cycle de vie des objets : quelle complexité?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
5
Quel système intégratif ? Question : cycle de vie des objets : quelle complexité?
Peut devenir complexe au cours du temps
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Quel système intégratif ?
Défis techniques
à relever
Système d’information
-Distribué
- Interopérable
- Donnée tracée
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Comment construire une analyse avec des données
hétérogènes et non liées ?
3. Méthodes et outils
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Outil proposé: Les GRAPHES!!
Objets = Noeuds
Modalités des attributs = Liens
Principes :
Les objets présentant des valeurs
proches dans des contextes
comparables s’attirent mutuellement
Plus il y a de liens entre les données,
Plus le graphe est puissant et précis
Couleurs: Un autre attribut, non utilisé comme lien
Comment construire une analyse avec des
données hétérogènes et non liées ?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Quels sont les trois cas d'utilisation de bases de données « orientées graphe » les plus courants ?
Emil Eifrem, PDG de Neo Technology, dans un entretien avec ODBMS.org.
Temps réel
Détection
des fraudes
Données de
références
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Quels sont les trois cas d'utilisation de bases de données « orientées graphe » les plus courants ?
Emil Eifrem, PDG de Neo Technology, dans un entretien avec ODBMS.org.
Temps réel
Détection
des fraudes
Données de
références
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Des modèles de données simples
Plusieurs BDD accessibles
Contraintes techniques :
Traçabilité
Accessibilité
ID constant
(cycle de vie) Résolution
(via l’identifiant) des
données non-centralisées
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Couleurs: Un autre attribut, non utilisé comme lien
Comment construire une analyse avec des
données hétérogènes et non liées ?
Les objets peuvent être :
- Des sites géographiques
- Des observateurs
- Des taxons
- Des traits
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Couleurs: Un autre attribut, non utilisé comme lien
Comment construire une analyse avec des
données hétérogènes et non liées ?
Les objets peuvent être :
- Des sites géographiques
- Des observateurs
- Des taxons
- Des traits
- Des combinaisons de traits
- Des quadrats photographiques
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Les objets peuvent être :
- Des sites géographiques
- Des observateurs
- Des taxons
- Des traits
- Des combinaisons de traits
- Des quadrats photographiques
Ou encore… :
- Des définitions
- Des services
- Des concepts/idées
-Des combinaisons d’objets
- Des échantillons
- Des objets moléculaires
- Des photos
- Des groupes de citoyens
-
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Les objets peuvent être :
- Des sites géographiques
- Des observateurs
- Des taxons
- Des traits
- Des combinaisons de traits
- Des quadrats photographiques
Ou encore… :
- Des définitions
- Des services
- Des concepts/idées
-Des combinaisons d’objets
- Des échantillons
- Des objets moléculaires
- Des photos
- Des groupes de citoyens
-
Les liens peuvent être les
objets ou leurs attributs
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Pour construire des graphiques
avec plusieurs BDD,
tous les objets (NOEUDS)
& les modalités des facteurs (LIENS)
ONT BESOINS DE NORMES !!!
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Pour construire des graphiques
avec plusieurs BDD,
tous les objets (NOEUDS)
& les modalités des facteurs (LIENS)
ONT BESOINS DE NORMES !!!
Une colonne
vertébrale !
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Pour construire des graphiques
avec plusieurs BDD,
tous les objets (NOEUDS)
& les modalités des facteurs (LIENS)
ONT BESOINS DE NORMES !!!
Cette colonne vertébrale est
insuffisante et pas toujours
complètement utilisable
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
3. Méthodes et outils
Comment construire une analyse avec des
données hétérogènes et non liées ?
Objectifs du prototype VIGI-GEEK:
Créer des liens entre objets de différentes disciplines
Connecter les données sans les centraliser
Interface didactique (améliorer par étape le niveau des utilisateurs)
Conserver les nouveaux modèles
SORTIE : Flux unique exploitable par les centres de calculs
LE PROTOTYPE
VIGI-GEEK Un premier outils :
Un prototype pour construire des cartes dynamiques de
données et leurs liens possibles basés sur des Graphes
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Comment construire une analyse avec des
données hétérogènes et non liées ?
Objectifs du prototype :
Créer des liens entre objets de
différentes disciplines
Connecter les données sans les
centraliser
Interface didactique (améliorer par
étape le niveau des utilisateurs)
Conserver les nouveaux modèles
SORTIE : Flux unique exploitable par les
centres de calculs
Prérequis :
Des Flux pérennes contenant les objets,
les attributs et leurs valeurs
Normalisation ou correspondances
(thesaurus, ontologies)
Indexer : Connecter les données sans les
centraliser
Construire une communauté comportant
toutes les compétences nécessaires
Convaincre les financeurs du potentiel
de recherché pour l’écologie et d’autres
disciplines Nous en sommes là!!!
Un premier outils :
Un prototype pour construire des cartes dynamiques de
données et leurs liens possibles basés sur des Graphes
LE PROTOTYPE
VIGI-GEEK
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Structure du projet
4. Où en est on?
VIGI-GEEK est la cheville ouvrière non seulement pour créer de nouveaux
concepts à partir des données mais aussi pour convaincre et former !!
1. Web sémantique
Normalisation
Qualification
Interopération (open data?)
2. Cycle de vie et
qualité
Indexation
Traçabilité des transformations
Résolution de l’index
3. Concepts à partir
des données
Prototype de visualisation
Modélisation de Graphes
Re-qualification (thésaurus, ontologies)
4. Mise à
disposition des
matrices
Bancarisation des concepts
Mixe en place des FLUX « concepts »
Architecture de requête sur les FLUX
5. Calcul (Grille et
Mesocentres)
Dépôt de projets de calculs
Parcours de graphes
Vérification statistique
6. Démarche
opérationnelle
Bancarisation des motifs
Mixe en place des FLUX « opérationnels »
Opération par les outils d’aide à la décision
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Une interfaçage de graphes multidisciplinaire générique
4. Où en est on?
Phase de test et d’intégration des données
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
4. Où en est on?
Phase de test
et d’intégration
des données
+
Travail sur l’ergonomie et
les fonctions didactique
=
BESOIN DU SOUTIEN 2016
IMAG IN
(Workshop utilisateurs et matériel)
VISUALISATION - Nous en sommes :
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Prototype d’indexation, de visualisation et de fouille de
données hétérogènes en écologie
> Le prototype de construction de graphes
Un prototype pour graphes multidisciplinaires
Photoquadrats
FONCTIONNALITES DE L’INTERFACE DU PROTOTYPE :
OU EN SOMMES NOUS?
UTILISE DES FLUX DE BASES LOCALES (ex :
CIGESMED, bientot BASECO, EDB) OU
DISTANTES (Telabotanica, GBIF, SILENE…)
XML JSON CSV - … ou des sélections si service disponible
4. Où en est on?
Un prototype pour graphes multidisciplinaires
Photoquadrats
FONCTIONNALITES DE L’INTERFACE DU PROTOTYPE :
OU EN SOMMES NOUS?
GENERIQUE!!
Graphes sous forme
objets, attributs,
types d’attributs
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un prototype pour graphes multidisciplinaires
FONCTIONNALITES DE L’INTERFACE DU PROTOTYPE :
OU EN SOMMES NOUS?
GENERIQUE!!
Paramétrage de flux
distants.
Tout type de base peut être
connecté
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un prototype pour graphes multidisciplinaires
FONCTIONNALITES DE L’INTERFACE DU PROTOTYPE :
OU EN SOMMES NOUS?
GENERIQUE!!
Paramétrage
des OBJETS
Par type / par attributs ou
par valeurs d’attributs
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un prototype pour graphes multidisciplinaires
FONCTIONNALITES DE L’INTERFACE DU PROTOTYPE :
OU EN SOMMES NOUS?
GENERIQUE!!
Paramétrage
des LIENS
Par type / par attributs ou
par valeurs d’attributs
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un prototype pour graphes multidisciplinaires
FONCTIONNALITES DE L’INTERFACE DU PROTOTYPE :
OU EN SOMMES NOUS?
GENERIQUE!!
Visualisation des graphes, et
manipulation en ligne
(forme, couleurs et type
d’attraction pour les liens et
les objets) sur plusieurs bases
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un prototype pour graphes multidisciplinaires
FONCTIONNALITES DE L’INTERFACE DU PROTOTYPE :
OU EN SOMMES NOUS?
GENERIQUE!!
Possibilité d’exporter les flux
« sélection », et de leur créer une URL
permanente
Pour utilisation par un autre système
(ou calcul et parcours de graphes
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un prototype pour graphes multidisciplinaires
FONCTIONNALITES DE L’INTERFACE DU PROTOTYPE :
OU EN SOMMES NOUS?
OPEN SOURCE!!
Réplicable à volon
Projet de FORGE en cours
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un prototype pour graphes multidisciplinaires
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un prototype pour graphes multidisciplinaires
4. Où en est on?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Budget consommé VIGI-GEEK
4. Où en est on?
20 K euros, essentiellement des missions et animation
En 2015 :
Les investissements matériels
ont été repoussés à l’année 2
(20 K euros obtenus
sur 56 K euros demandés)
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
12 700
3 400
1 834
1 830
Dépenses 2015 VIGI-GEEK
Missions (Tous les intervenants colloque et communications) 12 700
Colloques (Logistique Séminaire IndexMed et 1 atelier) 3 413
Frais de fonctionnement : (SIP et IMBE) 1834
Petits Equipements (Tous les participants actifs) 1830
4. Où en est on?
Nous en sommes :
DES OUTILS
Un premier prototype de visualisation de graphes (outil didactique)
Un site web et une première version de système d’indexation
COMMUNAUTE PLURIDISCIPLINAIRE :
Chercheurs, majoritairement dans les sciences de l’environnement
1 année de présentation du projet dans chaque sphère disciplinaire,
et au sein des GDR (Ecostat, Madics, Predon…)
2 workshop : presentation du potential du projet et premiers travaux
Une expérimentation avec les outils d’astronomie (Projet INEE “Charlie”)
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un réseau renforcé, de nombreuses communications
4. Où en est on?
Plusieurs communications orales et posters d’un niveau national ou international
-150 manifestations d’intérêt - nombreux instituts concernés -
-1 chapitre (PREDON) et communications d’envergure nationale (9 communications orales et 6 posters)
-2 projets « risqués » soutenus financièrement par le CNRS
CHARLIEE (avril 2015) et Vigi-GEEK (juin 2015) … UN DEBUT?
-3 communications orales internationales
- Conférence annuelle 2015 du Biodiversity Information Standards, aussi connu en tant que Taxonomic Databases
Working Group (TDWG),28/09-01/10/2015, Nairobi, KE.
-European Marine Observations and Data Network (EMODnet) open conference, 20/10/2015, Ostende, BE
-11th International Conference on Signal-Image Technology & Internet-Based Systems (SITIS 2015). IEEE
Conference proceding; IEEE Xplore Digital Library 27/11/2015, Bangkok, Thailande
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Un réseau renforcé, de nombreuses communications
4. Où en est on?
Plusieurs communications orales et posters d’un niveau national ou international
Un réseau renforcé, de nombreuses communications
4. Où en est on?
Plusieurs communications orales et posters d’un niveau national ou international
En cours :
5. Prochaines étapes?
1) Génération de flux
contenant les paramètres, les
objets du graphe et les
valeurs de leurs liens
2) Validation de la significativité
des motifs de contextes via des
méthodes statistiques et de
fouille de données
3) Conservation des motifs de contextes et de leur fréquence
pour alimenter des outils d’aide à la décision/d’évaluation
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
En cours : 4ème atelier un outil sémantique pour l’interopérabilité
5. Prochaines étapes?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
En cours : 4ème atelier un outil sémantique pour l’interopérabilité
5. Prochaines étapes?
Objectif poursuivi :
Qualifier à large échelle
les objets de la biodiversité
D’une manière commune
(vocabulaire contrôlé, thésaurus et ontologie…)
= ORGANISER
LES ACTEURS
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
5. Prochaines étapes?
Nous en somme
Nos besoins :
Des compétences complémentaires
Pour travailler sur
- Les Possibilités de paramétrages des graphes
- Les fonctionnalités statistiques
- Les capacités des services de flux
- Les arbres de décision de choix de graphes
- Les parcours et analyses de graphes
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
5. Prochaines étapes?
Nous en somme
Nos besoins :
Des compétences complémentaires
Pour travailler sur
- Les Possibilités de paramétrages des graphes
- Les fonctionnalités statistiques
- Les capacités des services de flux
- Les arbres de décision de choix de graphes
- Les parcours et analyses de graphes
IMAG IN :
améliorations de l’interface
(passage à l’échelle + ergonomie)
Loutil est générique : élargissement disciplinaire possible
5. Prochaines étapes?
Exemple
de l’archéologie
bases de données
à un niveau européen
ARKEOGIS :
60 bases de données
50 000 sites
D’autres comme les palynologues
(EPD European Pollen Database )
Ou d’autres SI hors méditerranée
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Prochaines actions :
EN COURS
- workshop de 3 jours en 2016 Co-organisé avec Ecoscope (FRB) et le GBIF
-déclaration d’invention (SRPV CNRS) avec licence creative common
- communications au niveau Européen dans tous les réseaux d’observation (au sens large)
EN FONCTION des FINANCEMENTS
-Déploiement et test du prototype de visualisation, mise en place d’une Forge
-concours d’algorithmes pour l’exploitation des premiers graphes complexes construits avec
l’interface (intégration de nouveaux partenaires « visualisation » dont LIST et P5 Descartes)
- Une première expérimentation sur les infrastructures de calcul (soutien de France Grille)
… et bien sûr
des publications scientifiques . . .
Prochaines étapes?
Renforcement des moyens :
EN COURS
- Soutiens MI Big Data Aix Marseille Université / GDR Ecostat et Madics pour le workshop début
juin (déposé) + Soutien GBIF et Ecoscope obtenu (7000 euros)
- Soutien de MASTODONS qualité / qualification des données pour les graphes? (déposé)
- PEPS Blanc indexation des tweets et posts ALIIBAABA des PTT (déposé)
EN PREPARATION
- Une proposition de post doc co-portée par l’IMBE, et le LIF sur l’aspect fouille de graphes
- Dépôt d’une ANR MRSEI pour préparer un projet H2020
-Task et Work-packages H2020 en disciplines connexes (archéologie, palynologie, SHS moins
connectées à l’écologie)
Prochaines étapes?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
6. Perspectives?
L’interdisciplinaire entre sciences de l’homme et de
l’environnement nécessite les approches par les graphes…
Quelques
questions?
Journée de restitution IMAG IN, 24 - 25 février 2016
romain.david@imbe.fr
Article
Full-text available
Data produced within marine and terrestrial biodiversity research projects that evaluate and monitor Good Environmental Status, have a high potential for use by stakeholders involved in environmental management. However, environmental data, especially in ecology, are not readily accessible to various users. The specific scientific goals and the logics of project organization and information gathering lead to a decentralized data distribution. In such a heterogeneous system across different organizations and data formats, it is difficult to efficiently harmonize the outputs. Few tools are available to assist. For instance standards and specific protocols can be applied to interconnect databases. Such semantic approaches greatly increase data interoperability. This communication present the recent results and the consortium IndexMEED (Indexing for Mining Ecological and Environmental Data) activity that aims to build new approaches to investigate complex research questions, and support the emergence of new scientific hypotheses based on graph theory Auber et al. 2014). Current developments in data mining based on graphs, as well as the potential for relevant contributions to environmental research, particularly about strategic decision-making, and new ways of organizing data will be presented (David et al. 2015). In particular, the consortium makes decisions on how i) to analyze heterogeneous distributed data spread throughout different databases combining molecular and habitat characteristics data [3], ii) to create matches and incorporate some approximations, iii) to identify statistical relationships between observed data and the emergence of contextual patterns using a calculation library and distributed calculation center at the European level, iv) to encourage openness and sharing data while complying with the general principles of FAIR (Findable, Accessible, Interoperable, Re-usable and citable) in order to enhance data value and their utilization. IndexMEED participants are now exploring the ability of two scientific communities (ecology sensu lato and computer sciences) to work together, using several studies cases. The ECOSCOPE project aims to meet the need to access structured and complementary omics-datasets to better understand biodiversity state and its dynamics. Indeed, the ECOSCOPE case study targets to visualize, through the graph approach, links between datasets and databases from genetics to ecosystems. Another case study, displaying anthropology fossils and omics on the same graph, will also be presented. DEVOTES (DEVelopment Of innovative Tools for understanding marine biodiversity and assessing good Environmental Status) and CIGESMED (Coralligenous based Indicators to evaluate and monitor the "Good Environmental Status" of the MEDiterranean coastal water) European projects, conducted by IMBE, are focused on photo quadrats, cartography and omics data of the marine hard bottom in order to discover context patterns helpful to build decision support system building. Study case “65 Millions d’observateurs” French project is testing AskOmics to provide a graph-based querying interface using RDF (Resource Description Framework) and SPARQL technologies. Scientific questions can be resolved by the new data mining approaches that offer new ways to investigate heterogeneous environmental data with graph mining (Muñoz et al. 2017). The uses of data from biodiversity research demonstrate the prototype functionalities (David et al. 2016) and introduce new perspectives to analyze environmental and societal responses including decision-making at large scale, both at the information system level and the observing system level than at the observed system level.
ResearchGate has not been able to resolve any references for this publication.