PresentationPDF Available

Aller au-delà des données agrégées dans ArkeoGIS : utilisation de graphes au sein d'IndexMed

Authors:
  • Research fellow - Data Manager at ERINHA AISBL (European Research Infrastructure on Highly Pathogenic Agents)

Abstract and Figures

Le point commun des études en archéologie, biodiversité ou sur les systèmes sociaux est que la production de données est à la fois coûteuse et peu automatisée. Les suivis de longues séries temporelles et/ou à larges emprises spatiales sont difficiles à mener, dès lors qu’il faut recourir à plusieurs observateurs. La robustesse et la reproductibilité de l’observation est aussi plus difficile à obtenir. Dans un cadre de production de données multi-sources, l’équivalence des systèmes d’observations et l’inter-calibration d’observateurs deviennent cruciales. Des approches intégratives pluri- voire transdisciplinaires deviennent nécessaires, dans l’étude de systèmes où la production de données dans chaque discipline est discontinue, peu précise et mal répartie. Pourtant, toutes les variables (cartographie d’installations humaines, caractérisation des activités économiques, études des productions, recensements d’objets, données biotiques, abiotiques, cartographies des pressions anthropiques et naturelles, services rendus et ressentis, image sociétale,...) de ces systèmes interagissent dans le temps et à chaque échelle spatiale. Après quelques années d’existence, ArkeoGIS permet d’agréger à ce jour plus de 60 bases de données représentant plus de 50 000 objets (sites, analyses). Fort de cette normalisation de l’information archéologique et paléo-environnementale, il nous a semblé important d’utiliser de nouvelles méthodes de fouille de données afin de voir si des données « connexes » peuvent être reliées à ces jeux de donnée en archéologie. Le lien entre ArkeoGIS et EPD (european pollen database) nous a permis de mettre en place une requête croisée et de tester cette possibilité au sein d’un prototype développé par le consortium IndexMed. Ce prototype, en open source, permet la mise en place de liens entre objets de bases de données différentes. Le consortium IndexMed a pour objectif d’identifier puis de lever les verrous scientifiques liés à la qualité des données et leur hétérogénéité. L’utilisation de graphes permet de les considérer malgré leur disparité et sans les hiérarchiser, et améliore l’aide à la décision en utilisant des méthodes émergentes de fouille de données (clustering collaboratif, machine-learning, fouille de graphes, représentation de connaissances) ; adapter ces méthodes à l’archéologie nous permet d’aller au-delà de la « simple » agrégation de données. L’objectif : une meilleure compréhension globale des interactions historiques entre l’homme et la biodiversité qui sera permise par la construction et le test de méthodes de co-interprétation de ces données hétérogènes. Les méthodes de fouille de données apporteront de nouvelles perspectives aux recherches disciplinaires qui étudient en fin de compte des objets intimement liés (Lien entre données archéologiques et chimie environnementale, génomique, transcriptomique, métabolomique, écologie des peuplements/des paysages, systèmes socio-écologiques).
No caption available
… 
No caption available
… 
No caption available
… 
No caption available
… 
No caption available
… 
Content may be subject to copyright.
Aller au-delà des données agrégées dans ArkeoGIS : utilisation
de graphes au sein d'IndexMed
archéologie, indexmed, graphes, arkeogis, data mining
Bernard Loup <loup.bernard@unistra.fr> (1), David Romain <romain.david@imbe.fr> (2),
Féral Jean-Pierre <jean-pierre.feral@imbe.fr> (2),
Tatoni Thierry <thierry.tatoni@imbe.fr> (2), Blanpain Cyrille <cyrille.blanpain@osupytheas.fr> (3),
Lecubin Julien <julien.lecubin@osupytheas.fr> (3), Leydet Michelle <michelle.leydet@imbe.fr> (2)
1 - Université de Strabourg (France), 2 - Institut méditerranéen de biodiversité et d'écologie marine et continentale (France),
3 - OSU Pytheas (France)
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
2016 : ArkeoGIS 3.0
Bases inventaires françaises et allemandes
Patriarche & ADAB
Travaux de recherche (Master, Doctorat, chercheurs
confirmés…)-Archéologues et géographes
Ouvrages
Acteurs : Universités, services archéologiques,
opérateurs publics et privés
Liens vers d’autres bases en ligne
Et très bientôt, la version 4 !
www.arkeogis.org
66 bases, plus de 50 000 points
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Un outil opensource,
multiplateforme,
multilingue
Accessible depuis internet
Pas de coût pour l’utilisateur
Pas de logiciel à installer
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Construire une requête, le SIG pour tous
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Un outil pédagogique
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Analyse diachronique, franco-allemande
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Accès aux données
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Export CSV
Import de base (.CSV)
Un outil pour les contrats
Digital Managment Plan
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Un outil pour signaler ses outils
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Découverte de travaux préexistants sur la zone d’étude
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Mise en ligne de projets achevés
Mise en ligne de projets dont les
outils sont obsolètes
ANR/MRSEI
EURODIGITMAP
(Europe in the 1st Millenium BC)
À ce jour donc, des données hétéroclites, spatialisées et
standardisées
D'où la nécessité d'un outil novateur pour les visualiser
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Multi-scale Multi-formats Multi-sources…
Physical and Chimical levels
Genomic, cells, transcriptomic Proteomic, metabolimic, epigenetic
Habitats population levels
Phylogeography,
Ecosystem
functionning
Landscape, regional and human interactions levels
Sociology,
Economy,
Law and well being…
Which holistic approach for a patchwork of contexts at each level of organization?
Living organism levels
Context in Socio-ecological studies
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
However, we want to describe a
hardly multi-connected system with many interlinkages
Physico-chimical level
Molecular level
Organism level
Habitat and
community
levels
Human level
(Sociology,
Economy, Law,
Well being
Landscape and
regional levels
Context in Socio-ecological studies
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Factors are:
Socio-Ecological functionning is linked to a huge number
of factors, not easy to measure,
Indication « value » of factors is very dependant of the
context
numerous, with a huge local
variability
mixed, not easy (or presently
impossible) to measure
and moreover, they interact
(potentialization, antagonists,
cascade effects, etc.)
Context in Socio-ecological studies
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Mono-scale Mono-disciplinar,
Not well connected
Human
sciences
History
Archeology
Law
Economy
Sociolog
y
Vegetal
biology
Botany
Taxonomy
Palinology
Dendrolog
y
Phyto-
sociology
Animal
biology
Comportemen
tal biology
Anatomy
Taxonomy
Species
interactions
Trophic
studies
Molecular
Sciences
Phylogeneti
c
Phylog
eograp
hy
Polulation
genetic
Metage
nomic
Ecology
Functionning
Structure
study
GES
approaches
Indicators
Context in Socio-ecological studies
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
Human
sciences
History
Archeology
Law
Economy
Sociolog
y
Vegetal
biology
Botany
Taxonomy
Palinology
Dendrolog
y
Phyto-
sociology
Animal
biology
Comportemen
tal biology
Anatomy
Taxonomy
Species
interactions
Trophic
studies
Molecular
Sciences
Phylogeneti
c
Phylog
eograp
hy
Polulation
genetic
Metage
nomic
Ecology
Functionning
Structure
study
GES
approaches
Indicators
Due to an oversectored
specialization?
( ) x Region x Habitat…
Context in Socio-ecological studies
Mono-scale Mono-disciplinar,
Not well connected
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
quantifications as a base
+ « contemplative » ecology (X species, Y taxa…)
++ « comparative ecology »
+++ studying more than 2 parameters togethermultivariate
Current type
of analyses ?
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
2. IndexMed community & tools
Data science mostly used in money worlds :
Banks, insurances, social networks…
Why not for Archaeology???
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
2. IndexMed community & tools
Proposed tool: GRAPHS!!
Objects = Nodes
Attributes modalities = Links
Principle :
All objects with close values of
factors in comparable contexts
are attracted by each other.
More you have links between
data, more powerfull and
accurate can be the graph. Colors : another attribute non used as a link
- Definitions
- Services
- Concepts / ideas
- Combinatory objects
- Samplings population
- Molecular « objects »
- Photos
- Citizen groups
-
- Geographic objects
(sites)
- Transects
- Photo
- Observers
- Species /Taxas
- Traits / Artefacts
- Combinaison of traits /
Facies
Links can be all the objects or their attributes values
2. IndexMed community & tools
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
2. IndexMed community & tools
Simples data models
Several open databases
Technical needs :
Traceability
Accessibility
“Perennial” identifier
(cycle of life) Resolution
(via the index)
of non centralized data
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
2. IndexMed community & tools
Proposed tool
GRAPHS!!
Principle :
All objects which closed values
of factors in comparable
contexts are attracted together.
More you have links between
data, more powerfull and
accurate is the graph
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
2. IndexMed community & tools
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
2. IndexMed community & tools
1) Generating a stream
containing the setting and
objects of the graph and
their relationships
3) Conservation of patterns of contexts
and their frequency for other studies
2) EGI Place
JIAP, Paris, 9 juin 2016, romain.david@imbe.fr - loup.bernard@unistra.fr
http://arkeogis.org
bientôt en version 4
Open to your participation
Open source, simple datastructure
Open and non-centralized data
Open and free science
http://www.indexmed.eu
Questions?
ResearchGate has not been able to resolve any citations for this publication.
ResearchGate has not been able to resolve any references for this publication.