Conference Paper

Résumé de flux d'événements dans les réseaux inter-véhiculaires

Université de Valenciennes
DOI: 10.1145/1739268.1739279 Conference: Actes des 5èmes journées francophones Mobilité et Ubiquité 2009, UBIMOB'09, 7-8 Juillet 2009, Lille, France
Source: DBLP
ABSTRACT
In this article, we focus en inter-vehicle ad hoc networks. In such networks, data are usually exchanged between vehicles to warn or inform the drivers when an event is detected (e.g., accident, emergency braking, available parking space, etc.). In this article, we propose de store and aggregate the data once used to produce a warning to the driver. We therefore use Flajolet-Martin sketches. Our goal is here to generate additional knowledge to assist drivers by detecting news road hazards (e.g., dangerous areas, etc.).

Full-text

Available from: Thierry Delot, Mar 14, 2014
Résumé de flux dʼénements
dans les réseaux inter-hiculaires
Bruno Defude
Institut TELECOM,
UMR CNRS SAMOVAR
9, rue Charles Fourier
91011 Evry Cedex, France
Bruno.Defude @ it-sudparis.eu
Thierry Delot
Université de Valenciennes,
LAMIH UMR CNRS 8530
Le Mont Houy
59013 Valenciennes, France
tdelot@univ-valenciennes.fr
Dorsaf Zekri
Institut TELECOM,
UMR CNRS SAMOVAR
9, rue Charles Fourier
91011 Evry Cedex, France
Dorsaf.Zekri@it-sudparis.eu
RESUME
Les travaux présentés dans cet article se concentrent sur
l’exploitation des données dans les réseaux ad hoc inter-
véhicules. Dans ces réseaux, les données sont généralement
échangées entre véhicules pour produire des alertes et informer
les conducteurs d’un événement (accident, freinage d’urgence,
place de stationnement disponible, etc.). Dans cet article, nous
proposons de conserver et d’agréger ces données lorsqu’elles
ont été utilisées pour informer ou avertir le conducteur. Nous
utilisons pour ce faire des sketchs de Flajolet-Martin. Notre
objectif est de générer ainsi de nouvelles connaissances en
utilisant pour cela les données précédemment collectées, afin
d’assister les conducteurs, en détectant par exemple les zones
potentiellement dangereuses.
MOTS CLES : Réseaux inter-véhicules, Flux d’événements,
Données spatio-temporelles, Agrégation des données.
ABSTRACT
In this article, we focus on inter-vehicle ad hoc networks. In
such networks, data are usually exchanged between vehicles to
warn or inform the drivers when an event is detected (e.g.,
accident, emergency braking, available parking space, etc.). In
this article, we propose de store and aggregate the data once
used to produce a warning to the driver. We therefore use
Flajolet-Martin sketches. Our goal is here to generate
additional knowledge to assist drivers by detecting news road
hazards (e.g., dangerous areas, etc.).
KEYWORDS: Inter-vehicles ad hoc networks, Event streams,
Spatio-temporal data, Data aggregation.
CATEGORIES AND SUBJECT DESCRIPTORS : C.2.4
[Computer-Communication Networks]: Distributed Systems -
distributed applications; H.3.4 [Information Storage and
Retrieval]: Systems and Software distributed systems
© ACM, (2009). This is the author’s version of the work. It is
posted here by permission of ACM for your personal use. Not
for redistribution. The definitive version was published in
UbiMob'09: Proceedings of the 5th French-Speaking
Conference on Mobility and Ubiquity Computing, Lille
(France), 7-8 July, 2009.
http://doi.acm.org/10.1145/{1739268.1739279}
INTRODUCTION
La communication inter-véhicules est un thème de
recherche récent. Des contributions intéressantes ont
déjà été proposées, en particulier en se qui concerne
l’échange d’information entre les véhicules [4, 5, 11, 13,
14, 16, 17]. Ces travaux ne considèrent toutefois les
données échangées entre les véhicules que comme des
éléments à transmettre. Une fois ces données utilisées,
elles sont considérées obsolètes et détruites. L’objectif
de nos recherches, est de pouvoir utiliser à posteriori ces
données collectées pour produire, au niveau du véhicule,
des connaissances sur l’environnement exploitable par le
conducteur. A titre d'exemple, les événements
concernant les places de stationnement disponibles reçus
par un véhicule peuvent être exploités, lorsqu'il n'y a
aucune place disponible diffusée par les autres véhicules,
pour déterminer l'endroit où la probabilité de trouver une
place libre est la plus importante (en fonction du jour et
de l'heure par exemple). Dans un autre contexte, grâce à
la corrélation des différents messages reçus sur les
accidents et les freinages d'urgence, les zones
dangereuses peuvent être dynamiquement détectées et
indiquées au conducteur, qu'elles soient continuellement
dangereuses ou seulement temporairement du fait des
conditions climatiques par exemple. Plusieurs techniques
d’agrégation développées dans le cadre des données
spatio-temporel existent dans la littérature [15] et un
travail préalable [3] a permis de spécifier une première
structure d’agrégation basée sur un simple comptage des
événements dans une cellule spatio-temporel. Cet article
étend ce travail en proposant une structure de données
plus efficace, capable d’éviter de compter plusieurs fois
une même occurrence d’événements observés par deux
véhicules différents. Une structure de découpage spatio-
temporel à deux niveaux nous permet également de
simplifier considérablement les algorithmes d’échange
en créant un référentiel commun à tous les véhicules
dans perdre leur autonomie en matière de choix de zones
d’intérêt. Enfin, chaque conducteur peut contribuer à
améliorer les performances des échanges en définissant
un ensemble de priorités analogue au data recharging.
Page 1
La suite de cet article est organisée de la manière
suivante. La section 2 présente notre vision globale. La
section 3 explicite notre décomposition spatio-
temporelle alors que la section 4 décrit la structure de
résumés choisie. La section 5 donne les principes de
notre protocole d’échange de résumés et nous concluons
en section 6 en nous positionnant relativement aux
travaux existants.
ARCHITECTURE GLOBALE
Nous considérons un ensemble de véhicules « intelligents »
capables d’offrir des services d’alertes et d’aide à la décision
aux conducteurs. Pour cela un véhicule i (voir figure 1) va
acquérir de l’information sous forme d’événements observés
soit par lui-même (via des capteurs par exemple), soit par
échange avec d’autres hicules. Ces informations sont bien
évidemment partielles puisqu’un véhicule ne peut pas
forcément tout percevoir. Il peut donc éventuellement acquérir
des informations d’une infrastructure. Par exemple, dans une
zone urbaine, cette infrastructure peut correspondre à une
centrale de gestion de parking ou à une centrale dinformations
trafic. Les événements observés ont une durée de vie en
général assez courte (de l’ordre de la minute à l’ordre de
l’heure selon leur nature). Pour éviter de perdre l’information
liée à ces événements, nous proposons dans cet article
d’agréger les événements passés de manière à disposer d’un
résumé permettant d’estimer si un événement est susceptible de
survenir même sans observation. Par exemple, si on a observé
que dans une zone donnée beaucoup d’accidents étaient
observés, on peut en déduire que cette zone est dangereuse
même si aucun n’a été observé à cet instant.
Un module de gestion d’alertes et d’aide à la décision au
conducteur peut donc tirer profit à la fois des événements
observés par le véhicule (ou d’autres), d’informations en
provenance d’une infrastructure, et des résumés qu’il a pu
construire (ou échanger avec d’autres). Seule change la
confiance que l’on peut avoir dans les informations, puisque les
résumés ne sont pas une information observée mais une
information probabiliste. On pourrait d’ailleurs intégrer un
mécanisme de renforcement/réduction de la confiance accordée
à un résumé en fonction du feedback du conducteur à la suite
d’une alerte ou d’une aide apportée.
Figure 1 : architecture globale
MODELE SPATIO-TEMPOREL A DEUX NIVEAUX
Chaque voiture doit conserver, en plus des éléments
actifs reçus, un résumé des événements passés. Dans la
suite, nous proposons une approche adaptée au contexte
des réseaux ad-hoc inter-véhicules. Notre approche
repose sur une agrégation simple du nombre
d’événements selon les dimensions spatiale et
temporelle. Selon les besoins exprimés ci-dessus, nous
avons besoin d’un modèle spatio-temporel permettant à
chacun de choisir ses propres zones d’intérêt mais aussi
d’un modèle qui se prête aux échanges d’informations
entre véhicules en minimisant les pertes d’informations.
Par exemple, il faut éviter de devoir diviser une zone car
il faut alors devoir répartir le nombre d’événements
observés entre les différentes parties de cette zone. Pour
prendre en compte ces deux besoins, nous proposons un
modèle spatio-temporel en deux niveaux (voir figure 2).
Le niveau le plus bas (ou niveau physique) constitue un
référentiel partagé entre tous les véhicules et assurant
donc l’échange d’informations sans perte. Il est découpé
en carrés de taille fixe qui forment une partition
complète. Nous procédons de même pour la dimension
temporelle : le temps est découpé en segments qui
forment une partition complète. Nous supposons ici que
l’on veut privilégier le caractère saisonnier des
productions d’événements. Nous proposons donc de
découper le temps en sept jours, eux-mêmes découpés en
tranche de deux heures, soit au total 84 segments
temporels. Le couple carré - segment temporel est la plus
petite unité pouvant comptabiliser des occurrences
d’événements. Cet espace physique est très grand : si on
suppose que la taille d’une cellule spatiale est de 1km
2
et
que l’on a 10 segments temporels, la couverture de la
France va représenter de l’ordre de 6 millions de
couples. Ce nombre pourrait être réduit si on structure
l’espace en zone de taille non fixe, ce qui permettrait
d’avoir une résolution spatiale meilleure dans les zones
urbaines (et donc une meilleure précision). Par contre
cela complexifie un peu l’algorithmique à mettre en
place.
En se basant sur ce niveau physique, chaque véhicule
peut construire son propre découpage logique constitué
d’un ensemble de rectangles (ou d’intervalles) eux-
mêmes constits d’un ensemble de carrés (ou
d’intervalles) du niveau physique (les rectangles rouges
sur la figure 2). Un conducteur peut ne pas s’intéresser à
tout l’espace et le nombre de carrés (intervalles)
réellement observés au niveau logique est donc très petit
relativement au niveau physique. Par exemple, si un
conducteur s’intéresse à une centaine de zones spatiales
couvrant en moyenne 20 km
2
, le nombre de couples sera
de l’ordre de 2000.
Page 2
Figure 2 : découpage uniforme de l’espace
CONSTRUCTION DES RÉSUMES DE FLUX
DʼÉVENEMENTS
De nombreux travaux de recherche se sont intéressés à la
transmission des informations entre les véhicules tout en
contrôlant leur cohérence sur des critères spatiaux
temporels [4, 5]. Des structures de résumés sont
construites pour générer de nouvelles connaissances afin
d’assister les conducteurs, en détectant par exemple les
zones potentiellement dangereuse.
Il existe une variété de techniques qui peuvent être
utilisées pour la construction des résumés de flux
d’événements spatio-temporels. Les critères importants à
assurer par les résumés sont :
favoriser les dimensions fondamentales que sont la
localisation et le temps;
être constructible de manière incrémentale et peu
coûteuse en temps de calcul et en espace de stockage;
permettre à chaque conducteur de choisir à quels types
d’événements il/elle s’intéresse et avec quelle échelle
spatiale et temporelle il/elle veut agréger;
permettre un échange des résumés entre les véhicules
pour enrichir leurs connaissances respectives.
Le troisième critère est assuré par notre structuration de
l’espace spatio-temporel en deux niveaux. Le premier
critère nécessite une représentation compacte alors que
le dernier critère implique que l’agrégation tecte les
dupliquas.
Le sketch de Flajolet-Martin [12] permet d’estimer le
nombre d’éléments distincts dans un ensemble. Ce
sketch a le mérite d’être incrémental et rapide, et de
détecter les dupliquas. L’idée consiste à estimer de
manière probabiliste le nombre d’éléments d’un
ensemble. Pour cela on utilise une chaîne de N bits
initialement remplie de 0. Pour chaque élément de
l’ensemble rencontré, une fonction de hachage est
appliquée qui renvoie une valeur entre 1 et N et le bit
correspondant est mis à 1. A un instant donné, le nombre
d’éléments n présents dans la chaîne est estimé par
n=1.29x2
k
avec k rang du premier bit à 0. La taille du
sketch doit aussi être définie relativement à la taille de
l’ensemble (plus la chaîne est grande meilleure est la
précision de l’estimation).
Ce sketch est notamment mis en œuvre dans [22] qui
propose une méthode d’index spatio-temporel basée sur
un arbre-R pour la partie spatiale et un arbre-B pour la
partie temporelle. La valeur stockée dans une cellule
d’un des arbres est un sketch et non un entier. Cette
structure peut parfaitement sappliquer dans notre cas,
mais peut être simplifiée dans notre cadre particulier de
maillage régulier de l’espace spatio-temporel.
Nous supposons que chaque véhicule V
i
peut observer
directement un ensemble d’événements E. Un
événement e de E est caractérisé par les informations
suivantes (ce sont les seules prises en compte pour le
résumé, mais d’autres informations peuvent être utiles
pour la gestion d’alertes ou la dissémination des
messages) :
ty
e
: il s’agit du type d’événement observé (accident,
libération place de parking, …) ;
lo
e
: il s’agit de la localisation géographique de
l’événement ainsi que son estampille temporelle. Ces
informations sont celles classiquement données par un
système de positionnement de type GPS ;
idf
e
: identifiant unique de l’occurrence d’événement
observé. Celui-ci est la base de la détection de
dupliqua. Nous supposons qu’une occurrence
d’événement produit toujours le même identifiant sur
le véhicule V
i
mais aussi sur les autres (on suppose
qu’un mécanisme détecte les dupliqua lors de la
dissémination des événements).
Nous posons les notations suivantes. L’espace physique
est découpé en carrés de taille de côté C
cp
(N sur laxe
des X et P sur l’axe des Y). Le point origine a pour
coordonnées (x
origine
, y
origine
). Une zone d’intérêt est
définie comme un rectangle construit sur un nombre
entier de cellules physiques. Elles peuvent être disjointes
ou se recouper. Une zone d’intérêt est définie par un
couple de cellules physiques : bas gauche de
coordonnées (i, j) et haut droit de coordonnées (k, l).
Nous supposons que avons g granularités temporelles
(ordonnée de 1 lundi de 0 à 2h à g vendredi de 22 à 24h).
Nous proposons de décrire les résumés par la structure
de données décrite dans la figure 3. Celle-ci est
constituée d’un ensemble de zones d’intérêts définies par
un identifiant unique (idf), deux cellules physiques (i, j,
k et l) et agrège des types d’événements (b booléen
indiquant si le type d’événement est agrégé dans la zone
et p pointeur sur une liste chnée de sketchs). Le tableau
des zones d’intérêt est trié selon les valeurs de i
croissantes.
Page 3
Figure 3 : structure de données de résumés
Chaque élément de la liste chaînée de sketchs est
caractérisé par une cellule physique (i, j) et g sketchs
agrégeant les événements observés dans la cellule pour
une granularité temporelle donnée. La liste a autant
d’éléments qu’il y a de cellules physiques dans la zone
d’intérêt. Le sketch est construit en appliquant une
fonction de hachage sur l’identifiant idf
e
de chaque
événement observé.
Les opérations suivantes sont définies sur cette structure
de données :
ajouter une zone d’intérêt : revient à créer une nouvelle
entrée dans la table des zones ;
supprimer une zone d’intérêt : revient à supprimer
l’entrée correspondante dans la table des zones ainsi
que les listes chaînées associées ;
ajouter un événement observé : il faut retrouver la (ou
les) zone(s) d’intérêt correspondant à la localisation de
l’événement. S’il y en a (au moins) une, on recherche
la cellule physique associée et le sketch correspondant
est mis à jour.
Ces trois opérations sont locales à un véhicule. Une
opération d’intersection entre deux zones d’intérêt est
aussi nécessaire pour faire l’échange de résumés entre
deux véhicules (voir section suivante).
Si on suppose qu’un véhicule observe P zones d’intérêts
composées en moyenne de M cellules physiques, avec K
types d’événements agrégés sur toutes les granularités
temporelles, la structure de résumé occupe l’espace
mémoire suivant :
Taille = P * [(5 octets + K bits + K pointeurs)] + K*M(2
octets + 1 pointeur + g sketchs)]
Soit pour P = 100, M = 100, K = 8, taille pointeur = 4
octets, sketch = 800 bits, g = 84 :
Taille = 100 * [(5 + 1+32)] + 5*100 (2+6+84*100)] =
4207800 octets, soit 4,2 M octets
La granularité temporelle g est un facteur important que
nous avons défini à 84 (portions de 2h). Si on réduit à 7
(granularité jour), la taille descend à 0,5 M octets
environ.
PROTOCOLE DʼECHANGES INTER-VÉHICULES
Chaque véhicule peut décider de publier tout ou partie de
ses résumés vers d’autres véhicules et réciproquement
peut être intéressé à souscrire à tout ou partie des
résumés des autres. Pour simplifier, nous ne considérons
ici que des publications et souscriptions publiques (on
publie/souscrit vers tous les véhicules). La publication
consiste à définir quels sont les résumés publiés
(éventuellement en les agrégeant). L’agrégation consiste
ici à regrouper des cellules. La souscription consiste à
définir des filtres indiquant les types d’événements qui
nous intéressent en y ajoutant le cas échéant des critères
spatiaux et temporels. Par exemple, je suis intéressé par
le type ”accidents” dans la zone ”Paris” sur le mois
dernier. L’échange d’informations entre véhicules peut
ensuite se faire soit par le biais de relais (par exemple
des serveurs localisés le long des routes), soit
directement. Dans les deux cas, il n’est pas sûr soit que
la durée d’échange soit suffisante pour permettre
l’échange complet des résumés. Nous proposons donc
d’utiliser un mécanisme de préférences tiré de [8] qui
permet de construire un ordre reposant sur la notion
d’utilité des données et d’utiliser cet ordre pour prioriser
l’échange.
Les priorités sont définies comme un ensemble règles
définissant un ordre entre deux éléments. Nous
proposons ici d’utiliser comme éléments les différents
types d’événements, les différentes granularités
temporelles pour traiter la dimension temporelle et les
différentes zones d’intérêt pour traiter la dimension
spatiale.
L’exemple suivant définit la politique de priorités
d’échanges d’un véhicule V
i
. L’expression suivante
décrit les types d’événements pour lesquels V
i
veut bien
recevoir de l’information (ici accident en premier puis
parking, les autres ne l’intéressent pas) :
(Exp 1) accident > parking
Si on suppose 10 granularités temporelles (g1 représente
la période la plus récente et g10 la plus ancienne),
l’expression suivante permet de finir que
systématiquement V
i
sintéresse aux résumés les plus
récents (les g6 à g10 ne feront pas l’objet d’échanges) :
(Exp 2) g1 > g2 > g3 >g4 >g5
De même, si on suppose 10 zones d’intérêt pour V
i
,
l’expression suivante permet de finir un ordre sur
celles-ci :
(Exp 3) ZI1 > ZI3 ; ZI2 > ZI4 ; ZI4 > ZI6 ; ZI6 > ZI8
Dans cet exemple, on a un ordre partiel avec ZI1 et ZI2
qui sont les zones prioritaires, puis ZI3 et ZI4, puis ZI6
et enfin ZI8. Les zones non citées ne sont pas concernées
par l’échange.
Page 4
Globalement, Exp1, Exp 2 et Exp 3 définissent la
priorité à suivre lorsque le véhicule V
i
va recevoir des
données d’un autre véhicule.
Lorsque V
i
rencontre V
j
et veut récupérer des résumés de
celui-ci, il commence par lui envoyer les informations
concernant ses priorités. V
j
calcule ensuite lintersection
entre ses résumés et les priorités envoyées et si elle est
non vide il va envoyer les données dans l’ordre de
priorité demandé. En fonction de la durée de la
connexion, tout ou partie des échanges sera réalisé.
L’opération de base à assurer ici est l’intersection entre
deux zones d’intérêt (une de chaque véhicule). Cette
intersection renvoie soit l’ensemble vide si les deux
zones sont distinctes, soit un ensemble de cellules
physiques s’il y a intersection. A partir de cet ensemble
de cellules communes, il suffit de faire le ou logique des
sketchs. Le coût de ce calcul d’intersection est
logarithmique en nombre de zones (pour déterminer les p
zones s’intersectant) et linéaire en nombre de cellules
physiques : O(log P + p * M)
Un autre écueil a éviter dans l’échange est les dupliquas :
il ne faut pas compter plusieurs fois les mêmes
événements. Ce problème est réglé par les approches de
comptage basées sur le hachage des clés d’événements.
Enfin, il faut aussi éviter d’échanger continuellement
avec les mêmes véhicules. Pour cela nous proposons de
stocker au niveau de chaque hicule une liste de taille
fixe des identifiants des N derniers véhicules avec
lesquels un échange a eu lieu, ainsi que l’estampille de
l’échange le plus récent. Si un véhicule candidat à
l’échange se trouve dans cette liste et que le temps
courant soit proche de l’estampille du dernier échange,
alors le véhicule ne sera pas sélectionné.
POSITIONNEMENT PAR RAPPORT AUX TRAVAUX
EXISTANTS
L’agrégation dans les réseaux inter-véhicules a jusqu’ici
été essentiellement considérée comme un moyen
d’optimiser le stockage ou d’économiser la bande
passante. Récemment, de nombreuses stratégies
d’agrégation ont été proposées dans le contexte des
réseaux de capteurs pour tenter notamment de réduire la
consommation d’énergie [19].
Toutefois, la forte mobilité des véhicules et la
concentration importante de véhicules dans certaines
zones géographiques rendent très difficile l’utilisation de
ces solutions dans le contexte des réseaux inter-
véhicules. De plus, la consommation d’énergie n’est pas
un problème dans notre contexte. Dans la suite, nous
présentons quelques travaux en lien avec lagrégation
dans les réseaux inter-véhicules :
Dans [20], les auteurs proposent RLSMP (Region-
based Location Service Management Protocol) qui
repose sur l’agrégation de messages en fonction de
zones géographiques. Leur but est de réduire les mises
à jour des positions et le nombre de messages générés
pour la gestion de les localisations des véhicules. Les
auteurs précisent toutefois que même si l’agrégation
améliore la montée en charge, elle peut également
conduire à :
1. plus de collisions de paquets et donc à plus de
retransmissions (essentiellement parce que les
paquets échangés sont de plus grande taille).
2. à des délais plus importants, du fait des
traitements réalisés sur les données avant
qu’elles puissent être effectivement envoyées.
Dans [19], les auteurs traitent des aspects sécurité, et
plus précisément de la détection des attaques consistant
à disséminer des messages contenant des données
agrégées erronées. Si l’agrégation peut réduire les
problèmes de bande passante, elle rend aussi les
problèmes de sécurité plus compliqués à gérer. La
solution proposée consiste en un service infalsifiable
déployé sur les véhicules. Deux types dagrégation
sont par ailleurs proposés : l’agrégation syntaxique, qui
réduit essentiellement la surcharge de messages et
l’agrégation sémantique, qui est spécifique à
l’information et permet d’économiser plus de bande
passante. La solution présentée dans l’article ne peut
toutefois pas être utilisée pour des événements tels que
des accidents (seulement pour des informations
concernant les voitures, telles que les vitesses ou les
localisations). De même, la -agrégation n’est pas
considérée et l’omission d’enregistrements par des
voitures malicieuses (pour calculer un agrégat) ne peut
pas être détecté.
Dans [17], les auteurs distinguent la compression des
données et l’agrégation des données. Seul le processus
d’agrégation des données considère la sémantique des
données. Différents algorithmes d’agrégation sont
proposés. L’algorithme « ratio_based » considère une
division de la route devant le véhicule en un ensemble
de segments. A chacun de ces segments est ensuite
associé un ratio d’agrégation. L’algorithme « cost-
based » vise quant à lui à minimiser le coût (basé sur
l’erreur introduite durant la fusion, le nombre de
véhicules affectés par l’agrégation, etc.) d’agrégation
des enregistrements.
Dans [11], les auteurs considèrent des véhicules qui
agrégent des données relatives à des avertissements
s’ils reçoivent plusieurs messages relatifs au même
événement. Ils proposent également l’utilisation de
messages d’invalidation lorsqu’un véhicule ne détecte
pas un danger dans une zone définie comme étant
dangereuse d’après les informations agrégées.
[14] propose une étude de l’agrégation hiérarchique
des données. La motivation de cette approche est qu’un
véhicule a besoin d’informations détaillées concernant
son voisinage. Les informations relatives à des zones
plus lointaines peuvent par contre être moins détaillées.
Un algorithme basé sur l’utilisation de sketchs Flajolet-
Martin est proposé pour stocker des informations
Page 5
approximatives. Par exemple, il est possible de
fusionner deux agrégats (même s’il y a un certain
recouvrement entre les deux) tout en évitant
l’apparition de dupliquas. La hiérarchie dagrégation
est prédéfinie dans la carte des données groupant des
zones en fonction de leurs relations naturelles (e.g., par
district ou routes). Dans le contexte des applications
spatio-temporelles, les sketches sont également utilisés
dans [22] comme un moyen d’éviter le problème du
comptage pour les requêtes définies avec des fonctions
d’agrégat count ou sum.
Dans [7], les auteurs proposent le protocole LBAG
(Location Based Aggregation). Dans ce protocole,
l’agrégation des données repose sur une hiérarchie de
localisations statiques au lieu de considérer une
structure d’arbre de uds qui serait particulièrement
difficile à maintenir du fait de la forte mobilité des
véhicules. Un protocole de communication Geocast
(basé sur un routage en fonction de la position et un
contrôle de la diffusion) est utilisé pour délivrer un
message dans une zone cible.
CONCLUSION & PERSPECTIVES
Le résumé des données est généralement vu comme une
méthode de compression d’informations dans le contexte
des réseaux inter-véhicules. Plusieurs travaux sont allés
dans ce sens. A notre connaissance, nous sommes les
premiers à s’intéresser aux résumés comme base de
construction d’une information approchée, permettant la
prise de décision même en absence dinformation
précise.
L’empreinte spatiale de notre structure d’agrégation des
données est réaliste si on maîtrise le nombre de
dimensions temporelles. La complexité des opérations
d’accès à la structure est également efficace
(logarithmique ou linéaire). Nos travaux actuels
consistent en une évaluation expérimentale de notre
solution. Pour cela nous utilisons le simulateur
d’événements développé pour le système VESPA,
permettant le partage d’informations entre véhicules
1
,
dont l’interface est présentée dans la figure 4.
1
Pour plus d’informations, consulter http://www.univ-
valenciennes.fr/ROI/SID/tdelot/vespa/
Figure 4 : Plate-forme expérimentale.
Ce simulateur, développé à l’origine pour évaluer les
gains des protocoles de communication inter-véhicules,
offre entre autres les fonctionnalités permettant de
simuler un parking sur lequel des véhicules cherchent
une place disponible, d’autres quittent la leur et en
informent les véhicules à proximité, etc.
Actuellement, nous étendons ce simulateur afin d’y
intégrer notre structure d’agrégation pour l’évaluer.
Notre objectif est d’y agréger des événements (e.g., les
places de stationnement libérées) afin de pouvoir
étudier :
Valider la taille de la structure d’agrégation.
Etudier la stabilisation de la structure. Lajout de
nouveaux événements dans la structure permet en
effet de l’enrichir. Il est toutefois important d’une
part d’y détecter les cycles (jour, semaine, etc.) et
d’autre part d’étudier le rapport entre le nombre
d’événements observé et la qualité des décisions
prises.
Etudier l’impact de notre structure d’agrégation sur
la prise de décision. Nous comparons pour ce faire
une approche naïve, chaque véhicule se gare
lorsque son conducteur peut voir la place, à une
approche où chaque véhicule est dirigé vers une
zone la probabilité de trouver une place est la
plus importante (probabilité calculée à partir de la
structure d’agrégation).
Dans cet article, nous nous sommes concentrés sur
l’apport des techniques d’agrégation de données sur les
systèmes d’alertes et d’aide à la décision. Ces systèmes
ont à gérer des informations qui nont pas toutes le
même niveau de précision. Dans ce contexte, les travaux
sur les bases de données probabilistes [3] constituent une
piste intéressante pour définir un évaluateur de requêtes
capable de manipuler toutes les informations.
REMERCIEMENTS
Page 6
Les auteurs remercient toute l’équipe VESPA et
particulièrement N. Cenerario, S. Ilarri et J.L Zechinelli
de tous leurs échanges fructueux.
BIBLIOGRAPHIE
1. Alon N., Matias Y. and Szegedy M. The space
complexity of approximating the frequency
moments, In Proc. of the 1996 Annual ACM Symp.
on Theory of Computing, pages 20-29, 1996.
2. Antova L., Jansen T., Koch C., Olteanu D. Fast
and Simple Relational Processing of Uncertain Data.
Proc. ICDE 2008.
3. Defude B., Delot T., Ilarri S., Zechinelli J.L,
Cenerario N.. Extraction de connaissances dans les
réseaux adhoc inter-véhicules, Proc. UbiMob’08,
Mai 2008, Saint Malo
4. Cenerario N. and Delot T., Evaluation continue de
requêtes dans les réseaux de communication inter-
véhicules. In Atelier INFORSID sur la Gestion de
Données dans les Systèmes d'Information Pervasifs
(GEDSIP'07), 2007.
5. Cenerario N., Delot T., and Ilarri S.,
Dissemination of information in inter-vehicle ad hoc
networks. In Intelligent Vehicles Symposium
(IV'08), 2008.
6. Charikar M., Chen K. and Farach-Colton M.
Finding frequent items in data streams, Theor.
Comput. Sci., 312(1):3-15, 2004.
7. Chen C.. Location-based data aggregation in
mobile ad hoc networks. Master’s thesis, Institut
f¨ur Parallele und Verteilte Systeme, 2003.
8. Cherniack M., Franklin M.J. and Zdonik S.,
Expressing User Profiles for Data Recharging, IEEE
Personal Communications: Special Issue on
Pervasive Computing, August 2001.
9. Chiky R., Defude B. and Hébrail G. Définition et
diffusion de signatures sémantiques dans les
systèmes pair-à-pair, EGC : 463-468, 2006.
10. Cormode G. and Muthukrishnan S., Improved
Data Stream Summary: The Count-Min Sketch and
its Applications, Technical report, 2003.
11. Eichler S., Merkle C., and Strassberger M..
Data aggregation system for distributing inter-
vehicle warning messages. In 31st IEEE Conf. on
Local Computer Networks), pages 543544,
November 2006.
12. Flajolet P. and Martin G. N. Probabilistic
counting algorithms for data base applications,
volume 31, pages 182-209, 1985.
13. Heinzelman W. R., Kulik J., and Balakrishnan
H., Adaptive protocols for information
dissemination in wireless sensor networks. In Int.
Conf. on Mobile Computing and Networking
(MobiCom'99), 1999.
14. Lochert C., Scheuermann B., and Mauve M.
Probabilistic aggregation for data dissemination
inVANETs. In 4th ACM International Workshop on
Vehicular Ad Hoc Networks (VANET'07), pages 1-
8, New York, NY, USA, 2007. ACM.
15. Lopez I. F. V., Snodgrass R., and Moon B.
Spatiotemporal aggregate computation: A survey.
IEEE Transactions on Knowledge and Data
Engineering, 17(2), 2005.
16. Morsink P., Hallouzi R., Dagli I., Cseh, L.
Schafers C., Nelisse M., and Bruin D. D., Cartalk
2000: Development of a cooperative adas based on
vehicle-to-vehicle communication. In Intelligent
Transport Systems and Services, 2003.
17. Nadeem T., S. Dashtinezhad, C. Liao, and L.
Iftode. TrafficView: Traffic data dissemination
using car-to-car communication. ACM Sigmobile
Mobile Computing and Communications Review,
Special Issue on Mobile Data Management, 8(3):6
19, 2004.
18. Nadeem T., Shankar P., and Iftode L., A
comparative study of data dissemination models for
VANETs. In 3rd Int. Conf. on Mobile and
Ubiquitous Systems (MOBIQUITOUS'06) -
Workshops, 2006.
19. Picconi F., Ravi N., Gruteser M., and Iftode L..
Probabilistic validation of aggregated data in
vehicular ad-hoc networks. In 3rd Int. Workshop on
Vehicular Ad Hoc Networks, pages 7685, 2006.
20. Rajagopalan R. and Varshney P.. Data-
aggregation techniques in sensor networks: a survey.
IEEE Communications Surveys & Tutorials,
8(4):4863, 2006.
21. Saleet H. and Basir O.. Location-based message
aggregation in vehicular ad hoc networks. In 2007
IEEE Global Communications Conference
Workshops, pages 17, November 2007.
22. Tao Y., Kollios G., Considine J., Li F., Papadias
D., Spatio-Temporal Aggregation Using Sketches,
20th International Conference on Data Engineering
(ICDE'04), 2004
23. Xu B., Ouksel A. M., and Wolfson O.,
Opportunistic resource exchange in inter-vehicle ad-
hoc networks. In 5th Int. Conf. on Mobile Data
Management, 2004.
Page 7
  • Source
    [Show abstract] [Hide abstract] ABSTRACT: In this paper we examine resource discovery in inter-vehicle ad-hoc networks in an urban area, where moving vehicles communicate with each other via short-range wireless transmission. Our focus is on real-time location-specific information. We explore an opportunistic approach to resource recovery, in which a vehicle obtains information about resources from encountered vehicles. The vehicle uses a spatio-temporal relevance function to sort the resources, and save only the most relevant ones. Our theoretical and experimental analysis indicates that the opportunistic exchange algorithm automatically limits the distribution of a resource to a bounded spatial area and to the duration for which the resource is of interest.
    Full-text · Conference Paper · Feb 2004
  • [Show abstract] [Hide abstract] ABSTRACT: In vehicular ad hoc networks, vehicles cooperate in receiving and delivering messages to each other in ad hoc manner without the need for an expensive fixed infrastructure. Nevertheless, inter-vehicle communications require solving the problem of message routing, where the location of the destination node is unknown due to node mobility and lack of adequate infrastructure. Hence, the problem of finding the location of the destination node (node localization) becomes very complex. One of the most recent solution approaches for node localization in VANET is to use location service management protocols. However, major impediments in leveraging such promising solutions include the large volume of signaling overhead which results from the increase in the number of vehicles and/or the non-local communication traffic in the network. In this paper, a region-based location service management protocol (RLSMP) is proposed. This protocol is a self-organizing framework, which uses message aggregation enhanced by geographical clustering to minimize the volume of the signaling overhead. RLSMP is the first protocol that uses message aggregation in querying, and promises scalability, locality awareness, minimum signaling overhead and maximum channel utilization.
    No preview · Conference Paper · Dec 2007
  • Source
    [Show abstract] [Hide abstract] ABSTRACT: Mobile devices need two basic renewable resources - power and data. Power recharging is easy; data recharging is a much more problematic activity. It requires complex interaction between a user and a collection of data sources. We provide an automatic data recharging capability based on user profiles written in an expressive profile language. A profile identifies relevant information and orders it by its usefulness. We discuss the issues involved in designing a profile language for data recharging
    Full-text · Article · Sep 2001 · IEEE Personal Communications
  • Source
    [Show abstract] [Hide abstract] ABSTRACT: Wireless sensor networks consist of sensor nodes with sensing and communication capabilities. We focus on data-aggregation problems in energy-constrained sensor networks. The main goal of data-aggregation algorithms is to gather and aggregate data in an energy efficient manner so that network lifetime is enhanced. In this article we present a survey of data-aggregation algorithms in wireless sensor networks. We compare and contrast different algorithms on the basis of performance measures such as lifetime, latency, and data accuracy. We conclude with possible future research directions.
    Full-text · Article · Feb 2007 · IEEE Communications Surveys & Tutorials
  • Source
    [Show abstract] [Hide abstract] ABSTRACT: The frequency moments of a sequence containing m i elements of type i, 1≤i≤n, are the numbers F k =∑ i=1 n m i k . We consider the space complexity of randomized algorithms that approximate the numbers F k , when the elements of the sequence are given one by one and cannot be stored. Surprisingly, it turns out that the numbers F 0 , F 1 , and F 2 can be approximated in logarithmic space, whereas the approximation of F k for k≥6 requires n Ω(1) space. Applications to data bases are mentioned as well. © Academic Press.
    Full-text · Article · Feb 1999 · Journal of Computer and System Sciences
  • Source
    [Show abstract] [Hide abstract] ABSTRACT: This paper focuses on intelligent transportation systems and more precisely on inter-vehicle ad hoc networks. Such networks are highly dynamic due to the movements of the vehicles and the short range of the wireless communications. Thus, for example, we can only rely on short interactions between the vehicles to exchange data about relevant events. We propose a new dissemination technique for vehicles to share information using V2V communications. Our goal is to make possible the exchange of information between vehicles when they encounter each other, taking into account the relevance of the data to the drivers. The originality of our proposal is that it relies on an encounter probability to disseminate data about any type of event (e.g., available parking spaces, obstacles in the road, information relative to the coordination of vehicles in emergency situations, etc.) in the network.
    Full-text · Conference Paper · Jul 2008
  • Source
    [Show abstract] [Hide abstract] ABSTRACT: VANETs (vehicular ad hoc networks) are emerging as a new network environment for intelligent transportation systems. Many of the applications built for VANETs will depend on the data push communication model, where information is disseminated to a group of vehicles. In this paper, we present a formal model of data dissemination in VANETs and study how VANET characteristics, specifically the bidirectional mobility on well defined paths, affects the performance of data dissemination. We study the data push model in the context of TrafficView, a system we have implemented to disseminate information about the vehicles on the road. Traffic data could be disseminated using vehicles moving on the same direction, vehicles moving in the opposite direction, or vehicles moving in both directions. Our analysis as well as simulation results show that dissemination using only vehicles in the opposite direction increases the data dissemination performance significantly.
    Full-text · Article · Jul 2006
Show more