Conference PaperPDF Available

Nouvelle distance de graphe pour la reconnaissance d'objets 3D déformables basée sur la décomposition en étoiles-triangles

Authors:

Abstract and Figures

Nous traitons le problème de la comparaison des objets 3D déformables représentés par des graphes tels que les tessellations triangulaires. Nous proposons une nouvelle technique d'appariement de graphes pour mesurer la distance entre ces graphes. L'approche proposée est basée sur une nouvelle décomposition de tessellations triangulaires en étoiles-triangles. L'algorithme garantit un nombre minimum d'étoiles-triangles disjointes, offre une meilleure dis-similarité en couvrant un voisinage plus large et permet la création de descripteurs invariants face aux déformations les plus courantes. L'approche proposée est basée sur une approximation de la distance d'édition de graphes, qui est tolérante aux bruit et à la distorsion, ce qui rend notre technique particulièrement adaptée à la comparaison des ob-jets déformables. La classification est effectuée en utilisant des techniques d'apprentissage automatique supervisées. Notre approche définit un espace de métrique en utilisant des techniques de plongement et de noyaux de graphes. Il est prouvé que la distance proposée est pseudo-métrique. Sa complexité temporelle est déterminée et la méthode est évaluée en utilisant des bases de données de référence. Nos résultats expérimentaux confirment les performances et l'exactitude de notre système.
Content may be subject to copyright.
Nouvelle distance de graphe pour la reconnaissance d’objets 3D déformables
basée sur la décomposition en étoiles-triangles
Kamel Madi 1,3Eric Paquet 2Hamamache Kheddouci 1
1Université de Lyon, CNRS, Université Lyon 1, LIRIS, UMR5205, F-69622, France
2Conseil national de recherches, Ottawa, Canada
3Umanis, Levallois-Perret, 92300, France
kamel.madi@liris.cnrs.fr
Résumé
Nous traitons le problème de la comparaison des objets
3D déformables représentés par des graphes tels que les
tessellations triangulaires. Nous proposons une nouvelle
technique d’appariement de graphes pour mesurer la dis-
tance entre ces graphes. L’approche proposée est basée sur
une nouvelle décomposition de tessellations triangulaires
en étoiles-triangles. L’algorithme garantit un nombre mini-
mum d’étoiles-triangles disjointes, offre une meilleure dis-
similarité en couvrant un voisinage plus large et permet la
création de descripteurs invariants face aux déformations
les plus courantes. L’approche proposée est basée sur une
approximation de la distance d’édition de graphes, qui est
tolérante aux bruit et à la distorsion, ce qui rend notre tech-
nique particulièrement adaptée à la comparaison des ob-
jets déformables. La classification est effectuée en utilisant
des techniques d’apprentissage automatique supervisées.
Notre approche définit un espace de métrique en utilisant
des techniques de plongement et de noyaux de graphes. Il
est prouvé que la distance proposée est pseudo-métrique.
Sa complexité temporelle est déterminée et la méthode est
évaluée en utilisant des bases de données de référence.
Nos résultats expérimentaux confirment les performances
et l’exactitude de notre système.
Mots Clés
Appariement de graphes, Distance d’édition de graphes,
Décomposition de graphes, Plongement de graphes, Mé-
trique de graphes, Classification de graphes, Reconnais-
sance de motifs, Reconnaissance d’objets 3D, Reconnais-
sance d’objets déformables, Apprentissage de métrique.
1 Introduction
La comparaison des objets 3D est l’une des tâches les plus
importantes en vision artificielle. Les objets représentés par
des graphes tels que des maillages triangulaires, peuvent
Cet article est une adaptation en langue française de notre article
"New graph distance for deformable 3D objects recognition based on
triangle-stars decomposition" [1] publié le 28 janvier 2019 dans la revue
internationale Pattern Recognition
être comparés en utilisant des techniques d’appariement
de graphes. Dans un graphe, les propriétés sont associées
à des sommets tandis que les relations sont représentées
par des arêtes. Les sommets, les arêtes et leurs attributs
sont spécifiés en fonction de l’application sous-jacente ; par
exemple, les sommets peuvent représenter des points, des
régions d’intérêt ou toutes autres sous-structures obtenues
en appliquant un processus de réduction de données tel que
la segmentation. Les arêtes sont associés à la connectivité
entre sommets, définissant ainsi une relation topologique
entre eux, tels que la proximité, l’adjacence, etc. L’appa-
riement de graphes est le processus permettant de trouver
une correspondance entre les sommets et les arêtes de deux
graphes qui satisfait un ensemble de contraintes, garantis-
sant que les sous-structures d’un des graphes correspond
à des sous-structures similaires dans l’autre graphe. Plu-
sieurs approches ont été proposées pour résoudre le pro-
blème d’appariement de graphes [2, 3]. La distance d’édi-
tion de graphes est l’une des mesures les plus célèbres pour
déterminer une telle distance [4]. Elle est définie comme
étant le coût minimal de séquences d’opérations d’éditions
qui transforment un graphe en un autre. La tolérance au
bruit est l’un des avantages de la distance d’édition. Mal-
heureusement, cette dernière a une complexité très élevée
qui augmente exponentiellement en fonction du nombre de
sommets [5]. Dans cet article, nous abordons le problème
de la comparaison des objets 3D déformables. Les objets
sont représentés par des graphes. Nous proposons une nou-
velle distance pour comparer des objets 3D déformables.
Cette distance est basée sur la décomposition de tessel-
lations triangulaires en un ensemble de nouvelles sous-
structures appelées étoiles-triangles. Une étoile-triangles
est une composante connexe formée par l’union d’un tri-
angle et de l’ensemble des triangles voisins, en fonction du
degré de voisinage considéré. La décomposition proposée
offre une représentation paramétrable des étoiles-triangles,
laquelle est déterminée en fonction du degré de voisinage
attribué (Définition 4). Le nombre d’étoiles-triangles ré-
sultantes est bien inférieur au nombre de sommets et au
nombre d’étoiles classiques [6]. Par conséquent, la com-
plexité temporelle est réduite. La mesure de dissimilarité
proposée assure une meilleure approximation de la dis-
tance d’édition de graphes. En effet, considérer des struc-
tures en étoiles-triangles permet de couvrir un voisinage
plus large en plus de conférer un descripteur local plus
riche comparé aux étoiles classiques [6]. Avec la distance
proposée, il est possible de construire un ensemble de des-
cripteurs qui soient invariants et robustes face aux défor-
mations les plus courantes. La classification est réalisée en
utilisant des techniques d’apprentissage supervisées. Notre
approche définit un espace de métriques décrivant les diffé-
rents objets. Cinq classificateurs ont été utilisés, à savoir :
le classificateur naïf de Bayes, le classificateur des forêts
aléatoires, l’approche des arbres boostés par gradient, le
classificateur à vaste marge (SVM) et la régression logis-
tique. Le reste de l’article est organisé comme suit : dans
la Section 2, nous passons brièvement en revue certains
travaux connexes. La décomposition proposée est décrite
dans la Section 3 tandis que la distance proposée est in-
troduite dans la Section 4. Dans la Section 5, nous présen-
tons et discutons nos résultats expérimentaux en les com-
parant avec des algorithmes de comparaison d’objets dé-
formables, pour une base de données de référence. Enfin,
la Section 6 conclut l’article.
2 État de l’art
Dans cette section, nous passons brièvement en revue
certaines méthodes de reconnaissance des objets 3D. Pour
plus de détails, nous invitons les lecteurs à s’orienter vers
[7] pour les méthodes de reconnaissance des objets 3D et
vers [5] pour les techniques de reconnaissance de formes
et d’appariement de graphes. Nous présentons ensuite,
brièvement, les algorithmes avec lesquels nous comparons
notre approche.
Les techniques de comparaison des objets 3D peuvent
être divisées en trois grandes classes [7] : les méthodes à
base de caractéristiques, les méthodes à base de graphes
et les autres méthodes. Concernant les méthodes à base de
caractéristiques, les objets sont comparés en utilisant des
caractéristiques associées à leurs propriétés géométriques
et topologiques. Ces caractéristiques peuvent être des
cartes globales, locales ou spatiales [8]. Les méthodes
à base de graphes sont des outils puissants pour établir
des correspondances entre des objets ainsi que pour
produire des descripteurs invariants. Selon le type de
graphe considéré, plusieurs techniques à base de graphes
ont été proposées pour la comparaison des objets 3D [7].
Par exemple, dans certaines approches, les formes sont
réduites à des squelettes par un processus d’amincissement
[9]. Les squelettes ainsi obtenus sont comparés en utili-
sant des techniques d’appariement de graphes. D’autres
approches s’appuient sur des graphes de Reeb, construits
à partir des fonctions de correspondances définies sur
les variétés correspondant aux formes [10]. Diverses
techniques de segmentation ont été proposées dans la
littérature, dans lesquelles les formes sont segmentées en
un ensemble fini de composantes à partir desquelles un
graphe est construit. Ces graphes peuvent être comparés
en utilisant des techniques d’appariement de graphes [11].
D’autres méthodes ont été proposées [7], telles que : la
similarité à base des vues [12], la similarité à base des
erreurs volumétriques [13] et la similarité à partir d’un
ensemble de points pondérés [14].
Nous comparons l’approche proposée avec divers al-
gorithmes de l’état de l’art associés aux compétitions
SHREC. Ces algorithmes correspondent à la base de don-
nées utilisée pour leurs évaluations, à savoir la base de
données TOSCA [15]. Par conséquent, notre méthode a
été comparée aux algorithmes suivants : CAM [16] : une
approche dans laquelle les surfaces sont représentées par
des courbes 3D extraites autour de points caractéristiques.
GeodesicD2 : Une description globale consistant en la dis-
tribution des distances géodésiques associées à une forme
3D donnée [17]. DSR [18] : le vecteur de caractéristiques
hybride est une combinaison de deux descripteurs basés sur
les vues : un tampon de profondeur pour la silhouette et
une fonction radiale d’étendue. RSH [19] : L’approche par
rayons avec représentation harmonique sphérique est une
méthode qui aligne les modèles sur une position canonique,
détermine les étendues maximales à laquelle elle applique
une décomposition en harmoniques sphériques. TD [20] :
le descripteur de distribution de température est un descrip-
teur de forme basé sur le noyau de chaleur. La norme L2
est utilisée pour évaluer la distance entre les descripteurs.
Shape-DNA [21] : Shape-DNA est une empreinte numé-
rique obtenue en évaluant les valeurs propres de l’opéra-
teur de Laplace-Beltrami associé à la variété. La corres-
pondance entre deux objets est obtenue en comparant leurs
valeurs propres respectives. SRCP-TD [22] : Le SRCP-TD
est une méthode basée sur une représentation fragmentée
d’un noyau de chaleur invariant par rapport à l’échelle. Les
auteurs utilisent les fonctions propres de Laplace-Beltrami
pour détecter des points critiques sur la variété. Le descrip-
teur est construit à partir des valeurs du noyau de chaleur
sur ces points. Une représentation fragmentée est utilisée
pour réduire la dimensionnalité du descripteur.
3 Une nouvelle approche de décom-
position en étoiles-triangles
Dans cette section, nous proposons une nouvelle décompo-
sition de maillages triangulaires en composantes connexes
que nous appelons étoiles-triangles. Cette décomposition a
comme objectif de réduire le nombre de composants tout
en couvrant un voisinage plus large. L’étendue du voisi-
nage associé à une étoile-triangles est déterminée par son
ordre Nk. A partir de cette représentation, il est possible
de définir un ensemble de descripteurs qui soient invariants
et robustes aux déformations les plus courantes. Un ordre
total strict sur les triangles doit être établi avant de procé-
der à la décomposition. Cet ordre vise à réduire le nombre
d’étoiles-triangles générées tout en garantissant l’unicité de
la décomposition.
3.1 Étoiles-triangles
Nous proposons de décomposer des graphes tels que des
tessellations triangulaires en un ensemble de composants
connectés que nous appelons étoiles-triangles (T S). Les
étoiles-triangles sont définies comme suit :
Définition 1 (Voisinage d’un triangle) Deux triangles
sont voisins s’ils partagent au moins un sommet commun.
Soient t1et t2deux triangles et V(t1)et V(t2)leurs som-
mets respectifs. t1et t2sont voisins ⇔ kV(t1)V(t2)k>
0. En d’autres termes, le voisinage (N) d’un triangle test
constitué de tous les triangles partageant au moins un som-
met commun avec t.
Définition 2 (Nk-voisinage d’un triangle) Deux tri-
angles t0et tksont Nk-voisins si entre t0et tkil y a, au
plus, une chaîne de (k1) triangles distincts, qui sont
consécutivement deux à deux voisins. Formellement, t0et
tksont Nk-voisins ti=1...k1où : i1...(k
1), tiet ti+1 sont voisins. Dans le cas de k= 1, le
Nk-voisinage est réduit à un voisinage simple (Définition
1).
Définition 3 (Étoile-triangles) Une étoile-triangles ts
est un sous-graphe étiqueté, défini par un triangle et l’en-
semble formé par ses voisins. Formellement, une étoile-
triangles ts est un triplet ts = (tr, T 0, θ), où : trest le
triangle racine, T0est l’ensemble des triangles voisins et
θ:TLTest la fonction d’étiquetage des triangles, tan-
dis que LTreprésente l’ensemble des étiquettes.
Définition 4 (Nk-étoile-triangles) Une Nk-étoile-
triangles Nk-ts est une étoile-triangles définie par un
triangle et l’ensemble de ses Nkvoisins. Dans le cas de
k= 1, la Nk-étoile-triangles est une simple étoile-triangles
(Définition 3).
Les caractéristiques de l’étoile-triangles un six-uplet
tj= (v1, v2, v3, e1, e2, e3)est associé à chaque tri-
angle tj. Les sommets visont étiquetés par leurs coor-
données cartésiennes respectives vi= (x, y, z), tandis
que les arêtes ek= (vp, vw)sont étiquetées (pondérées)
avec la distance euclidienne entre leurs sommets respec-
tifs (vp, vw). Les triangles sont étiquetés avec un triplet
tj= (id, Area, P erimeter), où id est un nombre. Chaque
étoile-triangles est caractérisée par un ensemble de des-
cripteurs permettant d’évaluer la dissimilarité entre étoiles-
triangles. Nous considérons les descripteurs suivants :
la surface de l’étoile-triangles, le périmètre de l’étoile-
triangles, la surface des triangles formant les étoiles-
triangles, leurs périmètres, les poids associés à leurs arêtes
et les degrés de leurs sommets. Notre choix de descripteurs
est justifié par le fait que ces quantités sont invariantes face
aux déformations les plus courantes.
La représentation en vecteurs des étoiles-triangles Un
vecteur est associé à chaque étoile-triangles. Ce vecteur
comprend la surface globale AG et le périmètre global P G
d’une étoile-triangles, la surface Aet le périmètre Pde
chaque triangle appartenant à l’étoile-triangles, les poids
associés à leurs arêtes W, ainsi que les degrés Deg asso-
ciés à leurs sommets. Ce vecteur est défini comme suit :
{AG(ts), P G(ts),{A(ti), P (ti), W (ti, j=1...3),
Deg(ti, j =1...3)}i=kT(ts)k
i=1 }
Les différentes variables sont décrites dans la Table 1. Les
triangles appartenant à l’étoile-triangles ts sont classés par
ordre décroissant de leurs surfaces (A). Les poids et les
degrés sont également classés par ordre décroissant. Tous
les vecteurs des étoiles-triangles T S ont la même taille :
size = 2 + (8 Γ), où Γest le nombre maximum des tri-
angles dans les étoiles-triangles. Si une étoile-triangles ts
a un nombre de triangles inférieur à Γ, les entrées non at-
tribuées sont complétées par des zéros.
Définition 5 (Étoiles-triangles disjointes) Deux étoiles-
triangles tsiet tsjsont disjointes s’ils ne partagent pas,
au moins, un triangle commun. Soit i6=j, si tsiet tsj
sont disjointes T(tsi)T(tsj) = .
Symbole Description
ti,l Triangle tlappartenant à l’étoile-triangles tsi:tltsi
Wi,l,k Poids (distance euclidienne) de l’arête ekappartenant au triangle tltsi
Degi,l,k Degré du sommet vkappartenant au triangle tltsi
Γle nombre maximum des triangles dans les étoiles-triangles
αR6
+Les paramètres associés avec les descripteurs où |α|1= 1
A(ti)Surface du triangle i.
P(ti)Périmètre du triangle i.
AG(tsi)Surface de l’étoile-triangles i.AG(tsi) = Pj=kT(tsj)k
j=1 A(tj)
P G(tsi)Périmètre de l’étoile-triangles i.P G(tsi) = Pj=kT(tsj)k
j=1 P(tj)
TABL E 1 – Les symboles associés à la mesure de dissimi-
larité ainsi que leur description.
3.2 Ordonnancement des triangles
La décomposition proposée génère des étoiles-triangles
disjointes (Définition 5), ce qui réduit considérablement le
nombre de composants (kT SkkVk<kTk) ainsi que
le nombre de comparaisons impliquées dans le processus
d’appariement des deux graphes. Cependant, en fonction
de l’ordre considéré, les étoiles-triangles obtenues peuvent
différer. En effet, une même tessellation peut générer diffé-
rents ensembles d’étoiles-triangles si l’ordre des triangles
considéré n’est pas identique.
Afin de garantir l’unicité de la décomposition et de ré-
duire davantage le nombre d’étoiles-triangles, un ordre to-
tal strict décroissant sur l’ensemble des triangles doit être
établi avant leur décomposition en étoiles-triangles. En
considérant kV oisins (T riangl es)kavec ordre décrois-
sant, nous générons un nombre plus petit d’étoiles-triangles
T S (comme nous le montrons dans les expérimentations),
contribuant ainsi à la réduction de la complexité tempo-
relle.
Afin d’établir un ordre total strict décroissant sur l’en-
semble des triangles, chaque triangle tiest représenté par
un vecteur {kN(ti)k,{xi,j , yi,j , zi,j}j=3
j=1} ∈ R10 qui cor-
respond au nombre des voisins kN(ti)ket aux coordon-
nées cartésiennes x, y, z associées aux sommets formant le
triangle ti. Il est clair que les coordonnées et par consé-
quent l’ordre des triangles peuvent être affectés par une
rotation de l’objet. Pour résoudre ce problème, les coor-
données sont exprimées dans le repère défini par les vec-
teurs propres du tenseur d’inertie associé aux sommets. Le
nombre de voisins kN(ti)kest utilisé pour réduire davan-
tage le nombre d’étoiles-triangles. Si deux triangles ont le
même nombre de voisins, les coordonnées du sommet sont
utilisées pour garantir l’unicité de la décomposition. Les
sommets du vecteur (10-uplet) sont classés lexicographi-
quement en fonction de leurs coordonnées.
3.3 La décomposition en étoiles-triangles
Une fois que l’ordre total strict des triangles a été établi, la
décomposition du graphe en étoiles-triangles peut être ef-
fectuée. Ce processus est décrit dans l’Algorithme 1. Selon
l’ordre établi pour les triangles (ordre total strict décrois-
sant), la première Nk-étoile-triangles est construite à par-
tir du premier triangle et de ses Nk-voisins (Définition 4)
qui n’appartiennent à aucune autre Nk-étoile-triangles. En-
suite, l’ensemble des triangles et des Nk-étoiles-triangles
résultantes sont mis à jour. Le processus est ainsi répété
jusqu’à ce qu’il ne reste plus de triangles non associés à
une Nk-étoile-triangles.
La décomposition proposée génère un nombre réduit
d’étoiles-triangles ts par rapport au nombre de sommets
kT SkkVk. Les étoiles-triangles résultantes sont dis-
jointes (Définition 5) et couvrent une zone locale plus
large que les étoiles classiques. Cette décomposition est
également paramétrable en fonction du degré de voisi-
nage. En effet, plus le degré de voisinage est élevé, plus le
nombre d’étoiles-triangles est petit (kNk+1-T S k ≤ kNk-
T Sk) tout en couvrant un voisinage plus large (kT(Nk+1-
T S)k≥kT(Nk-T S)k). De plus, la décomposition pro-
posée est unique.
Algorithm 1 Décomposition en Nk-étoiles-triangles.
1: Entrées : Un graphe Gtr et le degré de voisinage Nk.
2: Sorties : Un ensemble de Nk-étoiles-triangles (Nk-T S).
3: Début
4: Appliquer un ordre total strict descendant sur les triangles
5: Nk-T S =;
6: Tant que (T(Gtr)6=)faire
7: ti=T(Gtr)[0]
8: T(Nk-tsi) = tiNk-voisins(ti);
9: Nk-T S =Nk-TS Nk-tsi;
10: T(Gtr) = T(Gtr )T(Nk-tsi);
11: fin Tant que
12: retourner Nk-T S ;
13: Fin
Exemple 4. La Table 2 montre les correspondances ré-
sultantes en termes d’étoiles-triangles, en utilisant notre
approche T SM avec différents degrés de voisinage, entre
deux poses de quatre objets appartenant à la base de don-
nées TOSCA.
david0 ×david6 -N7david10 ×david5 -N8
gorilla1 ×gorilla0 -N8horse10 ×horse16 -N8
TABL E 2 – La correspondance, en utilisant notre approche
T SM avec différents degrés de voisinage, entre deux poses
de quatre objets appartenant à la base de données TOSCA.
4 Une nouvelle distance pour les tes-
selations de triangles : description
de l’algorithme
Dans cette section, nous proposons une nouvelle distance
entre les étoiles-triangles de deux tessellations triangulaires
pour trouver leur appariement.
4.1 Distance d’édition entre étoiles-triangles
Nous introduisons d’abord la distance d’édition de graphes
entre étoiles-triangles. La mesure de dissimilarité propo-
sée est définie pour être appliquée aux objets déformables.
En conséquence, l’ensemble des descripteurs doivent être
invariants aux déformations les plus courantes. La me-
sure de dissimilarité est basée sur les paramètres sui-
vants : la surface AG et le périmètre P G de l’étoile-
triangles, la surface Aet le périmètre Pdes triangles,
les poids Wdes arêtes et les degrés Deg de sommets.
Formellement une étoile-triangles est représentée comme
suit : {AG(ts), P G(ts),{A(ti), P (ti), W (ti, j=1...3),
Deg(ti, j =1...3)}i=kT(ts)k
i=1 }. La mesure de dissimilarité d
entre deux étoiles-triangles tsiet tsjest définie par :
d(tsi, tsj) =
k=6
X
k=1
dsimk(tsi, tsj)(1)
La mesure dissimilarité dest normalisée (0d1) et
nécessite la définition de six fonctions auxiliaires dsimk.
Ces fonctions sont définies comme suit :
dsimk(tsi, tsj) =
α1|AG(tsi)AG(tsj)|
AGMAX si k= 1
α2|P G(tsi)P G(tsj)|
P GMAX si k= 2
α3Pl
l=1 |A(T(tsi)l)A(T(tsj)l)|
AMAX Γsi k= 3
α4Pl
l=1 |P(ti,l)P(tj,l )|
PMAX Γsi k= 4
α5Pl
l=1 Pk=3
k=1 |Wi,l,k Wj,l,k |
3WMAX Γsi k= 5
α6Pl
l=1 Pk=3
k=1 |Degi,l,k Degj,l,k |
3DegM AX Γsi k= 6
(2)
Telle que Pk=6
k=1 αk= 1.
dsim1(tsi, tsj)et dsim2(tsi, tsj)comparent respective-
ment la surface AG et le périmètre P G de deux étoiles-
triangles tsiet tsj.dsim3(tsi, tsj)et dsim4(tsi, tsj)
comparent respectivement la surface Aet le périmètre P
de leurs triangles respectifs. Tandis que dsim5(tsi, tsj)
et dsim6(tsi, tsj)comparent respectivement les poids
Wassociés à leurs arêtes respectives et les degré Deg
des sommets correspondants. Les symboles associés à la
mesure de dissimilarité sont définis dans la Table 1.
4.2 Distance d’édition entre deux tessella-
tions triangulaires
Le calcul de la distance entre deux tessellations trian-
gulaires représentés par des étoiles-triangles constitue la
dernière étape de notre algorithme. Nous appelons cette
mesure de dissimilarité T SM . Cette mesure détermine
le meilleur appariement possible entre deux ensembles
d’étoiles-triangles. La dissimilarité entre deux ensembles
d’étoiles-triangles est définie comme suit :
Définition 6 (T SM )Soient gT r1et gT r2deux tes-
sellations triangulaires, T S1et T S2leurs ensembles
d’étoiles-triangles correspondants, Ml’ensemble de tous
les appariements possibles entre T S1et T S2, et mM
la fonction de correspondance. La mesure de dissimilarité
T SM (T S1, T S2)(dissimilarité normalisée) est définie
comme suit :
T SM (T S1, T S2) =
minmMPtsiT S1, m(tsi)T S2d(tsi, m(tsi))
max(kT S1k,kT S2k)(3)
Le calcul de T SM (T S1, T S2)est équivalent à la ré-
solution du problème d’affectation, qui est l’un des pro-
blèmes fondamentaux d’optimisation combinatoire qui
vise à trouver le minimum/maximum coût de corres-
pondance dans un graphe bipartite pondéré. Pour ré-
soudre ce problème d’affectation, nous définissons une
matrice D n ×n, tel que nest donné par n=
max(kT S1k,kT S2k). Chaque élément Di,j de la matrice
représente la mesure de dissimilarité d(tsi, tsj)(Eq. 1)
entre une étoile-triangles tsidans T S1et une étoile-
triangles tsjdans T S2. Dans le cas de kT S1k 6=kT S2k,
le plus petit ensemble d’étoiles-triangles est complété par
(max(||T S1||,||T S2||)min(||T S1||,||T S2||)) étoiles-
triangles vides ε. La distance entre une étoile-triangles vide
εet une étoile-triangles ts est calculée par Eq. 1 et cor-
respond au coût de l’ajout de ts à l’ensemble d’étoiles-
triangles le plus petit (ou en supprimant ts du l’ensemble
d’étoiles-triangles le plus grand).
Nous appliquons l’algorithme hongrois [23] sur la matrice
Dpour trouver la meilleure affectation avec une com-
plexité de O(n3). L’évaluation de la distance entre deux
graphes est résumée dans l’Algorithme 2.
La classification est ensuite effectuée en utilisant des tech-
niques d’apprentissage supervisées. Notre approche défi-
nit un espace de métriques décrivant les différents objets,
en utilisant des techniques de plongement et de noyau de
graphes : Chaque objet (l’ensemble de ses étoiles-triangles)
T Siest projeté sur un espace vectoriel, où il est représenté
par un vecteur de distances T SM (T Si, T Sj=1...n ), entre
T Siet l’ensemble des autres objets T Sj=1...n.
Algorithm 2 Distance entre graphes en utilisant TSM.
1: Entrées : Deux graphes g1et g2.
2: Sorties : La distance entre g1et g2.
3: Début
4: Décomposition de g1et g2en T S1et T S2, (Algo. 1).
5: Construire une matrice de distance D.
6: Pour chaque tsiT S1et tsjT S2faire
7: Di,j =d(tsi, tsj)(Eq. 1) ;
8: Fin Pour chaque
9: Résoudre (Eq. 3), algorithme Hongrois [23] sur la matrice D.
10: Retourner la distance T SM (T S1, T S2);
11: Fin
5 Expérimentation
Afin d’évaluer l’approche proposée, nous avons entrepris
une série d’expérimentations au cours desquelles nous
avons comparé notre approche à des algorithmes de com-
paraison des objets issus de l’état de l’art, selon différents
critères d’évaluation, sur la base de données TOSCA [15].
5.1 Complexité temporelle
Comme mentionné précédemment, l’algorithme hongrois
[23] est utilisé pour trouver la meilleure affectation avec
une complexité de O(n3), où nest le nombre maximal de
composants dans les deux graphes. Dans le pire des cas, la
complexité est de l’ordre de O(0.037 n3). Cependant, le
nombre d’étoiles-triangles dépend de la structure du graphe
sous-jacent ainsi que du degré de voisinage Nk. En ef-
fet, le nombre d’étoiles-triangles diminue lorsque le de-
gré de voisinage Nkaugmente. La complexité temporelle,
pour la base de données TOSCA [15], est de l’ordre de
O(α[n
log(n)]3), où α[1.80 107,0.74] pour Nk=1...6.
Le degré de voisinage Nk=1 a la complexité la plus élevée,
tandis que le degré de voisinage Nk=6 a la complexité la
plus basse.
5.2 Résultats expérimentaux
Dans cette section, nous comparons et discutons nos résul-
tats avec ceux obtenus avec la base de données TOSCA
[15]. La distance proposée T SM est paramétrable via les
paramètres αk, qui déterminent les poids attribués aux dif-
férentes mesures de similarité. La valeur par défaut de ces
paramètres est la suivante : αk= 1/6,k. Comme prouvé
dans [1], la distance T SM est pseudo-métrique. Afin de
classer les différents objets appartenant aux bases de don-
nées, la métrique est apprise avec des techniques d’appren-
tissage automatique. Ceci est en contraste avec l’approche
standard dans laquelle un descripteur invariant est associé
à chaque objet et la classification est effectuée avec des
techniques d’apprentissage automatique par apprentissage
supervisé. Dans notre approche, la distance T SM défi-
nit un espace de métrique décrivant les différents objets.
Par conséquent, pour effectuer la classification, la métrique
doit être apprise à l’aide d’un processus d’apprentissage
supervisé. Cinq classificateurs ont été évalués afin de dé-
terminer leur pertinence pour l’apprentissage de métrique,
à savoir : le classificateur naïf de Bayes, le classificateur
des forêts aléatoires, l’approche des arbres boostés par gra-
dient, le classificateur à vaste marge (SVM) et la régres-
sion logistique. Ces classificateurs ont été décrits en dé-
tail dans la littérature [24, 25]. Nous nous limiterons donc
à une brève description. Dans ce qui suit, les descripteurs
font référence à la métrique. Le classificateur naïf de Bayes
(NB) [24, 25] est un classificateur probabiliste basé sur le
théorème de Bayes. Il suppose que les descripteurs sont
générés indépendamment de la classe et utilise le théorème
de Bayes pour prédire la classe. Le classificateur des forêts
aléatoires (RF) [24, 25] utilise un ensemble d’arbres de dé-
cision pour prédire la classe. Chaque arbre de décision a
été entrainé sur un sous-ensemble aléatoire de l’ensemble
d’apprentissage, et utilise uniquement un sous-ensemble
aléatoire des descripteurs. Le classificateur GBT (gradient
boosted tree) [24, 25] prédit les étiquettes en entraînant de
manière itérative une séquence d’arbres de décision sur des
données d’apprentissage et en les combinant. Le classifi-
cateur à vaste marge (SVM) [24, 25] sépare les données
d’apprentissage en deux classes à l’aide d’un hyperplan à
marges maximales. Le problème de la classification multi-
classes est réduit à un ensemble de problèmes de classifi-
cation binaire. Enfin, le classificateur par régression logis-
tique (LR) [24], connu aussi sous le nom de classificateur
d’entropie maximum, modélise les probabilités de classe
avec des fonctions logistiques de combinaisons linéaires
des descripteurs.
Pour chaque classificateur, un petit ensemble de valida-
tion a été généré automatiquement afin d’évaluer les pa-
ramètres du classificateur. Le paramètre unique du classi-
ficateur naïf de Bayes (NB) était le paramètre de lissage,
qui se situait généralement autour de 0.2. Pour le classifica-
teur des forêts aléatoires (RF), quatre paramètres étaient re-
quis, à savoir : fraction caractéristique, nombre de feuilles,
nombre d’arbres et distribution de lissage, qui ont été dé-
finis sur 1/237, 2, 100 et 0.5 respectivement. Cet algo-
rithme a été implémenté en utilisant la bibliothèque DAAL
(Intel Data Analytics Accelerations Library) [26]. Le clas-
sificateur GBT (gradient boosted tree) requiert plusieurs
paramètres y compris la méthode de renforcement. L’al-
gorithme est basé sur le gradient, le nombre maximum de
tours d’apprentissage (50), le nombre de feuilles (13), le
taux d’apprentissage (0.1), le nombre maximum de taches
(255), le nombre de taches (20), la profondeur maximale
(6), la taille de la feuille (15), la fraction caractéristique (1)
et la fraction d’ensachage (1), entre autres. Pour le clas-
sificateur SVM, les paramètres suivants ont été détermi-
nés : type de noyau (fonction de base radiale), paramètre de
mise à l’échelle gamma (0.00725065), paramètre de marge
souple (3), paramètre de biais (1), stratégie multi-classes
(un contre un) et la taille du cache de noyau (100). Enfin, le
classificateur de régression logistique (LR) a été optimisé
au moyen de l’algorithme à mémoire limitée de Broyden-
Fletcher-Goldfarb-Shanno (LBFGS) avec un terme de ré-
gularisation quadratique (0.001). Quatre mesures ont été
utilisées pour évaluer les performances de notre système, à
savoir : exactitude, précision, rappel et F-mesure. Ces me-
sures ont été choisies en raison de leurs performances et
afin de comparer notre approche à celles utilisées dans les
bases de données de référence. Comme ces métriques sont
bien connues et largement utilisées, nous renvoyons les lec-
teurs à [27, 28] pour plus de détails. Dans certains cas, nous
avons également ajouté la matrice de confusion et la courbe
de taux de précision-rejet afin d’affiner davantage les per-
formances du système ainsi que sa sensibilité à la probabi-
lité de seuil de détection. Ici, le taux de rejet fait référence
à la probabilité de classification d’un résultat donné : si
cette probabilité est inférieure à un certain seuil, le résul-
tat du processus de classification est considéré comme in-
déterminé et, par conséquent, non utilisé dans l’évaluation
des métriques de performance. Les bases de données consi-
dérés étant relativement petites, elles ne conviennent pas
vraiment pour la validation croisée. Par conséquent, pour
évaluer la métrique, nous avons utilisé une technique de
bootstrapping ou d’ensachage. L’ensachage suppose que
l’ensemble de données est représentatif de sa distribution
réelle. Les ensembles d’apprentissage et de validation sont
échantillonnés de manière uniforme et aléatoire avec rem-
placement à partir du jeu de données d’origine afin d’en-
trainer les classificateurs. Le processus a été répété dix fois.
Exactitude, précision, rappel et F-mesure correspondent à
la moyenne de ces dix itérations.
Dans la mesure du possible, les classificateurs ont été im-
plémentés sur le GPU. Les calculs ont été effectués sur une
station de travail équipée de deux processeurs Xeon dotés
de 40 coeurs, de 64 Go de RAM et d’un GPU NVIDIA
Quadro GP-100 doté de 3584 coeurs CUDA et de 16 Go
de mémoire.
Résultats expérimentaux sur la base de données
TOSCA. La distance T SM entre chaque paire d’objets a
été évaluée pour les six premiers degrés de voisinage. Ces
distances forment la métrique qui doit être apprise. Pour
chaque degré de voisinage et pour chaque classificateur :
exactitude, précision, rappel, F-mesure, matrice de confu-
sion et la courbe de taux de précision-rejet ont été détermi-
nées. Seuls les résultats associés aux trois meilleurs classi-
ficateurs sont rapportés dans la Table 3 étant ces résultats
sont nettement meilleurs que les autres.
Pour le deuxième degré de voisinage, les meilleurs résultats
ont été obtenus avec le classificateur de régression logis-
tique (LR), tandis que, pour le premier et les quatre derniers
degrés de voisinage, les meilleurs résultats ont été obtenus
avec le classificateur des forêts aléatoires (RF) ou le clas-
sificateur GBT (gradient boosted tree). Pour les meilleurs
classificateurs, l’exactitude la plus faible était de 76.35%,
tandis que l’exactitude la plus élevée était de 88.51%. Les
deux ont été obtenus avec le premier ordre de voisinage en
utilisant le classificateur GBT (gradient boosted tree).
Nkexactitude Précision Rappel F-measure
GBT RF LR GBT RF LR GBT RF LR GBT RF LR
188.51 83.78 85.81 91.80 85.12 88.34 89.64 80.41 87.41 0.90 0.80 0.86
2 71.62 79.05 79.73 72.31 81.70 81.60 74.40 80.41 82.04 0.72 0.80 0.81
381.76 79.73 77.27 85.39 79.87 77.41 81.47 78.50 77.52 0.82 0.78 0.76
4 75.00 76.35 61.49 77.35 78.98 68.07 75.40 76.50 64.26 0.74 0.76 0.62
577.70 72.30 62.21 81.04 74.29 66.06 76.75 71.10 68.20 0.76 0.70 0.68
680.41 79.05 62.21 83.34 80.18 66.06 79.94 78.96 68.20 80.41 0.78 0.68
TABL E 3 – exactitude, précision, rappel, F-mesures obte-
nues avec les classificateurs GBT (gradient boosted tree),
les forêts aléatoires (RF) et la régression logistique (LR)
pour la base de données TOSCA.
La courbe de taux de précision-rejet et la matrice de confu-
sion sont indiquées pour le premier degré de voisinage
dans les figures 1 et 2 respectivement. Cette courbe de taux
de précision-rejet indique clairement qu’une exactitude
de 95% peut être facilement obtenue simplement en
imposant un taux de rejet de 0.1. La matrice de confu-
sion (Figure 2) illustre les performances de notre approche.
0.0 0.2 0.4 0.6 0.8
0.88
0.90
0.92
0.94
0.96
0.98
1.00
RejectionRate
Accuracy
FIGURE 1 – La courbe de taux de précision-rejet pour
Nk=1 avec le classificateur GBT (gradient boosted tree).
Nous avons également comparé notre méthode T SM à
quatre autres algorithmes de l’état de l’art relatifs aux bases
de doonées SHREC, à savoir CAM, GeodesicD2, DSR et
RSH. La Table 4 compare l’exactitude obtenue par ces ap-
proches à l’exactitude obtenue par notre méthode pour le
10
9
13
12
15
16
10
20
11
3
22
7
cat
centaur
david
dog
gorilla
horse
lioness
michael
seahorse
shark
victoria
wolf
cat
centaur
david
dog
gorilla
horse
lioness
michael
seahorse
shark
victoria
wolf
12
9
12
13
18
16
10
18
8
3
28
1
predicted class
actual class
7
0
0
0
0
0
0
0
0
0
3
0
0
9
0
0
0
0
0
0
0
0
0
0
2
0
11
0
0
0
0
0
0
0
0
0
0
0
1
11
0
0
0
0
0
0
0
0
0
0
0
0
15
0
0
0
0
0
0
0
0
0
0
0
0
16
0
0
0
0
0
0
0
0
0
0
0
0
10
0
0
0
0
0
0
0
0
2
0
0
0
18
0
0
0
0
0
0
0
0
3
0
0
0
8
0
0
0
0
0
0
0
0
0
0
0
0
3
0
0
0
0
0
0
0
0
0
0
0
0
22
0
3
0
0
0
0
0
0
0
0
0
3
1
FIGURE 2 – La matrice de confusion pour Nk=1 avec le
classificateur GBT (gradient boosted tree).
premier degré de voisinage avec le classificateur GBT (gra-
dient boosted tree). Notre approche surpasse nettement les
autres avec une exactitude de 91,80% contre un maximum
de 30% pour les quatre autres approches.
Méthode Précision (%) Rappel (%)
T SM ,Nk=1, GBT 91.80 89.64
CAM 30 89.64
Geodesic2D 26 89.64
DSR 24 89.64
RSH 21 89.64
TABL E 4 – Comparaison de notre méthode T SM (Nk=1)
en termes d’exactitude avec les approches CAM, Geode-
sicD2, DSR et RSH pour la base de données TOSCA.
Nous avons également comparé notre approche pour tous
les degrés de voisinages avec les méthodes TD, Shape-
DNA et SRCP-TD en termes de F-mesure. Les résultats
sont rapportés dans la Table 5. Une fois de plus, notre ap-
proche surpasse les autres, quel que soit l’ordre du voisi-
nage considéré.
Résultats expérimentaux pour la base de données
TOSCA face au re-maillage. Nous avons étudié la ro-
bustesse de notre approche T SM face à la réduction du
maillage et le ré-maillage. Ceci est d’une importance pri-
mordiale car notre méthode est basée sur le maillage ou le
graphe associé aux objets 3D. La base de données TOSCA
[15] a été utilisée pour l’évaluation. Le nombre de triangles
a été réduit de 10% et 20% afin de générer les bases de don-
nées TOSCA_90 et TOSCA_80 respectivement. La réduc-
Method NkClassificateur F-measure
T SM 1 GBT 0.90
T SM 2 LR 0.81
T SM 3 GBT 0.82
T SM 4 RF 0.76
T SM 5 GBT 0.76
T SM 6 GBT 0.80
TD N/A N/A 0.67
Shape-DNA N/A N/A 0.45
SRCP-TD N/A N/A 0.44
TABL E 5 – F-mesure de notre approche T SM du meilleur
classificateur associé à un ordre de voisinage donné com-
parée à les F-mesure obtenues avec TD, Shape-DNA et
SRCP-TD pour la base de données TOSCA.
tion triangulaire a été réalisée avec une décimation d’ef-
fondrement d’arête quadrique [29]. Les résultats que nous
avons évalués en termes d’exactitude, de précision, de rap-
pel et de F-measure pour les bases de données TOSCA_90
et TOSCA_80 sont rapportés dans la Table 6.
NkClassificateur Exactitude (%) Précision (%) Rappel (%) F-measure
T80 T90 T80 T90 T80 T90 T80 T90 T80 T90
1 RF RF 84.45 84.46 86.97 87.44 84.29 85.44 0.84 0.85
2 GBT GBT 71.62 77.70 75.20 78.00 72.50 78.26 71.49 0.78
3 RF GBT 71.62 73.65 73.50 76.85 74.09 75.29 0.73 0.75
4 RF RF 79.73 75.00 81.97 78.32 80.95 77.08 0.80 0.76
5 GBT RF 77.70 76.35 80.51 77.34 78.77 77.82 0.79 0.76
6 GBT RF 74.32 73.65 80.82 74.74 75.59 73.06 0.76 0.73
TABL E 6 – exactitude, précision, rappel, F-mesures de
T SM obtenues avec les classificateurs GBT (gradient
boosted tree) et forêts aléatoires (RF) pour Nk=1...6pour
les bases de données TOSCA_80 (T80) et TOSCA_90
(T90) Databases.
La réduction et le ré-maillage ont une incidence directe sur
notre approche puisque celle-ci est une approche à base de
graphes. Néanmoins, T SM est basé sur une approximation
de la distance d’édition de graphes tolérante aux bruits et à
la distorsion. De plus, notre approche utilise un ensemble
de descripteurs invariants face aux déformations géomé-
triques les plus courantes. Par conséquent, notre approche
T SM est robuste face à la réduction et le ré-maillage.
En dépit du fait que la réduction triangulaire soit relative-
ment importante (10% à 20% ), l’algorithme affiche une
résistance étonnamment élevée à la réduction du maillage :
l’exactitude atteignait 84.5% pour le premier degré de voi-
sinage pour 10% et 20% de réduction du maillage, contre
88.51% sans réduction du maillage. Ces résultats ont tous
été obtenus avec le classificateur des forêts aléatoires (RF).
Notre expérimentation avec la bases de données TOSCA
et TOSCA avec maillage réduit, comme décrit précédem-
ment, montre les performances et la robustesse de notre
approche.
En effet, nous avons obtenu d’excellents résultats en termes
d’exactitude, de précision, de rappel et de F-mesure pour
la base de données TOSCA. Notre complexité temporelle
prévue a été systématiquement confirmée par nos expéri-
mentations. Notre méthode est plus performante que CAM,
GeodesicD2, DSR et RSH en termes d’exactitude, de pré-
cision et de rappel pour la base de données TOSCA. Les
mêmes remarques s’appliquent lorsque notre approche est
comparée à d’autres méthodes en termes de F-mesure.
6 Conclusions
Dans cet article, nous avons présenté un nouvel algorithme
d’appariement de graphes pour résoudre le problème de
la comparaison des objets 3D déformables représentés par
des graphes (tessellations triangulaires). L’approche pro-
posée est basée sur une nouvelle décomposition de tessella-
tions triangulaires en étoiles-triangles. Les étoiles-triangles
obtenues sont utilisées pour déterminer la distance entre
les tessellations en utilisant l’algorithme hongrois. L’al-
gorithme proposé garantit un nombre minimum d’étoiles-
triangles disjointes, offre une meilleure dissimilarité en
couvrant un voisinage plus large en étoiles-triangles et uti-
lise un ensemble de descripteurs qui sont invariants face
aux déformations les plus courantes. L’approche proposée
est basée sur une approximation de la distance d’édition
de graphes, qui est tolérante aux bruit et à la distorsion,
ce qui rend notre technique particulièrement adaptée à la
comparaison des objets déformables. La classification est
effectuée en utilisant des techniques d’apprentissage au-
tomatique supervisées. Notre approche définit un espace
de métrique en utilisant des techniques de plongement et
de noyaux de graphes. Nous avons prouvé que la distance
proposée T SM est pseudo-métrique. Nos résultats expéri-
mentaux, obtenus à partir de différentes bases de données
de référence pour les objets 3D déformables, confirment les
performances et l’exactitude de notre algorithme. Dans un
proche avenir, nous prévoyons d’enrichir la description des
étoiles-triangles tout en réduisant la complexité temporelle
et en améliorant les performances de l’algorithme d’appa-
riement de graphes proposé. Nous prévoyons également de
combiner notre approche avec des techniques d’apprentis-
sage en profondeur.
Références
[1] Kamel Madi, Eric Paquet, and Hamamache Khed-
douci. New graph distance for deformable 3d ob-
jects recognition based on triangle-stars decomposi-
tion. Pattern Recognition, 90 :297–307, 2019.
[2] Horst Bunke, Andreas Münger, and Xiaoyi Jiang.
Combinatorial search versus genetic algorithms :
A case study based on the generalized median
graph problem. Pattern Recognition Letters, 20(11-
13) :1271–1277, 1999.
[3] Kamel Madi, Hamida Seba, Hamamache Kheddouci,
and Olivier Barge. A graph-based approach for kite
recognition. Pattern Recognition Letters, 87 :186–
194, 2017.
[4] Horst Bunke and Kim Shearer. A graph distance me-
tric based on the maximal common subgraph. Pattern
Recognition Letters, 19(3-4) :255–259, 1998.
[5] Donatello Conte, Pasquale Foggia, Carlo Sansone,
and Mario Vento. Thirty years of graph matching in
pattern recognition. IJPRAI, 18(3) :265–298, 2004.
[6] Kaspar Riesen and Horst Bunke. Approximate graph
edit distance computation by means of bipartite graph
matching. Image Vision Comput., 27(7) :950–959,
2009.
[7] Johan W. H. Tangelder and Remco C. Veltkamp. A
survey of content based 3d shape retrieval methods.
Multimedia Tools Appl., 39(3) :441–471, 2008.
[8] Jin Xie, Yi Fang, Fan Zhu, and Edward Wong. Deep-
shape : Deep learned shape descriptor for 3d shape
matching and retrieval. In 2015 IEEE Conference on
Computer Vision and Pattern Recognition (CVPR),
pages 1275–1283, 2015.
[9] Skeleton graph matching vs. maximum weight
cliques aorta registration techniques. Computerized
Medical Imaging and Graphics, 46, Part 2 :142 – 152,
2015. Information Technologies in Biomedicine.
[10] Vincent Barra and Silvia Biasotti. 3d shape retrieval
using kernels on extended reeb graphs. Pattern Re-
cognition, 46(11) :2985–2999, 2013.
[11] Yanir Kleiman, Oliver van Kaick, Olga Sorkine-
Hornung, and Daniel Cohen-Or. SHED : shape
edit distance for fine-grained shape similarity. ACM
Trans. Graph., 34(6) :235, 2015.
[12] Sicheng Zhao, Hongxun Yao, Yanhao Zhang, Yasi
Wang, and Shaohui Liu. View-based 3d object re-
trieval via multi-modal graph learning. Signal Pro-
cessing, 112 :110–118, 2015.
[13] Hermilo Sánchez-Cruz and Ernesto Bribiesca. A me-
thod of optimum transformation of 3d objects used as
a measure of shape dissimilarity. Image and Vision
Computing, 21(12) :1027–1036, 2003.
[14] Johan WH Tangelder and Remco C Veltkamp.
Polyhedral model retrieval using weighted point
sets. International journal of image and graphics,
3(01) :209–229, 2003.
[15] Alexander M. Bronstein, Michael M. Bronstein, and
Ron Kimmel. Calculus of nonrigid surfaces for geo-
metry and texture manipulation. IEEE Trans. Vis.
Comput. Graph., 13(5) :902–913, 2007.
[16] Hedi Tabia, Mohamed Daoudi, Jean-Philippe Vande-
borre, and Olivier Colot. A new 3d-matching me-
thod of nonrigid and partially similar models using
curve analysis. IEEE Trans. Pattern Anal. Mach. In-
tell., 33(4) :852–858, 2011.
[17] Robert Osada, Thomas A. Funkhouser, Bernard Cha-
zelle, and David P. Dobkin. Shape distributions. ACM
Trans. Graph., 21(4) :807–832, 2002.
[18] Dejan Vranic. 3D Model Retrieval. PhD thesis, Uni-
versity of of Leipzig, may 2004.
[19] Dietmar Saupe and Dejan V. Vranic. 3d model re-
trieval with spherical harmonics and moments. In
Pattern Recognition, 23rd DAGM-Symposium, Mu-
nich, Germany, September 12-14, 2001, Proceedings,
pages 392–397, 2001.
[20] Yi Fang, Mengtian Sun, and Karthik Ramani. Tem-
perature distribution descriptor for robust 3d shape re-
trieval. In IEEE Conference on Computer Vision and
Pattern Recognition, CVPR Workshops 2011, Colo-
rado Springs, CO, USA, 20-25 June, 2011, pages 9–
16, 2011.
[21] Martin Reuter, Franz-Erich Wolter, and Niklas Pei-
necke. Laplace-beltrami spectra as ’shape-dna’
of surfaces and solids. Computer-Aided Design,
38(4) :342–366, 2006.
[22] Mostafa Abdelrahman, Moumen T. El-Melegy, and
Aly A. Farag. Heat kernels for non-rigid shape re-
trieval : Sparse representation and efficient classifica-
tion. In Ninth Conference on Computer and Robot
Vision, CRV 2012, Toronto, Ontario, Canada, May
28-30, 2012, pages 153–160, 2012.
[23] H. W. Kuhn. The hungarian method for the assign-
ment problem. Naval Research Logistics Quarterly,
2(1-2) :83–97, 1955.
[24] Kevin P. Murphy. Machine learning - a probabilis-
tic perspective. Adaptive computation and machine
learning series. MIT Press, 2012.
[25] Ian J. Goodfellow, Yoshua Bengio, and Aaron C.
Courville. Deep Learning. Adaptive computation and
machine learning. MIT Press, 2016.
[26] James Reinders. Intel data analytics acceleration li-
brary.
[27] Tom Fawcett. An introduction to ROC analysis. Pat-
tern Recognition Letters, 27(8) :861–874, 2006.
[28] David Martin Ward Powers. Evaluation : from pre-
cision, recall and f-factor to roc, informedness, mar-
kedness and correlation. School of Informatics and
Engineering Technical Reports, (SIE-07-001), 2007.
[29] Michael Garland and Paul S. Heckbert. Surface
simplification using quadric error metrics. In Pro-
ceedings of the 24th Annual Conference on Compu-
ter Graphics and Interactive Techniques, SIGGRAPH
1997, Los Angeles, CA, USA, August 3-8, 1997, pages
209–216, 1997.
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
Content-based 3D object retrieval has wide applications in various domains, ranging from virtual reality to computer aided design and entertainment. With the rapid development of digitizing technologies, different views of 3D objects are captured, which requires for effective and efficient view-based 3D object retrieval (V3DOR) techniques. As each object is represented by a set of multiple views, V3DOR becomes a group matching problem. Most of state-of-the-art V3DOR methods use one single feature to describe a 3D object, which is often insufficient. In this paper, we propose a feature fusion method via multi-modal graph learning for view-based 3D object retrieval. Firstly, different visual features, including 2D Zernike moments, 2D Fourier descriptor and 2D Krawtchouk moments, are extracted to describe each view of a 3D object. Then the Hausdorff distance is computed to measure the similarity between two 3D objects with multiple views. Finally we construct multiple graphs based on different features and learn the optimized weights of each graph automatically for feature fusion task. Extensive experiments are conducted on the ETH-80 dataset and the National Taiwan University 3D model dataset. The results demonstrate the superior performance of the proposed method, as compared to the state-of-the-art approaches.
Article
We address the problem of comparing deformable 3D objects represented by graphs such as triangular tessellations. We propose a new graph matching technique to measure the distance between these graphs. The proposed approach is based on a new decomposition of triangular tessellations into triangle-stars. The algorithm ensures a minimum number of disjoint triangle-stars, provides improved dissimilarity by covering larger neighbors and allows the creation of descriptors that are invariant or at least oblivious under the most common deformations. The present approach is based on an approximation of the Graph Edit Distance, which is fault-tolerant to noise and distortion, thus making our technique particularly suitable for the comparison of deformable objects. Classification is performed with supervised machine learning techniques. Our approach defines a metric space using graph embedding and graph kernel techniques. It is proved that the proposed distance is a pseudo-metric. Its time complexity is determined and the method is evaluated against benchmark databases. Our experimental results confirm the performances and the accuracy of our system.
Article
Kites are huge archaeological structures of stone visible from satellite images. Because of their important number and their wide geographical distribution, automatic recognition of these structures on images is an important step towards understanding these enigmatic remnants. This paper presents a complete identification tool relying on a graph representation of the Kites. As Kites are naturally represented by graphs, graph matching methods are thus the main building blocks in the Kite identification process. However, Kite graphs are disconnected geometric graphs for which traditional graph matching methods are useless. To address this issue, we propose a graph similarity measure adapted for Kite graphs. The proposed approach combines graph invariants with a geometric graph edit distance computation leading to an efficient Kite identification process. We analyze the time complexity of the proposed algorithms and conduct extensive experiments both on real and synthetic Kite graph data sets to attest the effectiveness of the approach. We also perform a set of experimentations on other data sets in order to show that the proposed approach is extensible and quite general.
Article
n this work, we present a method which transforms an object into another. The computation of this transformation is used as a measure of shape-of-object dissimilarity. The considered objects are composed of voxels. Thus, the shape difference of two objects can be ascertained by counting how many voxels we have to move and how far to change one object into another. This work is based on the method presented in [Pattern Recognition 29 (1996) 1117], and our contributions to such a work are a method of optimum transformation of objects and a proposed method of principal axes, which is used to orientate objects. The proposed method is applied to global data. Finally, we present some results using objects of the real world.
Article
Assuming that numerical scores are available for the performance of each of n persons on each of n jobs, the "assignment problem" is the quest for an assignment of persons to jobs so that the sum of the n scores so obtained is as large as possible. It is shown that ideas latent in the work of two Hungarian mathematicians may be exploited to yield a new method of solving this problem.