ThesisPDF Available

Approches probabilistes et bayésiennes non paramétriques pour les systemes de recommandation et les réseaux

Authors:

Abstract and Figures

Nous proposons deux nouvelles approches pour les systèmes de recommandation etles réseaux. Dans la première partie, nous donnons d’abord un aperçu sur les systèmes de recommandationavant de nous concentrer sur les approches de rang faible pour la complétionde matrice. En nous appuyant sur une approche probabiliste, nous proposons de nouvellesfonctions de pénalité sur les valeurs singulières de la matrice de rang faible. En exploitantune représentation de modèle de mélange de cette pénalité, nous montrons qu’un ensemblede variables latentes convenablement choisi permet de développer un algorithme espérance-maximisationafin d’obtenir un maximum a posteriori de la matrice de rang faible complétée.L’algorithme résultant est un algorithme à seuillage doux itératif qui adapte de manière itérativeles coefficients de réduction associés aux valeurs singulières. L’algorithme est simple àmettre en œuvre et peut s’adapter à de grandes matrices. Nous fournissons des comparaisonsnumériques entre notre approche et de récentes alternatives montrant l’intérêt de l’approcheproposée pour la complétion de matrice à rang faible. Dans la deuxième partie, nous présentonsd’abord quelques prérequis sur l’approche bayésienne non paramétrique et en particuliersur les mesures complètement aléatoires et leur extension multivariée, les mesures complètementaléatoires composées. Nous proposons ensuite un nouveau modèle statistique pour lesréseaux parcimonieux qui se structurent en communautés avec chevauchement. Le modèle estbasé sur la représentation du graphe comme un processus ponctuel échangeable, et généralisenaturellement des modèles probabilistes existants à structure en blocs avec chevauchement aurégime parcimonieux. Notre construction s’appuie sur des vecteurs de mesures complètementaléatoires, et possède des paramètres interprétables, chaque nœud étant associé un vecteur représentantson niveau d’affiliation à certaines communautés latentes. Nous développons desméthodes pour simuler cette classe de graphes aléatoires, ainsi que pour effectuer l’inférence aposteriori. Nous montrons que l’approche proposée peut récupérer une structure interprétableà partir de deux réseaux du monde réel et peut gérer des graphes avec des milliers de nœudset des dizaines de milliers de connections.
Content may be subject to copyright.
A preview of the PDF is not available
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
Chapter
In this paper we propose a Bayesian nonparametric approach to modelling sparse time-varying networks. A positive parameter is associated to each node of a network, which models the sociability of that node. Sociabilities are assumed to evolve over time, and are modelled via a dynamic point process model. The model is able to capture long term evolution of the sociabilities. Moreover, it yields sparse graphs, where the number of edges grows subquadratically with the number of nodes. The evolution of the sociabilities is described by a tractable time-varying generalised gamma process. We provide some theoretical insights into the model and apply it to three datasets: a simulated network, a network of hyperlinks between communities on Reddit, and a network of co-occurences of words in Reuters news articles after the September 11th11^{th} attacks.KeywordsBayesian nonparametricsPoisson random measuresNetworksRandom graphsSparsityPoint processes
Article
Abstract: We propose a novel statistical model for sparse networks with overlapping community structure. The model is based on representing the graph as an exchangeable point process, and naturally generalizes existing probabilistic models with overlapping block-structure to the sparse regime. Our construction builds on vectors of completely random measures, and has interpretable parameters, each node being assigned a vector representing its level of affiliation to some latent communities. We develop methods for simulating this class of random graphs, as well as to perform posterior inference. We show that the proposed approach can recover interpretable structure from two real-world networks and can handle graphs with thousands of nodes and tens of thousands of edges.
Article
A parametric family of completely random measures, which includes gamma random measures, positive stable random measures as well as inverse Gaussian measures, is defined. In order to develop models for clustered point patterns with dependencies between points, the family is used in a shot-noise construction as intensity measures for Cox processes. The resulting Cox processes are of Poisson cluster process type and include Poisson processes and ordinary Neyman-Scott processes. We show characteristics of the completely random measures, illustrated by simulations, and derive moment and mixing properties for the shot-noise random measures. Finally statistical inference for shot-noise Cox processes is considered and some results on nearest-neighbour Markov properties are given.
Article
Article
This paper presents an overview of the field of recommender systems and describes the current generation of recommendation methods that are usually classified into the following three main categories: content-based, collaborative, and hybrid recommendation approaches. This paper also describes various limitations of current recommendation methods and discusses possible extensions that can improve recommendation capabilities and make recommender systems applicable to an even broader range of applications. These extensions include, among others, an improvement of understanding of users and items, incorporation of the contextual information into the recommendation process, support for multicriteria ratings, and a provision of more flexible and less intrusive types of recommendations.