Content uploaded by Thiago H. Silva
Author content
All content in this area was uploaded by Thiago H. Silva on Sep 24, 2024
Content may be subject to copyright.
Redes de Interesse: comparando o Google Places e Foursquare
na captura da escolha de usu´
arios por ´
areas urbanas
Gustavo H. Santos1, Fernanda R. Gubert1,
Myriam Delgado1, Thiago H. Silva1
1Universidade Tecnol´
ogica Federal do Paran´
a (UTFPR)
Departamento Acadˆ
emico de Inform´
atica
Curitiba, Brasil
gustavohenriquesantos,fernandagubert@alunos.utfpr.edu.br
myriamdelg,thiagoh@utfpr.edu.br
Abstract. Location-Based Social Networks (LBSNs) are valuable for unders-
tanding urban behavior and provide useful data on user preferences. Modeling
this data into graphs, such as Interest Network (iNET), enables significant in-
sights. These networks can be helpful for urban area recommendations, mobility
forecasts, and public policy formulation. This study uses check-in data and es-
tablishment reviews to compare the iNETs resulting from two distinct LBSNs,
Foursquare and Google Places. Although the studied LBSNs differ in nature,
with data varying in regularity and purpose, both modeled iNETs revealed simi-
lar urban behavior patterns, and were likewise impacted by socioeconomic and
geographic factors.
Resumo. As Redes Sociais Baseadas em Localizac¸ ˜
ao (LBSNs) s˜
ao ´
uteis na
compreens˜
ao do comportamento urbano, oferecendo dados valiosos sobre pre-
ferˆ
encias dos usu´
arios. A modelagem desses dados em grafos, como as Re-
des de Interesse, permite percepc¸˜
oes relevantes. Essas redes podem ser ´
uteis
para, por exemplo, recomendac¸ ˜
oes de ´
areas urbanas, previs˜
oes de mobilidade
e formulac¸ ˜
ao de pol´
ıticas p´
ublicas. Este estudo compara redes de interesse de
duas LBSNs distintas, Foursquare e Google Places, usando dados de check-ins
e avaliac¸ ˜
oes de estabelecimentos. Embora as LBSNs estudadas sejam diferentes
em natureza, com dados diferindo em regularidade e prop´
osito, ambas as redes
de interesse modeladas revelaram padr˜
oes similares de comportamento urbano.
Fatores socioeconˆ
omicos e geogr´
aficos tamb´
em mostraram impacto semelhante
nas redes de interesse estudadas.
1. Introduc¸ ˜
ao
Dados de Redes Sociais Baseadas em Localizac¸ ˜
ao (do inglˆ
es, Location-Based Social
Networks – LBSNs) auxiliam no entendimento de diversas quest˜
oes no contexto
da computac¸˜
ao urbana [Ferreira et al. 2015, Santala et al. 2017, Silva et al. 2017,
Ladeira et al. 2019, Veiga et al. 2019, Ferreira et al. 2020, Senefonte et al. 2022,
Silver and Silva 2023, Silva and Silver 2024]. Em particular, devido ao fato das LBSNs
fornecerem dados urbanos que implicitamente tˆ
em aspectos sociais, como preferˆ
encias
de usu´
arios [Silva and Loureiro 2016, Silva et al. 2019], uma modelagem apropriada
pode proporcionar informac¸ ˜
oes valiosas para o entendimento do comportamento de
usu´
arios em contextos urbanos.
Uma estrutura popular para representar dados de LBSNs s˜
ao grafos (ou redes)
[Silva et al. 2019]. Exemplos desse tipo de dado poderiam ser obtidos atrav´
es de ativida-
des geolocalizadas em LBSNs realizadas por um grupo de usu´
arios, como as avaliac¸ ˜
oes
em estabelecimentos de uma cidade sob an´
alise. Estas avaliac¸ ˜
oes poderiam ser agregadas
em um grafo n˜
ao direcionado no qual os n´
os representam bairros da cidade onde os dados
foram compartilhados e as arestas conectam os bairros que foram visitados pelo mesmo
usu´
ario. Este tipo de modelagem origina o que chamamos neste trabalho de Redes de
Interesse – ver Sec¸˜
ao 4.1 para mais detalhes.
Redes de interesse podem ser ´
uteis em diferentes situac¸ ˜
oes. Por exemplo, ao
permitirem um melhor entendimento do interesse de usu´
arios por determinados espac¸os
f´
ısicos da cidade, elas poderiam facilitar a recomendac¸˜
ao de ´
areas geogr´
aficas, promover
a melhoria de previs˜
oes de mobilidade, e tamb´
em fomentar novas pol´
ıticas p´
ublicas para
ampliar o interesse de usu´
arios por certas ´
areas da cidade.
Nesse contexto, o presente trabalho tem como objetivo principal comparar redes
de interesse modeladas utilizando dados provenientes de duas LBSNs: Foursquare e Goo-
gle Places. No Foursquare utilizamos dados de check-ins, ato de compartilhar com amigos
um estabelecimento onde um usu´
ario se encontra. J´
a no Google Places utilizamos dados
de avaliac¸ ˜
oes de estabelecimentos. Ambos capturam o tipo de local onde o usu´
ario se en-
contra, por exemplo, um restaurante ou uma livraria. No entanto, eles s˜
ao dados distintos,
pois um check-in tem uma natureza pr´
oxima de tempo real, pois indica onde o usu´
ario
se encontra em um determinado momento, j´
a uma avaliac¸˜
ao n˜
ao necessariamente ´
e feita
enquanto o usu´
ario est´
a no estabelecimento. Com isso, visamos entender se LBSNs dife-
rentes capturam informac¸ ˜
oes similares na modelagem dos dados via redes de interesse.
Nosso estudo indica que o Google Places e Foursquare apresentam padr˜
oes simila-
res quando usados para investigar o comportamento urbano. Esse resultado ´
e interessante,
pois as LBSNs contˆ
em aspectos diferentes quanto `
a regularidade e no prop´
osito de seus
usos. Al´
em disso, a influˆ
encia de fatores socioeconˆ
omicos e geogr´
aficos foi investigada,
e seu impacto nas redes de interesse estudadas apresentou uma grande semelhanc¸a.
O restante do artigo est´
a organizado da seguinte maneira. A Sec¸ ˜
ao 2 apresenta os
trabalhos relacionados. A Sec¸ ˜
ao 3 explica as bases de dados usadas e suas caracter´
ısticas.
Na Sec¸˜
ao 4, s˜
ao apresentados os m´
etodos utilizados nesse trabalho. A Sec¸ ˜
ao 5 discute os
resultados. Finalmente, a Sec¸ ˜
ao 6 apresenta a conclus˜
ao desse artigo.
2. Trabalhos Relacionados
Nesta sec¸˜
ao abordamos alguns estudos pr´
evios que exploraram o potencial de se usar
LBSNs para a compreens˜
ao do comportamento urbano e a investigac¸˜
ao da dinˆ
amica das
cidades. O trabalho de [Silva et al. 2013] investigou a possibilidade de se usar dois siste-
mas diferentes, um do Instagram e outro do Foursquare, coletando dados para os quais a
localizac¸˜
ao era compartilhada. O artigo buscou entender se a informac¸ ˜
ao obtida poderia
ser complementar e/ou similar para as duas bases, nos padr˜
oes relacionados `
as dinˆ
amicas
das cidades e comportamento urbano. A partir disso, conclu´
ıram que os dois datasets
proporcionavam informac¸ ˜
oes compat´
ıveis e complementares, no qual, por exemplo, um
check-in do Foursquare poderia trazer a informac¸˜
ao da categoria de um estabelecimento
comentado em uma publicac¸ ˜
ao do Instagram, e capturavam ainda aspectos urbanos de
forma similar, como as regi˜
oes mais populares das cidades.
Em [Mart´
ı et al. 2019], os autores exploram o potencial do uso de dados de
LBSNs como Foursquare, Twitter, Google Places, Instagram e Airbnb para pesquisas
de fenˆ
omenos urbanos, reconhecendo n˜
ao s´
o os benef´
ıcios mas tamb´
em os desafios que o
uso dessas fontes de dados acarreta. O estudo apresenta pesquisas que utilizam dados das
LBSNs para analisar a dinˆ
amica da cidade e prop˜
oe uma metodologia para recuperac¸˜
ao,
selec¸˜
ao, classificac¸˜
ao e an´
alise de dados. Tamb´
em identifica as principais linhas de
investigac¸˜
ao tem´
aticas com base nas vari´
aveis de dados fornecidas por estas plataformas,
com o objetivo de oferecer um quadro abrangente para o estudo dos fenˆ
omenos urbanos
atrav´
es de dados LBSNs.
Outros trabalhos buscam entender quais fatores podem estar associados aos
padr˜
oes de movimento das pessoas. Por exemplo, [Cheng et al. 2021] usou dados geo-
localizados do Twitter para compreender as movimentac¸ ˜
oes dos usu´
arios. Os autores
associaram essas informac¸ ˜
oes espaciais com as caracter´
ısticas econˆ
omicas dos usu´
arios,
dos aspectos geogr´
aficos das regi˜
oes frequentadas, bem como seu posicionamento dentro
da rede social e a linguagem usada em seus check-ins. Assim, identificaram a presenc¸a
do modelo L´
evy Flight em relac¸˜
ao `
a mobilidade, no qual distˆ
ancias curtas s˜
ao percorridas
com mais frequˆ
encia, e distˆ
ancias maiores acontecem de forma mais rara. Apresenta-
ram, tamb´
em, a influˆ
encia da densidade populacional e da popularidade na rede social
para com as distˆ
ancias percorridas pelos usu´
arios. Al´
em disso, empregaram o uso da
an´
alise de sentimento para agregar contexto `
as avaliac¸ ˜
oes e aos padr˜
oes relacionados aos
usu´
arios.
O estudo realizado em [Nolasco-Cirugeda and Garc´
ıa-Mayor 2022] mostra como
os dados do Foursquare, Twitter e Google Places s˜
ao cruciais para analisar o uso do espac¸o
urbano e a dinˆ
amica social. Ao detalhar pesquisas e estudos de caso pioneiros na ´
ultima
d´
ecada, o artigo mostra como os dados da LBSN oferecem informac¸ ˜
oes importantes so-
bre a vida urbana, auxiliando na compreens˜
ao da dinˆ
amica social e intervenc¸ ˜
oes urbanas
espec´
ıficas. A pesquisa emprega v´
arias abordagens anal´
ıticas em escala para lidar com
diversas quest˜
oes urbanas, desde o dinamismo da vizinhanc¸a social at´
e o turismo e pre-
ferˆ
encias de infraestrutura verde, destacando o potencial anal´
ıtico abrangente dos dados
LBSN.
O trabalho [Skora et al. 2022] examinou se as informac¸ ˜
oes extra´
ıdas de dados do
Foursquare poderiam se assemelhar as informac¸ ˜
oes divulgadas pela WTO (World Tou-
rism Organization). O estudo encontrou o potencial de se usar LBSNs para facilitar a
compreens˜
ao dos movimentos tur´
ısticos em escalas maiores e com mais detalhes do que
por fontes tradicionais, apesar de limitac¸ ˜
oes associadas `
as LBSNs, como o uso predomi-
nante de pessoas jovens com acesso `
a internet.
J´
a o estudo [Huang and Butts 2023] investigou diversas caracter´
ısticas socioe-
conˆ
omicas e buscou entender quais delas impactavam a migrac¸ ˜
ao entre condados nos
Estados Unidos. Esse trabalho examinou a hip´
otese de que migrac¸ ˜
oes aconteciam entre
regi˜
oes similares, propondo uma teoria de segregac¸˜
ao e imobilidade social em relac¸˜
ao
`
a essas movimentac¸ ˜
oes. Para as suas an´
alises, os autores utilizam um modelo temporal
de grafos. Neste tipo de modelo, configurac¸ ˜
oes espec´
ıficas de parˆ
ametros permitem uma
an´
alise do comportamento das pessoas, em simulac¸ ˜
oes onde, por exemplo, a segregac¸˜
ao
pol´
ıtica ´
e desconsiderada.
Como abordado em alguns dos trabalhos relacionados, esse estudo tamb´
em se
baseia no uso de LBSNs, mas com um foco em entender se duas LBSNs diferentes podem
modelar o comportamento urbano em redes de interesse de forma similar, bem como se o
uso de caracter´
ısticas socioeconˆ
omicas s˜
ao suficientes para entender e explicar o interesse
das pessoas na escolha das ´
areas urbanas que elas frequentam.
3. Fontes de Dados
Esta sec¸˜
ao descreve como foram obtidos os dados para a modelagem das redes de interesse
de usu´
arios localizados em diferentes bairros da cidade de Curitiba. Esta foi escolhida por
ser uma cidade com a qual os autores est˜
ao mais familiarizados. A sec¸ ˜
ao detalha ainda
as caracter´
ısticas dos datasets resultantes, bem como as informac¸ ˜
oes sobre a coleta das
caracter´
ısticas socioeconˆ
omicas de cada bairro analisado.
3.1. Datasets utilizados
Google Places: O dataset do Google Places foi constru´
ıdo extraindo-se avaliac¸ ˜
oes re-
alizadas por usu´
arios da rede social Google Plus em estabelecimentos cadastrados no
servic¸o Google Maps. Os dados1foram disponibilizado pelos autores de [He et al. 2017]
e [Pasricha and McAuley 2018] para pesquisas. Eles buscavam viabilizar o estudo da
LBSN, abrangendo o mundo todo. A partir desses estudos, foram selecionados os dados
da cidade de Curitiba, para formar o nosso dataset. Esses dados contˆ
em informac¸ ˜
oes de-
talhadas como o nome do usu´
ario, informac¸ ˜
oes sobre seu n´
ıvel de educac¸˜
ao e emprego,
texto da avaliac¸˜
ao (que pode estar em diversas l´
ınguas), nota da avaliac¸˜
ao, momento em
que a avaliac¸˜
ao ocorreu, identificador ´
unico do usu´
ario. H´
a ainda informac¸ ˜
oes espec´
ıficas
do local avaliado, como por exemplo, o nome do estabelecimento, categoria `
a qual o local
pertence, hor´
ario de funcionamento, telefone de contato da empresa, enderec¸o, latitude e
longitude do estabelecimento.
Foursquare: Usamos, tamb´
em, fonte de dados, ofertada publicamente, extra´
ıda da rede
social baseada em localizac¸ ˜
ao Foursquare, atrav´
es de check-ins da plataforma divulga-
dos na rede social Twitter. O nosso dataset do Foursquare ´
e composto por check-ins de
usu´
arios na cidade de Curitiba. Ele inclui informac¸ ˜
oes como a data do check-in, o local
onde ocorreu, a categoria a qual o local pertence e o identificador ´
unico do usu´
ario. Os
dados est˜
ao bem distribu´
ıdos ao longo de 3 meses, de Abril a Junho de 2014. O dataset
´
e composto por 5.116 usu´
arios que fizeram 53.253 check-ins em 8.523 lugares diferentes
dentro da cidade.
3.2. Caracterizac¸ ˜
ao dos Datasets: Google Places ×Foursquare
No Google Places existem 685 categorias distintas de estabelecimentos, como, por exem-
plo, restaurantes, h´
oteis, bares, cafeterias, loja de carros usados, parques, shoppings, pa-
darias, universidades, cinemas e escolas. Na Figura 1a ´
e poss´
ıvel visualizar as 50 catego-
rias mais avaliadas, com um destaque especial para locais de lazer, como restaurantes de
variadas especialidades. Os dados contˆ
em 8.372 avaliac¸˜
oes de 4.909 usu´
arios em 2.213
estabelecimentos. Esses dados est˜
ao distribu´
ıdos ao longo dos anos de 2010 at´
e 2014,
com grande concentrac¸˜
ao nos anos de 2011-2014, sendo 2013 o ano com o maior n´
umero
de avaliac¸ ˜
oes, com um total de 4.003 avaliac¸˜
oes. J´
a o Foursquare cont´
em 368 categorias
1https://cseweb.ucsd.edu/∼jmcauley/datasets.html#google local
distintas, de maneira similar ao Google Places, e as 50 categorias com mais avaliac¸ ˜
oes
s˜
ao mostradas na Figura 1b.
(a) Google Places (b) Foursquare
Figura 1. Word Cloud das 50 Categorias Mais Avaliadas na Cidade de Curitiba
Ao comparar as categorias mais avaliadas de ambas as LBSNs, ´
e evidente a
diferenc¸a nas categorias dos dados do Google Places em relac¸ ˜
ao aos dados do Foursquare.
Por exemplo, o Foursquare traz informac¸˜
oes sobre as residˆ
encias e locais de trabalho dos
usu´
arios, algo n˜
ao presente no Google Places.
Como este trabalho ´
e focado na modelagem, atrav´
es de redes de interesse, de es-
tabelecimentos que as pessoas frequentam, verificamos tamb´
em quantas vezes um deter-
minado usu´
ario costuma avaliar para cada um dos dois datasets, atrav´
es do identificador
´
unico do usu´
ario em cada plataforma.
Analisando o comportamento dos usu´
arios do Google Places com presenc¸a em
Curitiba, 23% deles avaliaram pelo menos 2 vezes, 4,7% avaliaram pelo menos 5 vezes
e 1,49% avaliaram pelo menos 10 vezes. Portanto, esse dataset apresenta uma baixa
recorrˆ
encia em seu uso pelos usu´
arios. Buscamos entender, tamb´
em, os intervalos entre
as avaliac¸ ˜
oes dos usu´
arios. Entre todas as avaliac¸ ˜
oes registradas na cidade, analisando
os usu´
arios isoladamente, 50,3% aconteceram em um intervalo menor do que 6 horas,
2,93% aconteceram entre 6 e 24 horas, 9,45% aconteceram entre 1 dia e 1 semana, e
37,3% aconteceram em um intervalo maior do que 1 semana. Assim, verifica-se um
uso variado dessa LBSN pelos seus usu´
arios. A maioria das avaliac¸ ˜
oes aconteceram em
intervalos curtos, entretanto, ocorreu, tamb´
em, uma quantidade significativa de avaliac¸ ˜
oes
em intervalos maiores do que uma semana.
Assim como o Google Places, investigamos o potencial do Foursquare para uma
modelagem atrav´
es de redes de interesse. Considerando seus usu´
arios, 76,9% fez check-
in pelo menos 2 vezes, 47,6% fez check-in pelo menos 5 vezes, e 28.1% fez check-in pelo
menos 10 vezes. Diferente do Google Places, os usu´
arios do Foursquare apresentam uma
recorrˆ
encia maior no uso do servic¸o, bem como s˜
ao caracterizados por intervalos entre
avaliac¸ ˜
oes mais bem distribu´
ıdos. De forma a entender melhor os comportamentos dos
usu´
arios, investigamos tamb´
em os intervalos entre check-ins dos usu´
arios. Entre todos os
check-ins realizados em Curitiba, considerando os usu´
arios separadamente, 36,8% acon-
teceram em um intervalo menor do que 6 horas, 25,5% aconteceram entre 6 e 24 horas,
28,7% aconteceram entre 1 dia e 1 semana, e 9% aconteceram em um intervalo maior do
que 1 semana. ´
E poss´
ıvel notar que as avaliac¸˜
oes no Foursquare se concentram em um
per´
ıodo muito mais curto quando comparado ao Google Places.
Portanto, al´
em das diferenc¸as nas categorias, identicam-se diferenc¸as nos dados
coletados das LBSNs em relac¸˜
ao ao uso, principalmente no quesito da regularidade no
emprego por parte dos usu´
arios, das ferramentas disponibilizadas por cada LBSN.
´
E importante ressaltar que o uso de LBSNs deve sempre estar acompanhado de
uma compreens˜
ao sobre as consequˆ
encias de sua aplicabilidade. Por exemplo, os dados
do Google Places e do Foursquare podem n˜
ao representar adequadamente as redes de in-
teresse da populac¸ ˜
ao curitibana, pois os usu´
arios dessas plataformas s˜
ao, frequentemente,
pessoas jovens e com acesso a internet m´
ovel. Por´
em, ainda permite insights sobre o
comportamento desse grupo que pode ou n˜
ao representar padr˜
oes mais gerais. Observe,
tamb´
em, que esses dados foram coletados h´
a 10 anos, e, assim sendo, os resultados da
nossa an´
alise podem ser diferentes quando comparados com datasets mais recentes. En-
tretanto, a metodologia ´
e geral e em raz˜
ao das fontes de dados utilizadas nesse trabalho
estarem dispon´
ıveis publicamente, elas estabelecem um bom ponto de partida para explo-
rar abordagens para a computac¸˜
ao urbana.
3.3. Dados socioeconˆ
omicos e eleitorais
As informac¸ ˜
oes dos aspectos socioeconˆ
omicos de cada bairro de Curitiba foram adquiri-
das por meio do Censo Demogr´
afico Brasileiro de 2010 realizado pelo Instituto Brasileiro
de Geografia e Estat´
ıstica (IBGE)2. Esta pesquisa nacional teve o objetivo de retratar a
populac¸˜
ao brasileira com suas caracter´
ısticas socioeconˆ
omicas e tamb´
em fundamentar o
planejamento p´
ublico e privado para a d´
ecada entre 2010-2020. De forma a entender as
diferenc¸as entre os bairros de Curitiba, extra´
ımos os dados da renda m´
edia mensal e da
composic¸˜
ao racial, formada pelas categorias: Branca; Preta; Amarela; Parda; Ind´
ıgena.
Encontramos essas informac¸ ˜
oes para todos os bairros de Curitiba.
Para coleta dos dados eleitorais, usamos os dados disponibilizados pelo Tribu-
nal Regional Eleitoral (TRE)3em relac¸˜
ao ao 2◦turno das eleic¸ ˜
oes para presidente em
Curitiba, para o ano de 2014. A escolha desses dados ´
e motivada pelos trabalhos de
[Liu et al. 2019] e [Huang and Butts 2023], nos quais, a discrepˆ
ancia nos percentuais de
votos para um candidato presidencial nos Estados Unidos nos anos de eleic¸ ˜
oes federais no
per´
ıodo de 2004-2016, e em 2008, respectivamente, foi usada para avaliar a polarizac¸ ˜
ao
pol´
ıtica entre regi˜
oes. Por exemplo, um alto percentual de votos para democratas em uma
regi˜
ao e um baixo percentual em outra, resultava numa maior polarizac¸˜
ao.
Os dados do TRE contˆ
em as informac¸ ˜
oes da quantidade total de eleitores e a
quantidade que votou em cada candidato, em n´
ıvel de local de votac¸˜
ao organizados em
10 zonas eleitorais. Para extrair os dados para o n´
ıvel de bairro, buscamos uma fonte da
prefeitura de Curitiba que relacionasse os locais de votac¸˜
ao aos bairros, mas encontramos
apenas para os anos de 2012 e 2016. Portanto, para determinar o percentual de eleitores
que votaram em determinado candidato em cada bairro, usamos a API do Google Maps
para associar os enderec¸os dos locais de votac¸ ˜
ao, de um total de 418 locais de votac¸˜
ao, a
seus respectivos bairros, exigindo que os resultados da API fossem da cidade de Curitiba.
Com esse m´
etodo, conseguimos associar todos os locais de votac¸˜
ao aos seus respetivos
bairros. Entretanto, alguns bairros ficaram sem informac¸˜
ao relativa aos dados eleitorais.
S˜
ao eles: Centro C´
ıvico, Campina do Siqueira, Alto Da Rua XV, Riviera, S˜
ao Miguel,
2https://sidra.ibge.gov.br
3https://www.tre-pr.jus.br/eleicoes/eleicoes-anteriores/eleicoes-2014
Caximba, Lamenha Pequena, S˜
ao Jo˜
ao, Cascatinha.
Os dados socioeconˆ
omicos analisados neste trabalho e os dados eleitorais coleta-
dos para os experimentos est˜
ao mostrados na Figura 2. A distribuic¸˜
ao da renda m´
edia nos
bairros de Curitiba est´
a na Figura 2a. Para representar a composic¸˜
ao racial, a Figura 2b
apresenta a porcentagem de pessoas declaradas Pretas para cada bairro de Curitiba. Com
os dados eleitorais dos bairros, foi contabilizado o n´
umero de eleitores que votaram na-
quele bairro e calculado o percentual que votou na candidata presidencial Dilma Rousseff.
A polarizac¸˜
ao pol´
ıtica pode ser visualizada na Figura 2c. ´
E poss´
ıvel perceber na Figura
2c que alguns dos bairros de Curitiba est˜
ao em regi˜
oes perif´
ericas e, para aqueles que n˜
ao
apresentaram dados, provavelmente seus moradores votaram em bairros pr´
oximos que
pertencem `
as mesmas zonas eleitorais. Ademais, outros bairros, sem informac¸ ˜
oes eleito-
rais encontradas nesse trabalho, como o Centro C´
ıvico, s˜
ao pequenos, apesar de estarem
em regi˜
oes centrais. Uma explicac¸˜
ao poss´
ıvel para a ausˆ
encia de dados ´
e que os habitantes
desses bairros votaram, tamb´
em, em bairros pr´
oximos. Por´
em, outra possibilidade est´
a
na imprecis˜
ao do m´
etodo empregado para associar os locais de votac¸˜
ao `
a seus respectivos
bairros.
(a) Renda M´
edia Mensal (R$)
(b) Pessoas Declaradas Pretas
(%)
(c) Votos na Candidata Dilma
Rouseff (%)
Figura 2. Distribuic¸ ˜
ao das Caracter´ısticas Socioecon ˆ
omicas em Curitiba
Em 2010, a variac¸ ˜
ao de renda entre os bairros de menor e maior renda girava
em torno de 7 vezes e a populac¸˜
ao que se declara preta n˜
ao ultrapassava 7,2% do total.
O percentual de eleitores da candidata Dilma Rousseff, no ano eleitoral de 2014, n˜
ao
alcanc¸ou 45% em nenhum dos bairros analisados. Nos bairros mais pr´
oximos ao centro,
houve maior concentrac¸˜
ao de renda, de pessoas brancas e menor percentual de votac¸ ˜
ao
na candidata. O maior percentual de votac¸˜
ao dela ocorreu na regi˜
ao mais afastada (em
especial na regi˜
ao sul), em bairros de menor poder aquisitivo e onde h´
a maior participac¸ ˜
ao
da populac¸˜
ao autodeclarada preta.
4. Redes de Interesse: Modelagem e An´
alise
Esta sec¸˜
ao detalha como, neste trabalho, as redes de interesse s˜
ao modeladas atrav´
es dos
dados das avaliac¸ ˜
oes do Google Places e do Foursquare, bem como ser´
a verificada a
similaridade entre estas redes. A sec¸ ˜
ao descreve ainda o processo usado para averiguar
quais fatores podem estar associados com as conex˜
oes mais fortes da rede.
4.1. Construc¸ ˜
ao das Redes de Interesse
Para a elaborac¸˜
ao da rede de interesse dos usu´
arios do Google Places, utilizamos
apenas os dados dos usu´
arios que avaliaram pelo menos 2 vezes, independente do
estabelecimento, resultando em uma an´
alise com 1.127 usu´
arios e no conjunto de 4.590
avaliac¸ ˜
oes realizadas por eles. Com essas informac¸ ˜
oes, constru´
ımos um grafo n˜
ao
dirigido ponderado G= (V, E ), no qual o conjunto Vde n´
os identifica os bairros de
Curitiba, e uma aresta ei,j ∈Econecta o bairro vi∈Vao bairro vj∈V, com peso
wi,j ∈Nindicando a quantidade de usu´
arios que tˆ
em avaliac¸ ˜
oes de estabelecimentos
localizados em ambos os bairros. Estas arestas representam ent˜
ao o interesse de usu´
arios
por dois bairros distintos. A rede constru´
ıda conta tamb´
em com self-loops, ou seja, uma
aresta ei,i ∈Econecta um bairro vi∈Va ele mesmo, nesta aresta o peso wi,i ∈N
contabiliza a quantidade de usu´
arios que avaliou estabelecimentos localizados naquele
bairro pelo menos duas vezes. Esta construc¸˜
ao analisa redes de interesse, portanto,
considera apenas arestas n˜
ao nulas. Desse modo, obtemos um grafo para o Google Places
com 75 n´
os, contendo 1.287 arestas, sendo 53 self-loops.
Utilizando a mesma metologia descrita anteriormente, construimos a rede de inte-
resse dos usu´
arios do Foursquare, considerando 3.933 usu´
arios que avaliaram pelo menos
2 vezes e os 52.033 check-ins realizados por eles. Desta forma, foi obtido para o Fours-
quare um grafo com 75 n´
os, contendo 1.618 arestas, sendo 58 delas self-loops.
A Figura 3 ilustra as redes de interesse formadas com os dados do Google Places
(lado esquerdo) e Foursquare (lado direito). Nos grafos mostrados, o tamanho do n´
o´
e
proporcional ao seu grau, ponderado em relac¸˜
ao ao peso das arestas conectadas a ele, e a
largura da aresta ´
e proporcional ao seu peso. A diferenc¸a visual mais aparente ´
e que na
rede proveniente dos dados do Google Places, h´
a um interesse por lugares um pouco mais
afastados da regi˜
ao central da cidade, como os bairros Alto Boqueir˜
ao e Xaxim, que n˜
ao
est´
a presente na rede modelada pelos dados do Foursquare. Apesar disso, ´
e poss´
ıvel obser-
var uma semelhanc¸a visual consider´
avel entre as redes de interesse constru´
ıdas pelas duas
LBSNs estudadas. Em ambos os grafos, podemos visualizar uma grande concentrac¸ ˜
ao
de avaliac¸ ˜
oes na regi˜
ao central da cidade, em bairros como o Centro, Batel, ´
Agua Verde,
Rebouc¸as, Alto da Rua XV, onde predominam os setores de com´
ercio varejista, restau-
rantes e escrit´
orios. Bairros como Santa Felicidade e S˜
ao Francisco s˜
ao caracterizados
pela ampla presenc¸a de restaurantes t´
ıpicos, bares, hamburguerias e pubs casuais com
m´
usica ao vivo. Outros bairros como Bigorrilho, Centro C´
ıvico, Port˜
ao, Semin´
ario, Jar-
dim Botˆ
anico, Bacacheri e Cabral, s˜
ao regi˜
oes que oferecem ´
area verde extensa com seus
parques e prac¸as, al´
em de oferecer infraestuturas de com´
ercio e lazer, como shopping
centers.
(a) Rede de Interesse: usu ´
arios Google Places (b) Rede de Interesse: usu ´
arios Foursquare
Figura 3. Redes de Interesse na Cidade de Curitiba
5. Resultados
5.1. Similaridade das Redes
Para verificar a similaridade das redes constru´
ıdas atrav´
es dos dados das LBSNs analisa-
das, empregamos a correlac¸˜
ao de Pearson, um m´
etodo que avalia a presenc¸a e intensidade
de uma relac¸˜
ao linear entre dois conjuntos de vari´
aveis. Valores pr´
oximos de 1 indicam
uma relac¸˜
ao linear positiva forte, enquanto valores pr´
oximos de -1 indicam uma relac¸˜
ao
linear negativa forte. Na comparac¸ ˜
ao das redes, associamos o peso da aresta da rede do
Google Places com a sua respectiva aresta na rede do Foursquare, e, em seguida, cal-
culamos a correlac¸˜
ao de Pearson, usando todo o conjunto de arestas que est˜
ao presentes
em ambos os grafos. O resultado da correlac¸˜
ao foi de 0,875. Testamos, tamb´
em, outras
m´
etricas, como a correlac¸ ˜
ao de Spearman, mas os resultados foram similares. Portanto,
existe uma forte indicac¸˜
ao, atrav´
es das arestas, de similaridade dessas redes de interesse.
Al´
em disso, verificamos a similaridade em relac¸ ˜
ao `
a centralidade por autovetor
de ambas as redes. Isto ´
e, computamos a centralidade por autovetor de cada bairro em
cada uma das redes de interesse. Esse m´
etodo indica a importˆ
ancia de um n´
o na rede
tendo por base a importˆ
ancia dos n´
os com os quais ele est´
a conectado. Para investigar a
similaridade, empregamos o coeficiente de correlac¸˜
ao de Kendall’s Tau. Este coeficiente
´
e utilizado para avaliar a semelhanc¸a entre as ordens de dois conjuntos de dados. Va-
lores pr´
oximos de 1 indicam uma ordenac¸˜
ao semelhante, enquanto valores pr´
oximos de
-1 sugerem ordenac¸ ˜
oes bastante distintas. Atribuindo um identificador para cada bairro,
comparamos o ranking dos bairros, em ordem decrescente, entre as duas redes de inte-
resse. O resultado foi uma correlac¸ ˜
ao de 0.646, indicando uma moderada conex˜
ao entre
as caracter´
ısticas de centralidade para as duas fontes de dados. Uma comparac¸˜
ao entre
oranking dos bairros ´
e exposta na Figura 4, na qual, apresentamos os 20 bairros mais
centrais, pela centralidade de autovetor, na rede de interesse do Google Places e seus res-
pectivos ranks na rede de interesse do Foursquare. Observa-se, visualmente, pequenas
variac¸ ˜
oes na ordem dos bairros na comparac¸˜
ao das bases. Entretanto, elas mantˆ
em uma
relativa proximidade, representando a moderada relac¸˜
ao entre as centralidades, j´
a indicada
pelo coeficiente de Kendall’s Tau. A diferente natureza das LBSNs pode ser uma poss´
ıvel
explicac¸˜
ao para essas pequenas diferenc¸as encontradas na quest˜
ao de quais bairros s˜
ao
mais valorizados pelos seus respectivos usu´
arios. Com essa an´
alise ´
e poss´
ıvel concluir
que os 4 bairros mais centrais s˜
ao os mesmos para as duas LBSNs e, para esses bairros,
uma an´
alise a partir de uma rede de interesse poderia ser complementada por dados da
outra.
Figura 4. Comparac¸ ˜
ao Dos Bairros Mais Centrais De Curitiba Em Relac¸ ˜
ao `
A Cen-
tralidade Por Autovetor
5.2. C´
alculo das Distˆ
ancias entre Fatores Socioeconˆ
omicos e Pol´
ıticos
Nesta sec¸˜
ao, o objetivo da an´
alise ´
e entender se h´
a fatores extras (socioeconˆ
omicos, elei-
torais e geogr´
aficos) nas regi˜
oes analisadas influenciando o interesse dos frequentadores
dessas regi˜
oes. Para isso, relacionamos os pesos das arestas com as distˆ
ancias entre um
determinado fator. Os fatores socioeconˆ
omicos considerados em cada regi˜
ao foram, a
renda m´
edia mensal, a composic¸ ˜
ao racial, o fator pol´
ıtico foi a polarizac¸˜
ao e o ´
ultimo
fator extra considerado foi a posic¸˜
ao geogr´
afica.
Para tanto, usamos a diferenc¸a absoluta para a renda m´
edia mensal entre dois
bairros e a escolha pol´
ıtica para eleic¸˜
ao presidencial, de maneira similar aos trabalhos de
[Huang and Butts 2023] e [Liu et al. 2019]. Para a diferenc¸a entre as composic¸ ˜
oes raciais,
usamos o mesmo m´
etodo de [Huang and Butts 2023], no qual a diferenc¸ a entre os bairros
AeB´
e definida como
RA,B =1
2
n
X
i=1
P(A)i
P(A)−P(B)i
P(B)
onde RA,B ´
e a diferenc¸a das composic¸ ˜
oes raciais entre os bairros AeB,P(A)repre-
senta o tamanho da populac¸˜
ao do bairro AeP(A)io tamanho da populac¸ ˜
ao que pertence
`
a i-´
esima categoria racial no bairro A. Usamos as categorias definidas pelo Censo De-
mogr´
afico Brasileiro de 2010: Branca, Preta, Amarela, Parda e Ind´
ıgena.
De modo a compreender melhor como essas distˆ
ancias se aplicam para a cidade
de Curitiba, a Figura 5 mostra um sub-grafo das distˆ
ancias entre fatores pol´
ıticos e socioe-
conˆ
omicos para alguns dos bairros mais centrais de ambas as redes de interesse. A cor do
n´
o´
e proporcional ao valor do fator do aspecto analisado. Desse modo, cores mais escu-
ras representam valores mais altos e cores mais claras est˜
ao associadas com valores mais
baixos, levando-se em considerac¸˜
ao apenas o subconjunto de bairros apresentado. Para a
polarizac¸˜
ao pol´
ıtica, cores mais escuras representam um percentual maior de votos para a
candidata presidencial Dilma Rouseff. Na composic¸˜
ao racial, foi escolhido o percentual
de pessoas declaradas Preta naquele bairro para a representac¸˜
ao. Enquanto que na renda
m´
edia mensal, n´
os mais escuros est˜
ao associados com maiores rendas. A cor da aresta ´
e
proporcional `
a diferenc¸a entre os fatores dos bairros, cores mais escuras est˜
ao associadas
com distˆ
ancias maiores, e cores mais claras representam diferenc¸as menores. Nas Figuras
5b e 5c, as diferenc¸as usadas nas arestas consideram, como explicado anteriormente, toda
a composic¸˜
ao racial e de renda mensal, respectivamente.
5.3. Correlac¸ ˜
oes Entre Redes de Interesse
Para compreender melhor os fatores associados com as regi˜
oes de interesse dos frequenta-
dores, relacionamos cada peso de aresta com a sua distˆ
ancia nas caracter´
ısticas analisadas
(renda m´
edia mensal, composic¸ ˜
ao racial, polarizac¸ ˜
ao pol´
ıtica, posic¸˜
ao geogr´
afica), para
ambos os grafos. Utilizando a correlac¸ ˜
ao de Spearman, os resultados para ambas as redes,
considerando a informac¸˜
ao tanto das redes de interesse completas (mostradas na Figura 3)
quanto de redes de interesse filtradas, s˜
ao apresentados na Tabela 1. Para a distˆ
ancia
geogr´
afica, usamos os centroides de cada bairro e calculamos a distˆ
ancia usando a bi-
blioteca geopandas [Jordahl et al. 2020] do Python, onde transformamos as coordenadas
geogr´
aficas de latitude e longitude do sistema de coordenadas WGS84, para a projec¸ ˜
ao
plana UTM22S que traz a projec¸˜
ao mais precisa da regi˜
ao onde se encontra Curitiba, e
calculamos a distˆ
ancia geogr´
afica entre dois bairros, olhando para os seus centroides, em
metros. A biblioteca utiliza a distˆ
ancia Euclidiana para os pontos na projec¸˜
ao plana e,
baseado na projec¸˜
ao, retorna a distˆ
ancia geogr´
afica entre os centroides dos bairros em
metros.
Nas redes de interesse completas, conforme j´
a destacado, observamos o impacto
de todas as arestas encontradas. J´
a na rede de interesse filtrada, consideramos apenas as
arestas com peso superior ou igual a 5, focando apenas nas ´
areas conectadas por interesse
mais elevado. Para a rede de interesse filtrada, a modelagem do Google Places apresentou
(a) Polarizac¸ ˜
ao Pol´ıtica (b) Composic¸ ˜
ao Racial
(c) Renda M´
edia Mensal
Figura 5. Sub-Grafo das Dist ˆ
ancias Entre Fatores socioeconˆ
omicos
apenas 418 arestas do total de 1.287 (32,5%) arestas da rede completa, enquanto os dados
do Foursquare apresentaram 1.169 arestas do total de 1.618 (72,2%).
Os resultados indicam que os fatores de renda m´
edia mensal, composic¸ ˜
ao racial
e polarizac¸˜
ao pol´
ıtica n˜
ao ajudam a explicar o interesse de frequentadores por determi-
nadas regi˜
oes. Isso significa que as pessoas n˜
ao costumam frequentar, necessariamente,
lugares que sejam similares em renda, rac¸a, ou opini ˜
oes pol´
ıticas, quando seus interesses
s˜
ao modelados por essas LBSNs. Apesar da composic¸ ˜
ao racial apresentar um coeficiente
de −0.25, o maior valor absoluto entre os fatores de renda m´
edia, composic¸˜
ao racial e
polarizac¸˜
ao pol´
ıtica, quando analisando a rede de interesse completa do Google Places,
pode-se perceber que ´
e um valor inferior quando comparado ao impacto da distˆ
ancia ge-
ogr´
afica em todos os cen´
arios analisados na Tabela 1. Isso indica que quanto maior a
distˆ
ancia geogr´
afica entre dois bairros, a tendˆ
encia ´
e de se encontrar arestas com pesos
menores. No mais, ´
e poss´
ıvel observar que a distˆ
ancia geogr´
afica tem um peso maior
na rede modelada pelo Foursquare. Uma explicac¸ ˜
ao plaus´
ıvel ´
e a diferente natureza no
uso das LBSNs pelos seus usu´
arios. Entretanto, o resultado com a maior influˆ
encia da
distˆ
ancia geogr´
afica j´
a era esperado, pois diversos outros trabalhos [Cheng et al. 2021]
[Gonz´
alez et al. 2008] [Rhee et al. 2008] [Brockmann et al. 2006] explicam a tendˆ
encia
das distˆ
ancias percorridas pelos usu´
arios em LBSNs, e em outros formatos de dados si-
milares, apresentarem uma maior frequˆ
encia em distˆ
ancias curtas e serem mais raras em
distˆ
ancias maiores como demonstramos.
Tabela 1. Resultados das Correlac¸ ˜
oes de Spearman com os Fatores Analisados
Google Places Google Places Foursquare Foursquare
Completo Filtrado Completo Filtrado
Renda m´
edia mensal -0.09 -0.10 0.06 -0.04
Composic¸˜
ao Racial -0.25 -0.19 -0.11 -0.20
Polarizac¸˜
ao Pol´
ıtica -0.23 -0.14 -0.09 -0.15
Distˆ
ancia Geogr´
afica -0.38 -0.30 -0.55 -0.44
6. Conclus˜
ao
Entender o comportamento urbano ´
e uma tarefa desafiadora. Nesse trabalho, investigamos
se diferentes LBSNs poderiam fornecer informac¸ ˜
oes similares ao modelar o interesse de
usu´
arios por ´
areas geogr´
aficas. Conclu´
ımos, atrav´
es de uma an´
alise nas caracter´
ısticas
dos dois datasets analisados (Google Places e Foursquare) e dados coletados em Curitiba,
que os grafos obtidos a partir das escolhas dos usu´
arios, denominados neste trabalho de
redes de interesse, modelam a dinˆ
amica nas ac¸ ˜
oes de seus usu´
arios de maneira bastante
parecida, em especial para as conex˜
oes entre bairros mais centrais da cidade.
Al´
em disso, examinamos a possibilidade de compreender as escolhas dos usu´
arios
de LBSNs, em relac¸˜
ao ao seu interesse por regi˜
oes urbanas, usando caracter´
ısticas socio-
econˆ
omicas, de polarizac¸ ˜
ao pol´
ıtica e distˆ
ancia geogr´
aficas das regi˜
oes frequentadas por
eles. Desse modo, descobrimos que, para os dados analisados, fatores como renda m´
edia,
composic¸˜
ao racial e polarizac¸˜
ao pol´
ıtica das diferentes regi˜
oes analisadas (bairros de Cu-
ritiba) n˜
ao influenciam a escolha por essas regi˜
oes. Entretanto, inferimos que a distˆ
ancia
geogr´
afica entre os bairros analisados pode atuar como um limitante em suas interac¸ ˜
oes,
pois existe uma tendˆ
encia de se frequentar lugares que sejam mais pr´
oximos.
Em trabalhos futuros, seria interessante explorar datasets mais recentes, bem
como outras cidades, tanto para comparar se as diferentes LBSNs continuam fornecendo
informac¸ ˜
oes similares, quanto para investigar quais fatores influenciam as redes de inte-
resse ao longo do tempo. Desse modo, poderiam ser investigados outros fatores, como
a cultura, os tipos de estabelecimento, o conte´
udo das avaliac¸˜
oes realizadas, estudando,
por exemplo, sentimentos e t´
opicos expressados, entre outros. Estes novos fatores com-
plementariam a an´
alise, ajudando a responder perguntas como se os locais que as pessoas
frequentam no cen´
ario urbano s˜
ao similares em cultura, se os usu´
arios costumam fre-
quentar os mesmos tipos de estabelecimentos em diferentes bairros, ou se cada bairro
´
e mais caracterizado por uma classe espec´
ıfica de locais, e se as regi˜
oes mais conecta-
das nas redes de interesse formadas compartilham de um mesmo sentimento por parte de
seus usu´
arios. Isto permitiria um melhor entendimento do fen ˆ
omeno do comportamento
urbano e a dinˆ
amica nas cidades em relac¸˜
ao `
as regi˜
oes que as pessoas costumam frequen-
tar. Com uma melhor compreens˜
ao sobre os fatores associados com os interesses das
populac¸ ˜
oes de cada cidade, essas an´
alises poderiam integrar sistemas de recomendac¸˜
ao,
trazendo o aspecto das caracter´
ısticas de cada bairro. Ademais, esse tipo de investigac¸˜
ao
tem o potencial de indicar aos ´
org˜
aos p´
ublicos, quais regi˜
oes est˜
ao mais interligadas en-
tre si, permitindo pol´
ıticas p´
ublicas voltadas, por exemplo, ao combate a epidemias ou `
a
promoc¸˜
ao da integrac¸˜
ao social entre regi˜
oes antes pouco conectadas.
7. Agradecimentos
Esta pesquisa foi parcialmente apoiada pelo projeto SocialNet (processo 2023/00148-0 da Fundac¸ ˜
ao de Amparo `
a Pesquisa do Estado
de S˜
ao Paulo - FAPESP) e pelo Conselho Nacional de Desenvolvimento Cient´
ıfico e Tecnol´
ogico - CNPq (processos 313122/2023-7,
314603/2023-9 e 441444/2023-7).
Referˆ
encias
Brockmann, D., Hufnagel, L., and Geisel, T. (2006). The scaling laws of human travel. Nature, 439(7075):462–465.
Cheng, Z., Caverlee, J., Lee, K., and Sui, D. (2021). Exploring millions of footprints in location sharing services. Proceedings of the
International AAAI Conference on Web and Social Media, 5(1):81–88.
Ferreira, A. P., Silva, T. H., and Loureiro, A. A. (2020). Uncovering spatiotemporal and semantic aspects of tourists mobility using
social sensing. Computer Communications, 160:240–252.
Ferreira, A. P. G., Silva, T. H., and Loureiro, A. A. F. (2015). Beyond sights: Large scale study of tourists’ behavior using foursquare
data. In 2015 IEEE International Conference on Data Mining Workshop (ICDMW), pages 1117–1124.
Gonz´
alez, M. C., Hidalgo, C. A., and Barab´
asi, A.-L. (2008). Understanding individual human mobility patterns. Nature,
453(7196):779–782.
He, R., Kang, W.-C., and McAuley, J. (2017). Translation-based recommendation. In Proceedings of the Eleventh ACM Conference
on Recommender Systems, RecSys ’17. ACM.
Huang, P. and Butts, C. T. (2023). Rooted america: Immobility and segregation of the intercounty migration network. American
Sociological Review, 88(6):1031–1065.
Jordahl, K., den Bossche, J. V., Fleischmann, M., Wasserman, J., McBride, J., Gerard, J., Tratner, J., Perry, M., Badaracco, A. G.,
Farmer, C., Hjelle, G. A., Snow, A. D., Cochran, M., Gillies, S., Culbertson, L., Bartos, M., Eubank, N., maxalbert, Bilogur, A.,
Rey, S., Ren, C., Arribas-Bel, D., Wasser, L., Wolf, L. J., Journois, M., Wilson, J., Greenhall, A., Holdgraf, C., Filipe, and Leblanc,
F. (2020). geopandas/geopandas: v0.8.1.
Ladeira, L., Souza, A., Filho, G. R., Silva, T. H., and Villas, L. (2019). Servic¸o de sugest˜
ao de rotas seguras para ve´
ıculos. In Anais do
XXXVII Simp´
osio Brasileiro de Redes de Computadores e Sistemas Distribu´
ıdos, pages 608–621, Porto Alegre, RS, Brasil. SBC.
Liu, X., Andris, C., and Desmarais, B. A. (2019). Migration and political polarization in the u.s.: An analysis of the county-level
migration network. PLOS ONE, 14(11):e0225405.
Mart´
ı, P., Serrano-Estrada, L., and Nolasco-Cirugeda, A. (2019). Social media data: Challenges, opportunities and limitations in urban
studies. Computers, Environment and Urban Systems, 74:161–174.
Nolasco-Cirugeda, A. and Garc´
ıa-Mayor, C. (2022). Social dynamics in cities: Analysis through lbsn data. Procedia Computer
Science, 207:877–886.
Pasricha, R. and McAuley, J. (2018). Translation-based factorization machines for sequential recommendation. In Proceedings of the
12th ACM Conference on Recommender Systems, RecSys ’18. ACM.
Rhee, I., Shin, M., Hong, S., Lee, K., and Chong, S. (2008). On the levy-walk nature of human mobility. In IEEE INFOCOM 2008 -
The 27th Conference on Computer Communications. IEEE.
Santala, V., Miczevski, S., de Brito, S. A., Baldykowski, A. L., Gadda, T., Kozievitch, N., and Silva, T. H. (2017). Making sense of
the city: Exploring the use of social media data for urban planning and place branding. In Anais do I Workshop de Computac¸˜
ao
Urbana, Porto Alegre, RS, Brasil. SBC.
Senefonte, H. C. M., Delgado, M. R., L¨
uders, R., and Silva, T. H. (2022). Predictour: Predicting mobility patterns of tourists based on
social media user’s profiles. IEEE Access, 10:9257–9270.
Silva, T. H., de Melo, P. O. S. V., Almeida, J. M., and Loureiro, A. A. F. (2017). Uma fotografia do instagram: Caracterizac¸˜
ao e
aplicac¸ ˜
ao. Revista Brasileira de Redes de Computadores e Sistemas Distribu´
ıdos.
Silva, T. H. and Loureiro, A. A. (2016). Computac¸ ao urbana: T´
ecnicas para o estudo de sociedades com redes de sensoriamento
participativo. Sociedade Brasileira de Computac¸ ˜
ao.
Silva, T. H. and Silver, D. (2024). Using graph neural networks to predict local culture. arXiv.
Silva, T. H., Vaz de Melo, P. O. S., Almeida, J. M., Salles, J., and Loureiro, A. A. F. (2013). A comparison of foursquare and
instagram to the study of city dynamics and urban social behavior. In Proc. ACM SIGKDD Int. Workshop on Urban Computing
(UrbComp’13), Chicago, USA.
Silva, T. H., Viana, A. C., Benevenuto, F., Villas, L., Salles, J., Loureiro, A., and Quercia, D. (2019). Urban computing leveraging
location-based social network data: A survey. ACM Computing Surveys, 52(1):1–39.
Silver, D. and Silva, T. H. (2023). Complex causal structures of neighbourhood change: Evidence from a functionalist model and yelp
data. Cities, 133:104130.
Skora, L. E., Senefonte, H. C., Delgado, M. R., L¨
uders, R., and Silva, T. H. (2022). Comparing global tourism flows measured by
official census and social sensing. Online Social Networks and Media, 29:100204.
Veiga, D. A. M., Frizzo, G. B., and Silva, T. H. (2019). Cross-cultural study of tourists mobility using social media. In Proceedings of
the 25th Brazillian Symposium on Multimedia and the Web, WebMedia ’19, page 313–316, New York, NY, USA. Association for
Computing Machinery.