Conference PaperPDF Available

Redes de Interesse: comparando o Google Places e Foursquare na captura da escolha de usuários por áreas urbanas

Authors:

Abstract

As Redes Sociais Baseadas em Localização (LBSNs) são úteis na compreensão do comportamento urbano, oferecendo dados valiosos sobre preferências dos usuários. A modelagem desses dados em grafos, como as Redes de Interesse, permite percepções relevantes. Essas redes podem ser úteis para, por exemplo, recomendações de áreas urbanas, previsões de mobilidade e formulação de políticas públicas. Este estudo compara redes de interesse de duas LBSNs distintas, Foursquare e Google Places, usando dados de check-ins e avaliações de estabelecimentos. Embora as LBSNs estudadas sejam diferentes em natureza, com dados diferindo em regularidade e propósito, ambas as redes de interesse modeladas revelaram padrões similares de comportamento urbano. Fatores socioeconômicos e geográficos também mostraram impacto semelhante nas redes de interesse estudadas.
Redes de Interesse: comparando o Google Places e Foursquare
na captura da escolha de usu´
arios por ´
areas urbanas
Gustavo H. Santos1, Fernanda R. Gubert1,
Myriam Delgado1, Thiago H. Silva1
1Universidade Tecnol´
ogica Federal do Paran´
a (UTFPR)
Departamento Acadˆ
emico de Inform´
atica
Curitiba, Brasil
gustavohenriquesantos,fernandagubert@alunos.utfpr.edu.br
myriamdelg,thiagoh@utfpr.edu.br
Abstract. Location-Based Social Networks (LBSNs) are valuable for unders-
tanding urban behavior and provide useful data on user preferences. Modeling
this data into graphs, such as Interest Network (iNET), enables significant in-
sights. These networks can be helpful for urban area recommendations, mobility
forecasts, and public policy formulation. This study uses check-in data and es-
tablishment reviews to compare the iNETs resulting from two distinct LBSNs,
Foursquare and Google Places. Although the studied LBSNs differ in nature,
with data varying in regularity and purpose, both modeled iNETs revealed simi-
lar urban behavior patterns, and were likewise impacted by socioeconomic and
geographic factors.
Resumo. As Redes Sociais Baseadas em Localizac¸ ˜
ao (LBSNs) s˜
ao ´
uteis na
compreens˜
ao do comportamento urbano, oferecendo dados valiosos sobre pre-
ferˆ
encias dos usu´
arios. A modelagem desses dados em grafos, como as Re-
des de Interesse, permite percepc¸˜
oes relevantes. Essas redes podem ser ´
uteis
para, por exemplo, recomendac¸ ˜
oes de ´
areas urbanas, previs˜
oes de mobilidade
e formulac¸ ˜
ao de pol´
ıticas p´
ublicas. Este estudo compara redes de interesse de
duas LBSNs distintas, Foursquare e Google Places, usando dados de check-ins
e avaliac¸ ˜
oes de estabelecimentos. Embora as LBSNs estudadas sejam diferentes
em natureza, com dados diferindo em regularidade e prop´
osito, ambas as redes
de interesse modeladas revelaram padr˜
oes similares de comportamento urbano.
Fatores socioeconˆ
omicos e geogr´
aficos tamb´
em mostraram impacto semelhante
nas redes de interesse estudadas.
1. Introduc¸ ˜
ao
Dados de Redes Sociais Baseadas em Localizac¸ ˜
ao (do inglˆ
es, Location-Based Social
Networks LBSNs) auxiliam no entendimento de diversas quest˜
oes no contexto
da computac¸˜
ao urbana [Ferreira et al. 2015, Santala et al. 2017, Silva et al. 2017,
Ladeira et al. 2019, Veiga et al. 2019, Ferreira et al. 2020, Senefonte et al. 2022,
Silver and Silva 2023, Silva and Silver 2024]. Em particular, devido ao fato das LBSNs
fornecerem dados urbanos que implicitamente tˆ
em aspectos sociais, como preferˆ
encias
de usu´
arios [Silva and Loureiro 2016, Silva et al. 2019], uma modelagem apropriada
pode proporcionar informac¸ ˜
oes valiosas para o entendimento do comportamento de
usu´
arios em contextos urbanos.
Uma estrutura popular para representar dados de LBSNs s˜
ao grafos (ou redes)
[Silva et al. 2019]. Exemplos desse tipo de dado poderiam ser obtidos atrav´
es de ativida-
des geolocalizadas em LBSNs realizadas por um grupo de usu´
arios, como as avaliac¸ ˜
oes
em estabelecimentos de uma cidade sob an´
alise. Estas avaliac¸ ˜
oes poderiam ser agregadas
em um grafo n˜
ao direcionado no qual os n´
os representam bairros da cidade onde os dados
foram compartilhados e as arestas conectam os bairros que foram visitados pelo mesmo
usu´
ario. Este tipo de modelagem origina o que chamamos neste trabalho de Redes de
Interesse ver Sec¸˜
ao 4.1 para mais detalhes.
Redes de interesse podem ser ´
uteis em diferentes situac¸ ˜
oes. Por exemplo, ao
permitirem um melhor entendimento do interesse de usu´
arios por determinados espac¸os
f´
ısicos da cidade, elas poderiam facilitar a recomendac¸˜
ao de ´
areas geogr´
aficas, promover
a melhoria de previs˜
oes de mobilidade, e tamb´
em fomentar novas pol´
ıticas p´
ublicas para
ampliar o interesse de usu´
arios por certas ´
areas da cidade.
Nesse contexto, o presente trabalho tem como objetivo principal comparar redes
de interesse modeladas utilizando dados provenientes de duas LBSNs: Foursquare e Goo-
gle Places. No Foursquare utilizamos dados de check-ins, ato de compartilhar com amigos
um estabelecimento onde um usu´
ario se encontra. J´
a no Google Places utilizamos dados
de avaliac¸ ˜
oes de estabelecimentos. Ambos capturam o tipo de local onde o usu´
ario se en-
contra, por exemplo, um restaurante ou uma livraria. No entanto, eles s˜
ao dados distintos,
pois um check-in tem uma natureza pr´
oxima de tempo real, pois indica onde o usu´
ario
se encontra em um determinado momento, j´
a uma avaliac¸˜
ao n˜
ao necessariamente ´
e feita
enquanto o usu´
ario est´
a no estabelecimento. Com isso, visamos entender se LBSNs dife-
rentes capturam informac¸ ˜
oes similares na modelagem dos dados via redes de interesse.
Nosso estudo indica que o Google Places e Foursquare apresentam padr˜
oes simila-
res quando usados para investigar o comportamento urbano. Esse resultado ´
e interessante,
pois as LBSNs contˆ
em aspectos diferentes quanto `
a regularidade e no prop´
osito de seus
usos. Al´
em disso, a influˆ
encia de fatores socioeconˆ
omicos e geogr´
aficos foi investigada,
e seu impacto nas redes de interesse estudadas apresentou uma grande semelhanc¸a.
O restante do artigo est´
a organizado da seguinte maneira. A Sec¸ ˜
ao 2 apresenta os
trabalhos relacionados. A Sec¸ ˜
ao 3 explica as bases de dados usadas e suas caracter´
ısticas.
Na Sec¸˜
ao 4, s˜
ao apresentados os m´
etodos utilizados nesse trabalho. A Sec¸ ˜
ao 5 discute os
resultados. Finalmente, a Sec¸ ˜
ao 6 apresenta a conclus˜
ao desse artigo.
2. Trabalhos Relacionados
Nesta sec¸˜
ao abordamos alguns estudos pr´
evios que exploraram o potencial de se usar
LBSNs para a compreens˜
ao do comportamento urbano e a investigac¸˜
ao da dinˆ
amica das
cidades. O trabalho de [Silva et al. 2013] investigou a possibilidade de se usar dois siste-
mas diferentes, um do Instagram e outro do Foursquare, coletando dados para os quais a
localizac¸˜
ao era compartilhada. O artigo buscou entender se a informac¸ ˜
ao obtida poderia
ser complementar e/ou similar para as duas bases, nos padr˜
oes relacionados `
as dinˆ
amicas
das cidades e comportamento urbano. A partir disso, conclu´
ıram que os dois datasets
proporcionavam informac¸ ˜
oes compat´
ıveis e complementares, no qual, por exemplo, um
check-in do Foursquare poderia trazer a informac¸˜
ao da categoria de um estabelecimento
comentado em uma publicac¸ ˜
ao do Instagram, e capturavam ainda aspectos urbanos de
forma similar, como as regi˜
oes mais populares das cidades.
Em [Mart´
ı et al. 2019], os autores exploram o potencial do uso de dados de
LBSNs como Foursquare, Twitter, Google Places, Instagram e Airbnb para pesquisas
de fenˆ
omenos urbanos, reconhecendo n˜
ao s´
o os benef´
ıcios mas tamb´
em os desafios que o
uso dessas fontes de dados acarreta. O estudo apresenta pesquisas que utilizam dados das
LBSNs para analisar a dinˆ
amica da cidade e prop˜
oe uma metodologia para recuperac¸˜
ao,
selec¸˜
ao, classificac¸˜
ao e an´
alise de dados. Tamb´
em identifica as principais linhas de
investigac¸˜
ao tem´
aticas com base nas vari´
aveis de dados fornecidas por estas plataformas,
com o objetivo de oferecer um quadro abrangente para o estudo dos fenˆ
omenos urbanos
atrav´
es de dados LBSNs.
Outros trabalhos buscam entender quais fatores podem estar associados aos
padr˜
oes de movimento das pessoas. Por exemplo, [Cheng et al. 2021] usou dados geo-
localizados do Twitter para compreender as movimentac¸ ˜
oes dos usu´
arios. Os autores
associaram essas informac¸ ˜
oes espaciais com as caracter´
ısticas econˆ
omicas dos usu´
arios,
dos aspectos geogr´
aficos das regi˜
oes frequentadas, bem como seu posicionamento dentro
da rede social e a linguagem usada em seus check-ins. Assim, identificaram a presenc¸a
do modelo L´
evy Flight em relac¸˜
ao `
a mobilidade, no qual distˆ
ancias curtas s˜
ao percorridas
com mais frequˆ
encia, e distˆ
ancias maiores acontecem de forma mais rara. Apresenta-
ram, tamb´
em, a influˆ
encia da densidade populacional e da popularidade na rede social
para com as distˆ
ancias percorridas pelos usu´
arios. Al´
em disso, empregaram o uso da
an´
alise de sentimento para agregar contexto `
as avaliac¸ ˜
oes e aos padr˜
oes relacionados aos
usu´
arios.
O estudo realizado em [Nolasco-Cirugeda and Garc´
ıa-Mayor 2022] mostra como
os dados do Foursquare, Twitter e Google Places s˜
ao cruciais para analisar o uso do espac¸o
urbano e a dinˆ
amica social. Ao detalhar pesquisas e estudos de caso pioneiros na ´
ultima
d´
ecada, o artigo mostra como os dados da LBSN oferecem informac¸ ˜
oes importantes so-
bre a vida urbana, auxiliando na compreens˜
ao da dinˆ
amica social e intervenc¸ ˜
oes urbanas
espec´
ıficas. A pesquisa emprega v´
arias abordagens anal´
ıticas em escala para lidar com
diversas quest˜
oes urbanas, desde o dinamismo da vizinhanc¸a social at´
e o turismo e pre-
ferˆ
encias de infraestrutura verde, destacando o potencial anal´
ıtico abrangente dos dados
LBSN.
O trabalho [Skora et al. 2022] examinou se as informac¸ ˜
oes extra´
ıdas de dados do
Foursquare poderiam se assemelhar as informac¸ ˜
oes divulgadas pela WTO (World Tou-
rism Organization). O estudo encontrou o potencial de se usar LBSNs para facilitar a
compreens˜
ao dos movimentos tur´
ısticos em escalas maiores e com mais detalhes do que
por fontes tradicionais, apesar de limitac¸ ˜
oes associadas `
as LBSNs, como o uso predomi-
nante de pessoas jovens com acesso `
a internet.
J´
a o estudo [Huang and Butts 2023] investigou diversas caracter´
ısticas socioe-
conˆ
omicas e buscou entender quais delas impactavam a migrac¸ ˜
ao entre condados nos
Estados Unidos. Esse trabalho examinou a hip´
otese de que migrac¸ ˜
oes aconteciam entre
regi˜
oes similares, propondo uma teoria de segregac¸˜
ao e imobilidade social em relac¸˜
ao
`
a essas movimentac¸ ˜
oes. Para as suas an´
alises, os autores utilizam um modelo temporal
de grafos. Neste tipo de modelo, configurac¸ ˜
oes espec´
ıficas de parˆ
ametros permitem uma
an´
alise do comportamento das pessoas, em simulac¸ ˜
oes onde, por exemplo, a segregac¸˜
ao
pol´
ıtica ´
e desconsiderada.
Como abordado em alguns dos trabalhos relacionados, esse estudo tamb´
em se
baseia no uso de LBSNs, mas com um foco em entender se duas LBSNs diferentes podem
modelar o comportamento urbano em redes de interesse de forma similar, bem como se o
uso de caracter´
ısticas socioeconˆ
omicas s˜
ao suficientes para entender e explicar o interesse
das pessoas na escolha das ´
areas urbanas que elas frequentam.
3. Fontes de Dados
Esta sec¸˜
ao descreve como foram obtidos os dados para a modelagem das redes de interesse
de usu´
arios localizados em diferentes bairros da cidade de Curitiba. Esta foi escolhida por
ser uma cidade com a qual os autores est˜
ao mais familiarizados. A sec¸ ˜
ao detalha ainda
as caracter´
ısticas dos datasets resultantes, bem como as informac¸ ˜
oes sobre a coleta das
caracter´
ısticas socioeconˆ
omicas de cada bairro analisado.
3.1. Datasets utilizados
Google Places: O dataset do Google Places foi constru´
ıdo extraindo-se avaliac¸ ˜
oes re-
alizadas por usu´
arios da rede social Google Plus em estabelecimentos cadastrados no
servic¸o Google Maps. Os dados1foram disponibilizado pelos autores de [He et al. 2017]
e [Pasricha and McAuley 2018] para pesquisas. Eles buscavam viabilizar o estudo da
LBSN, abrangendo o mundo todo. A partir desses estudos, foram selecionados os dados
da cidade de Curitiba, para formar o nosso dataset. Esses dados contˆ
em informac¸ ˜
oes de-
talhadas como o nome do usu´
ario, informac¸ ˜
oes sobre seu n´
ıvel de educac¸˜
ao e emprego,
texto da avaliac¸˜
ao (que pode estar em diversas l´
ınguas), nota da avaliac¸˜
ao, momento em
que a avaliac¸˜
ao ocorreu, identificador ´
unico do usu´
ario. H´
a ainda informac¸ ˜
oes espec´
ıficas
do local avaliado, como por exemplo, o nome do estabelecimento, categoria `
a qual o local
pertence, hor´
ario de funcionamento, telefone de contato da empresa, enderec¸o, latitude e
longitude do estabelecimento.
Foursquare: Usamos, tamb´
em, fonte de dados, ofertada publicamente, extra´
ıda da rede
social baseada em localizac¸ ˜
ao Foursquare, atrav´
es de check-ins da plataforma divulga-
dos na rede social Twitter. O nosso dataset do Foursquare ´
e composto por check-ins de
usu´
arios na cidade de Curitiba. Ele inclui informac¸ ˜
oes como a data do check-in, o local
onde ocorreu, a categoria a qual o local pertence e o identificador ´
unico do usu´
ario. Os
dados est˜
ao bem distribu´
ıdos ao longo de 3 meses, de Abril a Junho de 2014. O dataset
´
e composto por 5.116 usu´
arios que fizeram 53.253 check-ins em 8.523 lugares diferentes
dentro da cidade.
3.2. Caracterizac¸ ˜
ao dos Datasets: Google Places ×Foursquare
No Google Places existem 685 categorias distintas de estabelecimentos, como, por exem-
plo, restaurantes, h´
oteis, bares, cafeterias, loja de carros usados, parques, shoppings, pa-
darias, universidades, cinemas e escolas. Na Figura 1a ´
e poss´
ıvel visualizar as 50 catego-
rias mais avaliadas, com um destaque especial para locais de lazer, como restaurantes de
variadas especialidades. Os dados contˆ
em 8.372 avaliac¸˜
oes de 4.909 usu´
arios em 2.213
estabelecimentos. Esses dados est˜
ao distribu´
ıdos ao longo dos anos de 2010 at´
e 2014,
com grande concentrac¸˜
ao nos anos de 2011-2014, sendo 2013 o ano com o maior n´
umero
de avaliac¸ ˜
oes, com um total de 4.003 avaliac¸˜
oes. J´
a o Foursquare cont´
em 368 categorias
1https://cseweb.ucsd.edu/jmcauley/datasets.html#google local
distintas, de maneira similar ao Google Places, e as 50 categorias com mais avaliac¸ ˜
oes
s˜
ao mostradas na Figura 1b.
(a) Google Places (b) Foursquare
Figura 1. Word Cloud das 50 Categorias Mais Avaliadas na Cidade de Curitiba
Ao comparar as categorias mais avaliadas de ambas as LBSNs, ´
e evidente a
diferenc¸a nas categorias dos dados do Google Places em relac¸ ˜
ao aos dados do Foursquare.
Por exemplo, o Foursquare traz informac¸˜
oes sobre as residˆ
encias e locais de trabalho dos
usu´
arios, algo n˜
ao presente no Google Places.
Como este trabalho ´
e focado na modelagem, atrav´
es de redes de interesse, de es-
tabelecimentos que as pessoas frequentam, verificamos tamb´
em quantas vezes um deter-
minado usu´
ario costuma avaliar para cada um dos dois datasets, atrav´
es do identificador
´
unico do usu´
ario em cada plataforma.
Analisando o comportamento dos usu´
arios do Google Places com presenc¸a em
Curitiba, 23% deles avaliaram pelo menos 2 vezes, 4,7% avaliaram pelo menos 5 vezes
e 1,49% avaliaram pelo menos 10 vezes. Portanto, esse dataset apresenta uma baixa
recorrˆ
encia em seu uso pelos usu´
arios. Buscamos entender, tamb´
em, os intervalos entre
as avaliac¸ ˜
oes dos usu´
arios. Entre todas as avaliac¸ ˜
oes registradas na cidade, analisando
os usu´
arios isoladamente, 50,3% aconteceram em um intervalo menor do que 6 horas,
2,93% aconteceram entre 6 e 24 horas, 9,45% aconteceram entre 1 dia e 1 semana, e
37,3% aconteceram em um intervalo maior do que 1 semana. Assim, verifica-se um
uso variado dessa LBSN pelos seus usu´
arios. A maioria das avaliac¸ ˜
oes aconteceram em
intervalos curtos, entretanto, ocorreu, tamb´
em, uma quantidade significativa de avaliac¸ ˜
oes
em intervalos maiores do que uma semana.
Assim como o Google Places, investigamos o potencial do Foursquare para uma
modelagem atrav´
es de redes de interesse. Considerando seus usu´
arios, 76,9% fez check-
in pelo menos 2 vezes, 47,6% fez check-in pelo menos 5 vezes, e 28.1% fez check-in pelo
menos 10 vezes. Diferente do Google Places, os usu´
arios do Foursquare apresentam uma
recorrˆ
encia maior no uso do servic¸o, bem como s˜
ao caracterizados por intervalos entre
avaliac¸ ˜
oes mais bem distribu´
ıdos. De forma a entender melhor os comportamentos dos
usu´
arios, investigamos tamb´
em os intervalos entre check-ins dos usu´
arios. Entre todos os
check-ins realizados em Curitiba, considerando os usu´
arios separadamente, 36,8% acon-
teceram em um intervalo menor do que 6 horas, 25,5% aconteceram entre 6 e 24 horas,
28,7% aconteceram entre 1 dia e 1 semana, e 9% aconteceram em um intervalo maior do
que 1 semana. ´
E poss´
ıvel notar que as avaliac¸˜
oes no Foursquare se concentram em um
per´
ıodo muito mais curto quando comparado ao Google Places.
Portanto, al´
em das diferenc¸as nas categorias, identicam-se diferenc¸as nos dados
coletados das LBSNs em relac¸˜
ao ao uso, principalmente no quesito da regularidade no
emprego por parte dos usu´
arios, das ferramentas disponibilizadas por cada LBSN.
´
E importante ressaltar que o uso de LBSNs deve sempre estar acompanhado de
uma compreens˜
ao sobre as consequˆ
encias de sua aplicabilidade. Por exemplo, os dados
do Google Places e do Foursquare podem n˜
ao representar adequadamente as redes de in-
teresse da populac¸ ˜
ao curitibana, pois os usu´
arios dessas plataformas s˜
ao, frequentemente,
pessoas jovens e com acesso a internet m´
ovel. Por´
em, ainda permite insights sobre o
comportamento desse grupo que pode ou n˜
ao representar padr˜
oes mais gerais. Observe,
tamb´
em, que esses dados foram coletados h´
a 10 anos, e, assim sendo, os resultados da
nossa an´
alise podem ser diferentes quando comparados com datasets mais recentes. En-
tretanto, a metodologia ´
e geral e em raz˜
ao das fontes de dados utilizadas nesse trabalho
estarem dispon´
ıveis publicamente, elas estabelecem um bom ponto de partida para explo-
rar abordagens para a computac¸˜
ao urbana.
3.3. Dados socioeconˆ
omicos e eleitorais
As informac¸ ˜
oes dos aspectos socioeconˆ
omicos de cada bairro de Curitiba foram adquiri-
das por meio do Censo Demogr´
afico Brasileiro de 2010 realizado pelo Instituto Brasileiro
de Geografia e Estat´
ıstica (IBGE)2. Esta pesquisa nacional teve o objetivo de retratar a
populac¸˜
ao brasileira com suas caracter´
ısticas socioeconˆ
omicas e tamb´
em fundamentar o
planejamento p´
ublico e privado para a d´
ecada entre 2010-2020. De forma a entender as
diferenc¸as entre os bairros de Curitiba, extra´
ımos os dados da renda m´
edia mensal e da
composic¸˜
ao racial, formada pelas categorias: Branca; Preta; Amarela; Parda; Ind´
ıgena.
Encontramos essas informac¸ ˜
oes para todos os bairros de Curitiba.
Para coleta dos dados eleitorais, usamos os dados disponibilizados pelo Tribu-
nal Regional Eleitoral (TRE)3em relac¸˜
ao ao 2turno das eleic¸ ˜
oes para presidente em
Curitiba, para o ano de 2014. A escolha desses dados ´
e motivada pelos trabalhos de
[Liu et al. 2019] e [Huang and Butts 2023], nos quais, a discrepˆ
ancia nos percentuais de
votos para um candidato presidencial nos Estados Unidos nos anos de eleic¸ ˜
oes federais no
per´
ıodo de 2004-2016, e em 2008, respectivamente, foi usada para avaliar a polarizac¸ ˜
ao
pol´
ıtica entre regi˜
oes. Por exemplo, um alto percentual de votos para democratas em uma
regi˜
ao e um baixo percentual em outra, resultava numa maior polarizac¸˜
ao.
Os dados do TRE contˆ
em as informac¸ ˜
oes da quantidade total de eleitores e a
quantidade que votou em cada candidato, em n´
ıvel de local de votac¸˜
ao organizados em
10 zonas eleitorais. Para extrair os dados para o n´
ıvel de bairro, buscamos uma fonte da
prefeitura de Curitiba que relacionasse os locais de votac¸˜
ao aos bairros, mas encontramos
apenas para os anos de 2012 e 2016. Portanto, para determinar o percentual de eleitores
que votaram em determinado candidato em cada bairro, usamos a API do Google Maps
para associar os enderec¸os dos locais de votac¸ ˜
ao, de um total de 418 locais de votac¸˜
ao, a
seus respectivos bairros, exigindo que os resultados da API fossem da cidade de Curitiba.
Com esse m´
etodo, conseguimos associar todos os locais de votac¸˜
ao aos seus respetivos
bairros. Entretanto, alguns bairros ficaram sem informac¸˜
ao relativa aos dados eleitorais.
S˜
ao eles: Centro C´
ıvico, Campina do Siqueira, Alto Da Rua XV, Riviera, S˜
ao Miguel,
2https://sidra.ibge.gov.br
3https://www.tre-pr.jus.br/eleicoes/eleicoes-anteriores/eleicoes-2014
Caximba, Lamenha Pequena, S˜
ao Jo˜
ao, Cascatinha.
Os dados socioeconˆ
omicos analisados neste trabalho e os dados eleitorais coleta-
dos para os experimentos est˜
ao mostrados na Figura 2. A distribuic¸˜
ao da renda m´
edia nos
bairros de Curitiba est´
a na Figura 2a. Para representar a composic¸˜
ao racial, a Figura 2b
apresenta a porcentagem de pessoas declaradas Pretas para cada bairro de Curitiba. Com
os dados eleitorais dos bairros, foi contabilizado o n´
umero de eleitores que votaram na-
quele bairro e calculado o percentual que votou na candidata presidencial Dilma Rousseff.
A polarizac¸˜
ao pol´
ıtica pode ser visualizada na Figura 2c. ´
E poss´
ıvel perceber na Figura
2c que alguns dos bairros de Curitiba est˜
ao em regi˜
oes perif´
ericas e, para aqueles que n˜
ao
apresentaram dados, provavelmente seus moradores votaram em bairros pr´
oximos que
pertencem `
as mesmas zonas eleitorais. Ademais, outros bairros, sem informac¸ ˜
oes eleito-
rais encontradas nesse trabalho, como o Centro C´
ıvico, s˜
ao pequenos, apesar de estarem
em regi˜
oes centrais. Uma explicac¸˜
ao poss´
ıvel para a ausˆ
encia de dados ´
e que os habitantes
desses bairros votaram, tamb´
em, em bairros pr´
oximos. Por´
em, outra possibilidade est´
a
na imprecis˜
ao do m´
etodo empregado para associar os locais de votac¸˜
ao `
a seus respectivos
bairros.
(a) Renda M´
edia Mensal (R$)
(b) Pessoas Declaradas Pretas
(%)
(c) Votos na Candidata Dilma
Rouseff (%)
Figura 2. Distribuic¸ ˜
ao das Caracter´ısticas Socioecon ˆ
omicas em Curitiba
Em 2010, a variac¸ ˜
ao de renda entre os bairros de menor e maior renda girava
em torno de 7 vezes e a populac¸˜
ao que se declara preta n˜
ao ultrapassava 7,2% do total.
O percentual de eleitores da candidata Dilma Rousseff, no ano eleitoral de 2014, n˜
ao
alcanc¸ou 45% em nenhum dos bairros analisados. Nos bairros mais pr´
oximos ao centro,
houve maior concentrac¸˜
ao de renda, de pessoas brancas e menor percentual de votac¸ ˜
ao
na candidata. O maior percentual de votac¸˜
ao dela ocorreu na regi˜
ao mais afastada (em
especial na regi˜
ao sul), em bairros de menor poder aquisitivo e onde h´
a maior participac¸ ˜
ao
da populac¸˜
ao autodeclarada preta.
4. Redes de Interesse: Modelagem e An´
alise
Esta sec¸˜
ao detalha como, neste trabalho, as redes de interesse s˜
ao modeladas atrav´
es dos
dados das avaliac¸ ˜
oes do Google Places e do Foursquare, bem como ser´
a verificada a
similaridade entre estas redes. A sec¸ ˜
ao descreve ainda o processo usado para averiguar
quais fatores podem estar associados com as conex˜
oes mais fortes da rede.
4.1. Construc¸ ˜
ao das Redes de Interesse
Para a elaborac¸˜
ao da rede de interesse dos usu´
arios do Google Places, utilizamos
apenas os dados dos usu´
arios que avaliaram pelo menos 2 vezes, independente do
estabelecimento, resultando em uma an´
alise com 1.127 usu´
arios e no conjunto de 4.590
avaliac¸ ˜
oes realizadas por eles. Com essas informac¸ ˜
oes, constru´
ımos um grafo n˜
ao
dirigido ponderado G= (V, E ), no qual o conjunto Vde n´
os identifica os bairros de
Curitiba, e uma aresta ei,j Econecta o bairro viVao bairro vjV, com peso
wi,j Nindicando a quantidade de usu´
arios que tˆ
em avaliac¸ ˜
oes de estabelecimentos
localizados em ambos os bairros. Estas arestas representam ent˜
ao o interesse de usu´
arios
por dois bairros distintos. A rede constru´
ıda conta tamb´
em com self-loops, ou seja, uma
aresta ei,i Econecta um bairro viVa ele mesmo, nesta aresta o peso wi,i N
contabiliza a quantidade de usu´
arios que avaliou estabelecimentos localizados naquele
bairro pelo menos duas vezes. Esta construc¸˜
ao analisa redes de interesse, portanto,
considera apenas arestas n˜
ao nulas. Desse modo, obtemos um grafo para o Google Places
com 75 n´
os, contendo 1.287 arestas, sendo 53 self-loops.
Utilizando a mesma metologia descrita anteriormente, construimos a rede de inte-
resse dos usu´
arios do Foursquare, considerando 3.933 usu´
arios que avaliaram pelo menos
2 vezes e os 52.033 check-ins realizados por eles. Desta forma, foi obtido para o Fours-
quare um grafo com 75 n´
os, contendo 1.618 arestas, sendo 58 delas self-loops.
A Figura 3 ilustra as redes de interesse formadas com os dados do Google Places
(lado esquerdo) e Foursquare (lado direito). Nos grafos mostrados, o tamanho do n´
o´
e
proporcional ao seu grau, ponderado em relac¸˜
ao ao peso das arestas conectadas a ele, e a
largura da aresta ´
e proporcional ao seu peso. A diferenc¸a visual mais aparente ´
e que na
rede proveniente dos dados do Google Places, h´
a um interesse por lugares um pouco mais
afastados da regi˜
ao central da cidade, como os bairros Alto Boqueir˜
ao e Xaxim, que n˜
ao
est´
a presente na rede modelada pelos dados do Foursquare. Apesar disso, ´
e poss´
ıvel obser-
var uma semelhanc¸a visual consider´
avel entre as redes de interesse constru´
ıdas pelas duas
LBSNs estudadas. Em ambos os grafos, podemos visualizar uma grande concentrac¸ ˜
ao
de avaliac¸ ˜
oes na regi˜
ao central da cidade, em bairros como o Centro, Batel, ´
Agua Verde,
Rebouc¸as, Alto da Rua XV, onde predominam os setores de com´
ercio varejista, restau-
rantes e escrit´
orios. Bairros como Santa Felicidade e S˜
ao Francisco s˜
ao caracterizados
pela ampla presenc¸a de restaurantes t´
ıpicos, bares, hamburguerias e pubs casuais com
m´
usica ao vivo. Outros bairros como Bigorrilho, Centro C´
ıvico, Port˜
ao, Semin´
ario, Jar-
dim Botˆ
anico, Bacacheri e Cabral, s˜
ao regi˜
oes que oferecem ´
area verde extensa com seus
parques e prac¸as, al´
em de oferecer infraestuturas de com´
ercio e lazer, como shopping
centers.
(a) Rede de Interesse: usu ´
arios Google Places (b) Rede de Interesse: usu ´
arios Foursquare
Figura 3. Redes de Interesse na Cidade de Curitiba
5. Resultados
5.1. Similaridade das Redes
Para verificar a similaridade das redes constru´
ıdas atrav´
es dos dados das LBSNs analisa-
das, empregamos a correlac¸˜
ao de Pearson, um m´
etodo que avalia a presenc¸a e intensidade
de uma relac¸˜
ao linear entre dois conjuntos de vari´
aveis. Valores pr´
oximos de 1 indicam
uma relac¸˜
ao linear positiva forte, enquanto valores pr´
oximos de -1 indicam uma relac¸˜
ao
linear negativa forte. Na comparac¸ ˜
ao das redes, associamos o peso da aresta da rede do
Google Places com a sua respectiva aresta na rede do Foursquare, e, em seguida, cal-
culamos a correlac¸˜
ao de Pearson, usando todo o conjunto de arestas que est˜
ao presentes
em ambos os grafos. O resultado da correlac¸˜
ao foi de 0,875. Testamos, tamb´
em, outras
m´
etricas, como a correlac¸ ˜
ao de Spearman, mas os resultados foram similares. Portanto,
existe uma forte indicac¸˜
ao, atrav´
es das arestas, de similaridade dessas redes de interesse.
Al´
em disso, verificamos a similaridade em relac¸ ˜
ao `
a centralidade por autovetor
de ambas as redes. Isto ´
e, computamos a centralidade por autovetor de cada bairro em
cada uma das redes de interesse. Esse m´
etodo indica a importˆ
ancia de um n´
o na rede
tendo por base a importˆ
ancia dos n´
os com os quais ele est´
a conectado. Para investigar a
similaridade, empregamos o coeficiente de correlac¸˜
ao de Kendall’s Tau. Este coeficiente
´
e utilizado para avaliar a semelhanc¸a entre as ordens de dois conjuntos de dados. Va-
lores pr´
oximos de 1 indicam uma ordenac¸˜
ao semelhante, enquanto valores pr´
oximos de
-1 sugerem ordenac¸ ˜
oes bastante distintas. Atribuindo um identificador para cada bairro,
comparamos o ranking dos bairros, em ordem decrescente, entre as duas redes de inte-
resse. O resultado foi uma correlac¸ ˜
ao de 0.646, indicando uma moderada conex˜
ao entre
as caracter´
ısticas de centralidade para as duas fontes de dados. Uma comparac¸˜
ao entre
oranking dos bairros ´
e exposta na Figura 4, na qual, apresentamos os 20 bairros mais
centrais, pela centralidade de autovetor, na rede de interesse do Google Places e seus res-
pectivos ranks na rede de interesse do Foursquare. Observa-se, visualmente, pequenas
variac¸ ˜
oes na ordem dos bairros na comparac¸˜
ao das bases. Entretanto, elas mantˆ
em uma
relativa proximidade, representando a moderada relac¸˜
ao entre as centralidades, j´
a indicada
pelo coeficiente de Kendall’s Tau. A diferente natureza das LBSNs pode ser uma poss´
ıvel
explicac¸˜
ao para essas pequenas diferenc¸as encontradas na quest˜
ao de quais bairros s˜
ao
mais valorizados pelos seus respectivos usu´
arios. Com essa an´
alise ´
e poss´
ıvel concluir
que os 4 bairros mais centrais s˜
ao os mesmos para as duas LBSNs e, para esses bairros,
uma an´
alise a partir de uma rede de interesse poderia ser complementada por dados da
outra.
Figura 4. Comparac¸ ˜
ao Dos Bairros Mais Centrais De Curitiba Em Relac¸ ˜
ao `
A Cen-
tralidade Por Autovetor
5.2. C´
alculo das Distˆ
ancias entre Fatores Socioeconˆ
omicos e Pol´
ıticos
Nesta sec¸˜
ao, o objetivo da an´
alise ´
e entender se h´
a fatores extras (socioeconˆ
omicos, elei-
torais e geogr´
aficos) nas regi˜
oes analisadas influenciando o interesse dos frequentadores
dessas regi˜
oes. Para isso, relacionamos os pesos das arestas com as distˆ
ancias entre um
determinado fator. Os fatores socioeconˆ
omicos considerados em cada regi˜
ao foram, a
renda m´
edia mensal, a composic¸ ˜
ao racial, o fator pol´
ıtico foi a polarizac¸˜
ao e o ´
ultimo
fator extra considerado foi a posic¸˜
ao geogr´
afica.
Para tanto, usamos a diferenc¸a absoluta para a renda m´
edia mensal entre dois
bairros e a escolha pol´
ıtica para eleic¸˜
ao presidencial, de maneira similar aos trabalhos de
[Huang and Butts 2023] e [Liu et al. 2019]. Para a diferenc¸a entre as composic¸ ˜
oes raciais,
usamos o mesmo m´
etodo de [Huang and Butts 2023], no qual a diferenc¸ a entre os bairros
AeB´
e definida como
RA,B =1
2
n
X
i=1
P(A)i
P(A)P(B)i
P(B)
onde RA,B ´
e a diferenc¸a das composic¸ ˜
oes raciais entre os bairros AeB,P(A)repre-
senta o tamanho da populac¸˜
ao do bairro AeP(A)io tamanho da populac¸ ˜
ao que pertence
`
a i-´
esima categoria racial no bairro A. Usamos as categorias definidas pelo Censo De-
mogr´
afico Brasileiro de 2010: Branca, Preta, Amarela, Parda e Ind´
ıgena.
De modo a compreender melhor como essas distˆ
ancias se aplicam para a cidade
de Curitiba, a Figura 5 mostra um sub-grafo das distˆ
ancias entre fatores pol´
ıticos e socioe-
conˆ
omicos para alguns dos bairros mais centrais de ambas as redes de interesse. A cor do
n´
o´
e proporcional ao valor do fator do aspecto analisado. Desse modo, cores mais escu-
ras representam valores mais altos e cores mais claras est˜
ao associadas com valores mais
baixos, levando-se em considerac¸˜
ao apenas o subconjunto de bairros apresentado. Para a
polarizac¸˜
ao pol´
ıtica, cores mais escuras representam um percentual maior de votos para a
candidata presidencial Dilma Rouseff. Na composic¸˜
ao racial, foi escolhido o percentual
de pessoas declaradas Preta naquele bairro para a representac¸˜
ao. Enquanto que na renda
m´
edia mensal, n´
os mais escuros est˜
ao associados com maiores rendas. A cor da aresta ´
e
proporcional `
a diferenc¸a entre os fatores dos bairros, cores mais escuras est˜
ao associadas
com distˆ
ancias maiores, e cores mais claras representam diferenc¸as menores. Nas Figuras
5b e 5c, as diferenc¸as usadas nas arestas consideram, como explicado anteriormente, toda
a composic¸˜
ao racial e de renda mensal, respectivamente.
5.3. Correlac¸ ˜
oes Entre Redes de Interesse
Para compreender melhor os fatores associados com as regi˜
oes de interesse dos frequenta-
dores, relacionamos cada peso de aresta com a sua distˆ
ancia nas caracter´
ısticas analisadas
(renda m´
edia mensal, composic¸ ˜
ao racial, polarizac¸ ˜
ao pol´
ıtica, posic¸˜
ao geogr´
afica), para
ambos os grafos. Utilizando a correlac¸ ˜
ao de Spearman, os resultados para ambas as redes,
considerando a informac¸˜
ao tanto das redes de interesse completas (mostradas na Figura 3)
quanto de redes de interesse filtradas, s˜
ao apresentados na Tabela 1. Para a distˆ
ancia
geogr´
afica, usamos os centroides de cada bairro e calculamos a distˆ
ancia usando a bi-
blioteca geopandas [Jordahl et al. 2020] do Python, onde transformamos as coordenadas
geogr´
aficas de latitude e longitude do sistema de coordenadas WGS84, para a projec¸ ˜
ao
plana UTM22S que traz a projec¸˜
ao mais precisa da regi˜
ao onde se encontra Curitiba, e
calculamos a distˆ
ancia geogr´
afica entre dois bairros, olhando para os seus centroides, em
metros. A biblioteca utiliza a distˆ
ancia Euclidiana para os pontos na projec¸˜
ao plana e,
baseado na projec¸˜
ao, retorna a distˆ
ancia geogr´
afica entre os centroides dos bairros em
metros.
Nas redes de interesse completas, conforme j´
a destacado, observamos o impacto
de todas as arestas encontradas. J´
a na rede de interesse filtrada, consideramos apenas as
arestas com peso superior ou igual a 5, focando apenas nas ´
areas conectadas por interesse
mais elevado. Para a rede de interesse filtrada, a modelagem do Google Places apresentou
(a) Polarizac¸ ˜
ao Pol´ıtica (b) Composic¸ ˜
ao Racial
(c) Renda M´
edia Mensal
Figura 5. Sub-Grafo das Dist ˆ
ancias Entre Fatores socioeconˆ
omicos
apenas 418 arestas do total de 1.287 (32,5%) arestas da rede completa, enquanto os dados
do Foursquare apresentaram 1.169 arestas do total de 1.618 (72,2%).
Os resultados indicam que os fatores de renda m´
edia mensal, composic¸ ˜
ao racial
e polarizac¸˜
ao pol´
ıtica n˜
ao ajudam a explicar o interesse de frequentadores por determi-
nadas regi˜
oes. Isso significa que as pessoas n˜
ao costumam frequentar, necessariamente,
lugares que sejam similares em renda, rac¸a, ou opini ˜
oes pol´
ıticas, quando seus interesses
s˜
ao modelados por essas LBSNs. Apesar da composic¸ ˜
ao racial apresentar um coeficiente
de 0.25, o maior valor absoluto entre os fatores de renda m´
edia, composic¸˜
ao racial e
polarizac¸˜
ao pol´
ıtica, quando analisando a rede de interesse completa do Google Places,
pode-se perceber que ´
e um valor inferior quando comparado ao impacto da distˆ
ancia ge-
ogr´
afica em todos os cen´
arios analisados na Tabela 1. Isso indica que quanto maior a
distˆ
ancia geogr´
afica entre dois bairros, a tendˆ
encia ´
e de se encontrar arestas com pesos
menores. No mais, ´
e poss´
ıvel observar que a distˆ
ancia geogr´
afica tem um peso maior
na rede modelada pelo Foursquare. Uma explicac¸ ˜
ao plaus´
ıvel ´
e a diferente natureza no
uso das LBSNs pelos seus usu´
arios. Entretanto, o resultado com a maior influˆ
encia da
distˆ
ancia geogr´
afica j´
a era esperado, pois diversos outros trabalhos [Cheng et al. 2021]
[Gonz´
alez et al. 2008] [Rhee et al. 2008] [Brockmann et al. 2006] explicam a tendˆ
encia
das distˆ
ancias percorridas pelos usu´
arios em LBSNs, e em outros formatos de dados si-
milares, apresentarem uma maior frequˆ
encia em distˆ
ancias curtas e serem mais raras em
distˆ
ancias maiores como demonstramos.
Tabela 1. Resultados das Correlac¸ ˜
oes de Spearman com os Fatores Analisados
Google Places Google Places Foursquare Foursquare
Completo Filtrado Completo Filtrado
Renda m´
edia mensal -0.09 -0.10 0.06 -0.04
Composic¸˜
ao Racial -0.25 -0.19 -0.11 -0.20
Polarizac¸˜
ao Pol´
ıtica -0.23 -0.14 -0.09 -0.15
Distˆ
ancia Geogr´
afica -0.38 -0.30 -0.55 -0.44
6. Conclus˜
ao
Entender o comportamento urbano ´
e uma tarefa desafiadora. Nesse trabalho, investigamos
se diferentes LBSNs poderiam fornecer informac¸ ˜
oes similares ao modelar o interesse de
usu´
arios por ´
areas geogr´
aficas. Conclu´
ımos, atrav´
es de uma an´
alise nas caracter´
ısticas
dos dois datasets analisados (Google Places e Foursquare) e dados coletados em Curitiba,
que os grafos obtidos a partir das escolhas dos usu´
arios, denominados neste trabalho de
redes de interesse, modelam a dinˆ
amica nas ac¸ ˜
oes de seus usu´
arios de maneira bastante
parecida, em especial para as conex˜
oes entre bairros mais centrais da cidade.
Al´
em disso, examinamos a possibilidade de compreender as escolhas dos usu´
arios
de LBSNs, em relac¸˜
ao ao seu interesse por regi˜
oes urbanas, usando caracter´
ısticas socio-
econˆ
omicas, de polarizac¸ ˜
ao pol´
ıtica e distˆ
ancia geogr´
aficas das regi˜
oes frequentadas por
eles. Desse modo, descobrimos que, para os dados analisados, fatores como renda m´
edia,
composic¸˜
ao racial e polarizac¸˜
ao pol´
ıtica das diferentes regi˜
oes analisadas (bairros de Cu-
ritiba) n˜
ao influenciam a escolha por essas regi˜
oes. Entretanto, inferimos que a distˆ
ancia
geogr´
afica entre os bairros analisados pode atuar como um limitante em suas interac¸ ˜
oes,
pois existe uma tendˆ
encia de se frequentar lugares que sejam mais pr´
oximos.
Em trabalhos futuros, seria interessante explorar datasets mais recentes, bem
como outras cidades, tanto para comparar se as diferentes LBSNs continuam fornecendo
informac¸ ˜
oes similares, quanto para investigar quais fatores influenciam as redes de inte-
resse ao longo do tempo. Desse modo, poderiam ser investigados outros fatores, como
a cultura, os tipos de estabelecimento, o conte´
udo das avaliac¸˜
oes realizadas, estudando,
por exemplo, sentimentos e t´
opicos expressados, entre outros. Estes novos fatores com-
plementariam a an´
alise, ajudando a responder perguntas como se os locais que as pessoas
frequentam no cen´
ario urbano s˜
ao similares em cultura, se os usu´
arios costumam fre-
quentar os mesmos tipos de estabelecimentos em diferentes bairros, ou se cada bairro
´
e mais caracterizado por uma classe espec´
ıfica de locais, e se as regi˜
oes mais conecta-
das nas redes de interesse formadas compartilham de um mesmo sentimento por parte de
seus usu´
arios. Isto permitiria um melhor entendimento do fen ˆ
omeno do comportamento
urbano e a dinˆ
amica nas cidades em relac¸˜
ao `
as regi˜
oes que as pessoas costumam frequen-
tar. Com uma melhor compreens˜
ao sobre os fatores associados com os interesses das
populac¸ ˜
oes de cada cidade, essas an´
alises poderiam integrar sistemas de recomendac¸˜
ao,
trazendo o aspecto das caracter´
ısticas de cada bairro. Ademais, esse tipo de investigac¸˜
ao
tem o potencial de indicar aos ´
org˜
aos p´
ublicos, quais regi˜
oes est˜
ao mais interligadas en-
tre si, permitindo pol´
ıticas p´
ublicas voltadas, por exemplo, ao combate a epidemias ou `
a
promoc¸˜
ao da integrac¸˜
ao social entre regi˜
oes antes pouco conectadas.
7. Agradecimentos
Esta pesquisa foi parcialmente apoiada pelo projeto SocialNet (processo 2023/00148-0 da Fundac¸ ˜
ao de Amparo `
a Pesquisa do Estado
de S˜
ao Paulo - FAPESP) e pelo Conselho Nacional de Desenvolvimento Cient´
ıfico e Tecnol´
ogico - CNPq (processos 313122/2023-7,
314603/2023-9 e 441444/2023-7).
Referˆ
encias
Brockmann, D., Hufnagel, L., and Geisel, T. (2006). The scaling laws of human travel. Nature, 439(7075):462–465.
Cheng, Z., Caverlee, J., Lee, K., and Sui, D. (2021). Exploring millions of footprints in location sharing services. Proceedings of the
International AAAI Conference on Web and Social Media, 5(1):81–88.
Ferreira, A. P., Silva, T. H., and Loureiro, A. A. (2020). Uncovering spatiotemporal and semantic aspects of tourists mobility using
social sensing. Computer Communications, 160:240–252.
Ferreira, A. P. G., Silva, T. H., and Loureiro, A. A. F. (2015). Beyond sights: Large scale study of tourists’ behavior using foursquare
data. In 2015 IEEE International Conference on Data Mining Workshop (ICDMW), pages 1117–1124.
Gonz´
alez, M. C., Hidalgo, C. A., and Barab´
asi, A.-L. (2008). Understanding individual human mobility patterns. Nature,
453(7196):779–782.
He, R., Kang, W.-C., and McAuley, J. (2017). Translation-based recommendation. In Proceedings of the Eleventh ACM Conference
on Recommender Systems, RecSys ’17. ACM.
Huang, P. and Butts, C. T. (2023). Rooted america: Immobility and segregation of the intercounty migration network. American
Sociological Review, 88(6):1031–1065.
Jordahl, K., den Bossche, J. V., Fleischmann, M., Wasserman, J., McBride, J., Gerard, J., Tratner, J., Perry, M., Badaracco, A. G.,
Farmer, C., Hjelle, G. A., Snow, A. D., Cochran, M., Gillies, S., Culbertson, L., Bartos, M., Eubank, N., maxalbert, Bilogur, A.,
Rey, S., Ren, C., Arribas-Bel, D., Wasser, L., Wolf, L. J., Journois, M., Wilson, J., Greenhall, A., Holdgraf, C., Filipe, and Leblanc,
F. (2020). geopandas/geopandas: v0.8.1.
Ladeira, L., Souza, A., Filho, G. R., Silva, T. H., and Villas, L. (2019). Servic¸o de sugest˜
ao de rotas seguras para ve´
ıculos. In Anais do
XXXVII Simp´
osio Brasileiro de Redes de Computadores e Sistemas Distribu´
ıdos, pages 608–621, Porto Alegre, RS, Brasil. SBC.
Liu, X., Andris, C., and Desmarais, B. A. (2019). Migration and political polarization in the u.s.: An analysis of the county-level
migration network. PLOS ONE, 14(11):e0225405.
Mart´
ı, P., Serrano-Estrada, L., and Nolasco-Cirugeda, A. (2019). Social media data: Challenges, opportunities and limitations in urban
studies. Computers, Environment and Urban Systems, 74:161–174.
Nolasco-Cirugeda, A. and Garc´
ıa-Mayor, C. (2022). Social dynamics in cities: Analysis through lbsn data. Procedia Computer
Science, 207:877–886.
Pasricha, R. and McAuley, J. (2018). Translation-based factorization machines for sequential recommendation. In Proceedings of the
12th ACM Conference on Recommender Systems, RecSys ’18. ACM.
Rhee, I., Shin, M., Hong, S., Lee, K., and Chong, S. (2008). On the levy-walk nature of human mobility. In IEEE INFOCOM 2008 -
The 27th Conference on Computer Communications. IEEE.
Santala, V., Miczevski, S., de Brito, S. A., Baldykowski, A. L., Gadda, T., Kozievitch, N., and Silva, T. H. (2017). Making sense of
the city: Exploring the use of social media data for urban planning and place branding. In Anais do I Workshop de Computac¸˜
ao
Urbana, Porto Alegre, RS, Brasil. SBC.
Senefonte, H. C. M., Delgado, M. R., L¨
uders, R., and Silva, T. H. (2022). Predictour: Predicting mobility patterns of tourists based on
social media user’s profiles. IEEE Access, 10:9257–9270.
Silva, T. H., de Melo, P. O. S. V., Almeida, J. M., and Loureiro, A. A. F. (2017). Uma fotografia do instagram: Caracterizac¸˜
ao e
aplicac¸ ˜
ao. Revista Brasileira de Redes de Computadores e Sistemas Distribu´
ıdos.
Silva, T. H. and Loureiro, A. A. (2016). Computac¸ ao urbana: T´
ecnicas para o estudo de sociedades com redes de sensoriamento
participativo. Sociedade Brasileira de Computac¸ ˜
ao.
Silva, T. H. and Silver, D. (2024). Using graph neural networks to predict local culture. arXiv.
Silva, T. H., Vaz de Melo, P. O. S., Almeida, J. M., Salles, J., and Loureiro, A. A. F. (2013). A comparison of foursquare and
instagram to the study of city dynamics and urban social behavior. In Proc. ACM SIGKDD Int. Workshop on Urban Computing
(UrbComp’13), Chicago, USA.
Silva, T. H., Viana, A. C., Benevenuto, F., Villas, L., Salles, J., Loureiro, A., and Quercia, D. (2019). Urban computing leveraging
location-based social network data: A survey. ACM Computing Surveys, 52(1):1–39.
Silver, D. and Silva, T. H. (2023). Complex causal structures of neighbourhood change: Evidence from a functionalist model and yelp
data. Cities, 133:104130.
Skora, L. E., Senefonte, H. C., Delgado, M. R., L¨
uders, R., and Silva, T. H. (2022). Comparing global tourism flows measured by
official census and social sensing. Online Social Networks and Media, 29:100204.
Veiga, D. A. M., Frizzo, G. B., and Silva, T. H. (2019). Cross-cultural study of tourists mobility using social media. In Proceedings of
the 25th Brazillian Symposium on Multimedia and the Web, WebMedia ’19, page 313–316, New York, NY, USA. Association for
Computing Machinery.
... Vale destacar o impacto da pesquisa realizada, que resultou em 3 trabalhos aceitos [5,6,15], sendo 2 em workshop de evento (qualis A4), um em evento internacional (qualis A2) e 2 convites para extensão em revista internacional (Qualis A2, JCR 3.5). O primeiro trabalho [15] foi resultado direto da primeira etapa e teve sua relevância atestada por um convite para extensão no Journal of Internet Services and Applications (JISA) . ...
... Vale destacar o impacto da pesquisa realizada, que resultou em 3 trabalhos aceitos [5,6,15], sendo 2 em workshop de evento (qualis A4), um em evento internacional (qualis A2) e 2 convites para extensão em revista internacional (Qualis A2, JCR 3.5). O primeiro trabalho [15] foi resultado direto da primeira etapa e teve sua relevância atestada por um convite para extensão no Journal of Internet Services and Applications (JISA) . Já o segundo e terceiro trabalhos representam contribuições indiretas; o segundo [5] foi premiado em 3o lugar no Courb 2024, também convidado para extensão no JISA e o terceiro trabalho [6] foi aceito para o Asonam 2024. ...
... Em termos de produtos gerados pela pesquisa, além da ferramenta descrita anteriormente, destacam-se os 3 trabalhos aceitos para eventos (dois nacionais e um internacional). Os resultados diretos da etapa 1, desenvolvidos pelo aluno de IC, foram publicados em [15], cujo impacto foi atestado por um convite para extensão no periódico JISA, extensão esta que deverá englobar os resultados diretos da etapa 2. Entretanto, a pesquisa resultou também em resultados indiretos, através de contribuições na preparação de dados, construção de figuras, e desenvolvimento de parte dos resultados, que possibilitaram a publicação de outros 2 trabalhos em eventos [5,6], os quais exploram o conceito de assinaturas culturais, através da Teoria Scenes, que com dados provenientes de LBSNs, pode, por exemplo, tentar expressar as características culturais de uma dada região. Em [5], o trabalho explora o processo de agrupamento de bairros com características culturais (assinatura cultural) semelhantes na cidade de Curitiba. ...
Conference Paper
Full-text available
Location-Based Social Networks (LBSNs) can help model users’ interests in urban areas in several ways. In the present work, we focus on Interest Networks (iNETs), which result from modeling LBSN data into graphs. The present study provides insights into which areas are frequently visited together by getting data from two distinct LBSNs, Foursquare and Google Places. Although the studied LBSNs differ in nature, with data varying in regularity and purpose, both modeled iNETs revealed similar urban behavior patterns and were likewise impacted by socioeconomic and geographic factors. Also, we discuss the development of a tool to empower urban studies and the by-products of this research.
... In our previous work [Santos et al., 2024], we compare the two LBSNs in the context of Curitiba, Brazil, to determine whether they model urban behavior similarly in capturing users' interest in neighborhoods. The present work significantly expands the previous similarity analysis between LBSNs by considering areas in different countries. ...
Article
Full-text available
Location-Based Social Networks (LBSNs) are valuable for understanding urban behavior and providing useful data on user preferences. Modeling their data into graphs like interest networks (iNETs) offers important insights for urban area recommendations, mobility forecasting, and public policy development. This study uses check-ins and venue reviews to compare the iNETs resulting from two distinct LBSNs, Foursquare and Google Places. Although these two LBSNs differ in nature, with data varying in regularity and purpose, their resulting iNETs reveal similar urban behavior patterns. When analyzing the impact of socioeconomic, political, and geographic factors on iNET edges-each edge representing users' interests in a pair of regions-only geographic factors showed a significant influence. When studying the granularity of area sizes to model iNETs, we highlight important trade-offs between larger and smaller sizes. Additionally, we propose a methodology to identify clusters of geographically neighboring areas where user interest is strongest, which can be advantageous for understanding urban space usage.
Article
Full-text available
Urban research has long recognized that neighbourhoods are dynamic and relational. However, lack of data, methodologies, and computer processing power have hampered a formal quantitative examination of neighbourhood relational dynamics. To make progress on this issue, this study proposes a graph neural network (GNN) approach that permits combining and evaluating multiple sources of information about internal characteristics of neighbourhoods, their past characteristics, and flows of groups among them, potentially providing greater expressive power in predictive models. By exploring a public large-scale dataset from Yelp, we show the potential of our approach for considering structural connectedness in predicting neighbourhood attributes, specifically to predict local culture. Results are promising from a substantive and methodologically point of view. Substantively, we find that either local area information (e.g. area demographics) or group profiles (tastes of Yelp reviewers) give the best results in predicting local culture, and they are nearly equivalent in all studied cases. Methodologically, exploring group profiles could be a helpful alternative where finding local information for specific areas is challenging, since they can be extracted automatically from many forms of online data. Thus, our approach could empower researchers and policy-makers to use a range of data sources when other local area information is lacking.
Article
Full-text available
Despite the popular narrative that the United States is a “land of mobility,” the country may have become a “rooted America” after a decades-long decline in migration rates. This article interrogates the lingering question about the social forces that limit migration, with an empirical focus on internal migration in the United States. We propose a systemic, network model of migration flows, combining demographic, economic, political, and geographic factors and network dependence structures that reflect the internal dynamics of migration systems. Using valued temporal exponential-family random graph models, we model the network of intercounty migration flows from 2011 to 2015. Our analysis reveals a pattern of segmented immobility, where fewer people migrate between counties with dissimilar political contexts, levels of urbanization, and racial compositions. Probing our model using “knockout experiments” suggests one would have observed approximately 4.6 million (27 percent) more intercounty migrants each year were the segmented immobility mechanisms inoperative. This article offers a systemic view of internal migration and reveals the social and political cleavages that underlie geographic immobility in the United States.
Article
Full-text available
In this study, we articulate a functional model of neighbourhood change and continuity, adapted from a classical model proposed by Stinchcombe in 1968. We argue this model provides a relatively simple way to capture key aspects of the complex causal structure of neighbourhood change that are implicit in much neighbourhood change research but rarely formulated explicitly. To evaluate the model, we formulate six testable propositions, which we empirically test with large-scale data from Yelp.com. We illustrate our approach with the case of Toronto, but find broad support for all propositions in an analysis of six cities. A conclusion reflects on the value of incorporating functionalist models into neighbourhood research and policy.
Conference Paper
Full-text available
Location-Based Social Networks data —LBSN data— reveal, in essence, user preferences and patterns of use of urban space. This information plays a key role in research on social dynamics in cities. Today, social network applications are widely available and this digital data represents a complementary and inescapable source of data for the analysis of urban dynamics. Ten years ago, a handful of pioneering researchers paved the way to tackle city issues employing different types of LBSN data. The present work describes a series of case-studies that have contributed to a research methodology which, in turn, helps to unveil the traces of the city pulse lying hidden behind digital footprints. These cases exemplify how these sources help to gain a better understanding of social dynamics and can be used in urban interventions. The presented case studies were mainly data-sourced by Foursquare, Twitter, and Google Places, while other social networks such as Airbnb, Wikiloc, and Strava were used for the specific cases of tourism or sport-related topics. The case studies address urban issues based on multiscale approaches, using different LBSN datasets simultaneously in order to obtain a complex and accurate analysis, such as: a) the social dynamism at the neighborhood scale, searching for urban regeneration opportunities; b) tourism-related urban dynamics, both at the local and city scale, with a high granularity; c) user presence and preferences when assessing the city green infrastructure system; and, d) tracking informal sport activity in the urban periphery, connecting urban tissues and natural assets on the city borders.
Article
Full-text available
This paper proposes PredicTour, an approach to process check-ins made by users of location-based social networks (LBSNs), and predict mobility patterns of tourists visiting new countries with or without previous visiting records. PredicTour is composed of three key parts: mobility modeling, profile extraction, and tourist mobility prediction. In the first part, sequences of check-ins within a time interval are associated with other user information to produce a new structure called “mobility descriptor”. In the profile extraction, self-organizing maps and fuzzy C-means work jointly to group users according to their mobility descriptors. PredicTour then identifies tourist profiles and estimates mobility patterns of tourists visiting new countries. When comparing the performance of PredicTour with three well-known machine learning-based models, the results indicate that PredicTour outperforms the baseline approaches. Therefore, it is a good alternative for predicting and understanding international tourists’ mobility. The proposed approach can be used in different applications, such as in recommender systems for tourists or in decision-making support for urban planners interested in improving tourists’ experiences.
Article
Full-text available
Tourism favors more economic activities, employment, revenues and plays a significant role in development; thus, the improvement of this activity is a strategic task. In this work, we show how social sensing can be used to understand the key characteristics of the behavior of tourists and residents. We observe distinct behavioral patterns in those classes, considering the spatial and temporal dimensions, where cultural and regional aspects might play an important role. Besides, we investigate how tourists move and the factors that influence their movements in London, New York, Rio de Janeiro and Tokyo. In addition, we propose a new approach based on a topic model that enables the automatic identification of mobility pattern themes, ultimately leading to a better understanding of users’ profiles. The applicability of our results is broad, helping to provide better applications and services in the tourism segment.
Article
Full-text available
Research question From gridlock in lawmaking to shortened holiday family dinners, partisan polarization pervades social and political life in the United States. We study the degree to which the dynamics of partisan polarization can be observed in patterns of county-to-county migration in the U.S. Specifically, we ask whether migration follows patterns that would lead individuals to homogeneous or heterogeneous partisan exposure, using annual county-to-county migration networks from 2002 to 2015. Adjusting for a host of factors, including geographic distance, population, and economic variables, we test the degree to which migration flows connect counties with similar political preferences. Findings Our central finding is that over the period studied, county-to-county migration flows connect counties with similar partisan voting profiles. Moreover, partisan sorting is most pronounced among the most politically extreme counties. The implication of this finding in the context of partisanship is that U.S. migration patterns reinforce partisan sorting, limiting the degree to which individuals will experience cross-the-aisle local social contacts through spatial interaction. This finding builds on existing research that has documented (1) that individuals prefer to move to and live in locations inhabited by co-partisans, and (2) that local geographic areas have become more polarized in recent decades. Our results indicate that large scale patterns of polarized migration flows serve as a potential mechanism that contributes to geographic partisan polarization.
Conference Paper
Full-text available
The vast availability of user-generated data in social networks, mainly those networks based on location, allows an unprecedented study of urban societies. This work proposes to study the mobility of tourists and residents in various cities around the world in possession of this kind of data, especially, exploring check-ins of Foursquare-Swarm and reviews made in TripAdvisor. From this data, we built a model based on graphs to represent the mobility of two groups of studied users under distinct periods of the day. This representation catches, in a certain way, the mobility's semantic, assuming not only the geographic coordinates but the type of venue visited. The results indicate that residents, generally, have mobility patterns more similar than tourists. We also observed that the geographical region, like the country, influences the noticed similarity in both groups. Our results suggest the possibility of the development of new recommendation systems specific for tourists that take into account the user origin.
Article
Location sharing services (LSS) like Foursquare, Gowalla, and Facebook Places support hundreds of millions of user-driven footprints (i.e., "checkins"). Those global-scale footprints provide a unique opportunity to study the social and temporal characteristics of how people use these services and to model patterns of human mobility, which are significant factors for the design of future mobile+location-based services, traffic forecasting, urban planning, as well as epidemiological models of disease spread. In this paper, we investigate 22 million checkins across 220,000 users and report a quantitative assessment of human mobility patterns by analyzing the spatial, temporal, social, and textual aspects associated with these footprints. We find that: (i) LSS users follow the “Levy Flight” mobility pattern and adopt periodic behaviors; (ii) While geographic and economic constraints affect mobility patterns, so does individual social status; and (iii) Content and sentiment-based analysis of posts associated with checkins can provide a rich source of context for better understanding how users engage with these services.
Article
A better understanding of the behavior of tourists is strategic for improving services in the competitive and important economic segment of global tourism. Critical studies in the literature often explore the issue using traditional data, such as questionnaires or interviews. Traditional approaches provide precious information; however, they impose challenges to obtaining large-scale data, making it hard to study worldwide patterns. Location-based social networks (LBSNs) can potentially mitigate such issues due to the relatively low cost of acquiring large amounts of behavioral data. Nevertheless, before using such data for studying tourists’ behavior, it is necessary to verify whether the information adequately reveals the behavior measured with traditional data — considered the ground truth. Thus, the present work investigates in which countries the global tourism network measured with an LBSN agreeably reflects the behavior estimated by the World Tourism Organization using traditional methods. Although we could find exceptions, the results suggest that, for most countries, LBSN data can satisfactorily represent the behavior studied. We have an indication that, in countries with high correlations between results obtained from both datasets, LBSN data can be used in research regarding the mobility of the tourists in the studied context.