PreprintPDF Available

Visão Computacional nas Mídias Sociais: estudando imagens de #Férias no Instagram

Authors:

Abstract and Figures

Recursos de inteligência artificial, tais como processamento de linguagem natural e reconhecimento de imagens, estão ficando cada dia mais acessíveis graças ao oferecimento das APIs (ou Interface de Programação de Aplicações) de serviços de computação em nuvem, tais como Google Cloud Platform, IBMWatson, Microsoft Azure e Amazon Web Services. Este artigo apresenta contextualização, discussão e aplicação de um serviço de reconhecimento de imagens, através de scripts Python, à pesquisa de mercado nas mídias sociais através do estudo de cerca de 8,5 mil imagens publicadas com a hashtag #férias no Instagram. Como resultado, apontamos a relevância dos recursos na compreensão de uma esfera de comportamento relevante para segmentos de marketing turístico, entretenimento e consumo.
Content may be subject to copyright.
Visão Computacional nas Mídias Sociais:
estudando imagens de #Férias no Instagram
1
Tarcízio Silva
2
Brunno Apolonio
3
Pedro Meirelles
4
Resumo: Recursos de inteligência artificial, tais como processamento de linguagem natural e
reconhecimento de imagens, estão ficando cada dia mais acessíveis graças ao oferecimento das
APIs (ou Interface de Programação de Aplicações) de serviços de computação em nuvem, tais
como Google Cloud Platform, IBMWatson, Microsoft Azure e Amazon Web Services. Este
artigo apresenta contextualização, discussão e aplicação de um serviço de reconhecimento de
imagens, através de scripts Python, à pesquisa de mercado nas mídias sociais através do estudo
de cerca de 8,5 mil imagens publicadas com a hashtag #férias no Instagram. Como resultado,
apontamos a relevância dos recursos na compreensão de uma esfera de comportamento relevante
para segmentos de marketing turístico, entretenimento e consumo.
Palavras-chave: reconhecimento de imagens; inteligência artificial; Google Vision; Instagram;
mídias sociais
MÍDIAS SOCIAIS, DADOS E INTELIGÊNCIA
A análise de dados aplicada a fins mercadológicos explodiu em frequência e escopo nos
últimos 15 anos, graças ao aumento da oferta de traços e rastros deixados por cidadãos e
consumidores na internet, particularmente nas mídias sociais. Kennedy (2016) revisa definições
de mídias sociais focando nas características definidoras de participação, compartilhamento,
intimidade e monetização construídas nas plataformas. A convergência destas características
1
Artigo enviado para o I Encontro Norte e Nordeste da ABCiber no GT Comunicação Organizacional.
2
Mestre em Comunicação pela Universidade Federal da Bahia, Diretor de Pesquisa e Cofundador do Instituto Brasileiro de
Pesquisa e Análise de Dados. Email: tarcizio@ibpad.com.br
3
Graduado em Publicidade e Propaganda pela Universidade da Amazônia e Pesquisador no IBPAD. Email:
brunnoapolonio@gmail.com
4
Graduado em Estudos de Mídia pela Universidade Federal Fluminense e Pesquisador no IBPAD. Email:
pedrorcmeirelles@gmail.com
2
transforma radicalmente as possibilidades de medição, análise e acionamento das realidades
sociais através da dataficação de mais e mais esferas sociais:
“a dataficação das coisas que não eram previamente dados e a abertura das APIs
das mídias sociais, que permitem acesso à sua matéria, não apenas torna a
lógica de mídias sociais difusiva como também torna a mineração de dados de
mídias sociais uma possibilidade real para muito mais atores comuns que
podem acessar outras formas de dados e participar na sua mineração”
5
(KENNEDY, 2016, p. 38)
Em torno do mundo, a mineração de dados em mídias sociais tem sido utilizada por
pesquisadores acadêmicos e de mercado para estudar os mais diferentes fenômenos, tais como
controvérsias online sobre questões sociais - os direitos das mulheres, por exemplo (BATISTA et
al, 2016), epidemiologia (RABELLO et al, 2018), o papel das mídias sociais em eventos
históricos - na Guerra da Síria, por exemplo (LYNCH et al, 2014), o monitoramento sobre
questões de saúde pública (CORLEY et al, 2010) e até mesmo a construção de um “índice de
felicidade” automatizado a partir de tweets (DODD & DANFORTH, 2010), entre outros.
Em seus desdobramentos estritamente mercadológicos, a mineração de dados em mídias
sociais engendrou o mercado referenciado através de termos como “monitoramento de mídias
sociais” (SILVA, 2010), social listening (MACNAMARA, 2015), ou até neologismos como
“social big data” (GUELLIL & BOUKHALFA, 2015). A construção deste mercado vai muito
além do que é oferecido automaticamente pelas plataformas como Facebook, YouTube e afins
em seus sistemas de anúncios, gerando categorias específicas de atores organizacionais e práticas
de análise. Este mercado inclui data brokers (como GNIP e Datasift); ferramentas de
monitoramento e coleta de dados acadêmicas (Netlytic, Netvizz, NodeXL, Uberlink e outras) e
comerciais (Sysomos, Sprinklr, Stilingue, Scup, etc.); empresas especializadas na análise e
interpretação dos dados (IBPAD, Scup, f.biz, Isobar, etc.); além das próprias organizações
comerciais interessadas nos resultados. Tais atores estão frequentemente ávidos pela construção
e aplicação de novas metodologias de pesquisa, comumente adaptadas de inovações acadêmicas,
como foi o caso da análise de redes e visualização de grafos (cf. SILVA, 2017).
Inúmeras metodologias e abordagens são aplicadas aos dados de mídias sociais, tais como
métricas e mensuração quantitativa com a aplicação de estatística descritiva; análise de
conteúdo; análise de texto; etnografia; análise de redes e hyperlinks; análise geoespacial e outras
5
“datafication of things that were not previously data and the openness of social media APIs, which allows access to
datafied matter, not only make social media logic pervasive but also make social media data mining a real possibility for many
more ordinary actors than can access other forms of data and engage in their mining” (tradução nossa, 2018).
3
(cf. FRAGOSO, RECUERO & MONTARDO, 2011; ACKLAND, 2013; HALFPENNY &
PROCTER, 2015; SLOAN & QUAAN-HAASE, 2017). Algumas das fronteiras ainda presentes
para as práticas mercadológicas de análise de dados em mídias sociais são delimitadas pela
dificuldade com a coleta, manejo e análise de imagens, como fotografias.
A tipologia oferecida por Laestadius (2017) de estudos no Instagram propõe quatro
abordagens. As primeiras, abordagens quantitativas, são estudos de big data que se calcam
sobretudo na capacidade computacional das ferramentas de processamento para analisar padrões
de uso, utilização de tags, likes, comentários e hashtags, além de metadados. Amostras pequenas
(small data) combinadas com abordagens qualitativas, análise, codificação e interpretação das
imagens e textos de amostras humanamente gerenciáveis valoriza a granularidade na segunda
abordagem. A terceira, por sua vez, trata do estudo dos significados e apropriação da plataforma
Instagram através da interação direta com os usuários (através de entrevistas, questionários
grupos focais, etnografia, etc.).
Por fim, as abordagens das Humanidades Digitais trazem similaridades com a abordagem
quantitativa, mas aqui a distinção está em duas variáveis únicas: 1) são aplicadas técnicas de
computação visual e processamento de imagens para focar na mídia visual em si e não apenas
nos metadados; 2) como resultado frequente, visualizações interativas permitem o leitor interagir
com os conteúdos e padrões de forma viva. Segundo Laestadius, “Uma vez coletadas,
processadas, e visualizadas, imagens podem ser mapeadas e organizadas [...] para descobrir
novos padrões. Muito desses dados podem ser gerados automaticamente utilizando técnicas de
reconhecimento de imagem, enquanto outros itens devem ser criados ou validados
manualmente”
6
(LAESTADIUS, 2017, p.580). Como aponta a autora, o trabalho de Manovich é
uma dos exemplos mais famosos e característicos desta quarta abordagem. Segundo o autor, “a
análise computacional de grandes amostras de conteúdo em plataformas de mídia como o
Instagram pode quantificar várias estratégias e padrões fotográficos, de design e de narrativa dos
usuários”
7
(MANOVICH, 2017, p.22). Em diversos trabalhos, abordagens similares aplicaram
técnicas como estas ao estudo de selfies através de diferentes culturas (TIFENTALE &
6
“Once collected, processed, and visualized, images can be mapped and sorted [...] to discern novel patterns. Much of
this data can be generated automatically using image recognition techniques, while other items must be created or validated by
hand” (tradução nossa, 2018).
7
“computational analysis of large samples of content on media platform such as Instagram can quantify many
photographic, design, and narrative user strategies and patterns” (tradução nossa, 2018).
4
MANOVICH, 2015), protestos de ativistas (MANOVICH, TIFENTALE & YAZDANI, 2014),
mapeamento semântico e geoespacial de cidades (RYKOV et al, 2016; REDI et al, ) entre outros.
Porém, ao falarmos da comunicação mercadológica, em um panorama que o uso de
fotografias, ilustrações, memes visuais e conteúdo audiovisual ganha cada vez mais espaço,
como incluir as imagens como fonte de dados de forma criativa e escalável? Como aponta
Zandavalle (2018), os estudos públicos com fins mercadológicos sobre imagens de mídias
sociais ainda são raros. Apontamos, como principais motivos, três pontos: a escassa capacitação
teórico-metodológica em métodos de pesquisa, assim como capacidade computacional; o alto
valor necessário, em termos de recursos humanos, para codificação e análise de imagens; e o
caráter ainda recente de tecnologias que apoiem a classificação automatizada.
No atual contexto, que permite a aplicação de recursos de computação visual de um modo
mais acessível, como veremos a seguir, urge a necessidade, pelos comunicadores, da
apropriação, crítica e desenvolvimento de produtos de inteligência com aqueles recursos.
Descreveremos os conceitos e aplicações básicas da visão computacional para, em seguida,
apresentar estudo de caso desenvolvido pelos autores.
VISÃO COMPUTACIONAL: CONCEITOS E POSSIBILIDADES
A chamada “Visão Computacional” se refere à coleta, análise e síntese de dados visuais
através de computadores, com objetivos diversos como a identificação de rostos e biometria, a
análise de representações de objetos, entidades, conceitos e contextos em imagens, entre outros
(WANG, ZHANG & MARTIN, 2015). Tem sido aplicada em variadas áreas da indústria,
serviços e comércio para fins relacionados a controle e gestão, monitoramento, otimização de
logística e afins. Na área das Comunicações, como os mercados publicitários e de gestão da
comunicação organizacional, ainda são raras as aplicações.
As exceções de larga escala são os usos pervasivos destes recursos nas plataformas de
mídias sociais tais como Facebook, que utilizam recursos de computação visual para filtrar
conteúdo violento, pornográfico ou malicioso, além de aplicações para gerar mais engajamento e
tempo de visita dos usuários, como o reconhecimento de rostos de amigos em fotografia.
5
Entretanto, nos últimos anos, grandes empresas de tecnologia passaram a ofertar seus
serviços de inteligência artificial, aprendizado de máquina e análise estatística massiva através de
APIs (Application Programming Interfaces Interfaces de Programação de Aplicações), que
permitem que desenvolvedores e analistas “pluguem” as capacidades destas empresas em seus
próprios projetos, a custos aplicados sob demanda. Quanto à computação visual e
reconhecimento de imagens, os recursos foram lançados nos últimos quatro anos, tais como
Imagga e Alchemy (2014), Google Cloud Vision, IBMWatson Visual Insights e Clarifai
(lançados em 2015), Amazon Rekognition (2016), Microsoft Computer Vision (2017).
A consultora Susan Etlinger chama de inteligência imagética (image intelligence) “a
habilidade de extrair significados de imagens, detectar padrões e usar esses insights em
conjunção a outros dados para fazer previsões sobre o futuro” (ETLINGER, 2016, p.13). A
autora aponta seis áreas para geração de valor a partir da análise de conteúdo visual: Inovação;
Saúde de Marca; Otimização de Marketing; Geração de Receita; Performance Operacional;
Experiência do Consumidor. As aplicações são inúmeras nestas áreas e podemos destacar:
marketing de conteúdo gerado pelo consumidor que permite “conteúdo de fonte coletiva, seja de
shows, eventos esportivos, cotidiano, e depois obter conteúdo de fãs, clientes e fotógrafos para
uso criativo ou em comércio digital”
8
(ETLINGER, 2015, p.19); afinidades de marca, ao
identificar “maneiras interessantes nas quais clientes/consumidores utilizam seu produto de
maneira na qual você nunca planejou, e como eles o associam com outra coisa”
9
(ETLINGER,
2015, p.19); ou ainda analisar o storytelling, ao comparar “imagens de uma marca ao passar do
tempo para identificar mudanças visuais na história da marca”
10
(ETLINGER, 2015, p.18).
Para o estudo em questão, foi escolhida por conveniência a aplicação da plataforma de
recursos de computação visual chamada Google Vision. Em seu website, a apresentação dos
serviços possíveis de inteligência de imagens é bem clara, com a possibilidade aberta, a qualquer
visitante, de realizar um “teste” da API. Como exemplo, as imagens 1 e 2 abaixo representam,
respectivamente, a identificação de Labels (Marcadores) e Web Labels (Marcadores Web) de
uma imagem extraída de nosso próprio conjunto de dados
11
.
8
“crowdsource content, whether from concerts, sporting events, daily life, then obtain content from fans, customers
and photographers for use in creative or in digital commerce” (tradução nossa, 2018)
9
“interesting ways in which customers/consumers use your product in ways you never intended, and how they may
pair it with something else” (tradução nossa, 2018).
10
“images of a brand over time to identify visual changes in the brand story” (tradução nossa, 2018).
11
Foto do blog “Vou na Janela”, publicada em seu perfil no Instagram de mesmo nome.
6
Figura 1: Resultados na Google Vision API na opção Labels (Marcadores).
Figura 2: Resultados na Google Vision API na opção Web Labels (Marcadores Web).
Como pudemos ver acima na Figura 1, na categoria Labels, o recurso consegue
identificar categorias e conceitos como Paisagem Urbana (Cityscape), Cidade (City), Área
Urbana (Urban Area), Sky (Céu), Monumento (Landmark), Torre (Tower) e outros com alta
precisão. Esta lista de marcadores se baseia apenas na análise da imagem em si, independente de
contexto e referências. Por sua vez, a opção Web Labels (Figura 2) utiliza informações
semânticas na web retiradas do contexto (websites) onde a foto e fotos visualmente similares
foram publicadas, conseguindo identificar também itens como bairros e endereços neste caso.
7
A Google Vision ainda oferece recursos de reconhecimento de texto, propriedades de cor,
sugestão de recorte, descoberta e contagem de rostos, posicionamento dos rostos, busca por
imagens iguais e visualmente semelhantes na web e outros.
Como pudemos inferir através dos exemplos, a amplitude de aplicações do
reconhecimento de imagens envolve tanto a identificação para fins de contabilização e controle
quanto a identificação para fins de descoberta. É útil aqui a proposta de Mintz (2016), que
apresenta diferenciação analítica entre dois modos de operação da visão computacional. O
primeiro, que estaria mais associado aos campos de vigilância, seleção e monitoramento no
sentido estrito, é chamado pelo autor de operações de localização-acionamento. O
reconhecimento de imagens para fins policiais, por exemplo, aproxima-se deste conjunto de
operações, uma vez que busca ligar a descoberta de indivíduos em determinado espaço físico
ligado a também determinadas ações e eventos que se tornam suscetíveis à ligação criminal, de
responsabilidade ou simplesmente de controle, como marcação de corpos em pontos de fluxo e
registro como aeroportos. Poderíamos dizer que o campo de monitoramento de imagens através
da identificação de logotipos aproxima-se deste modo, uma vez que os objetivos de
comunicadores é comumente encontrar “pontos cegos” do monitoramento de mídias sociais. Ao
mesmo tempo reforça a impressão o fato de que um consumidor, ao postar uma foto de um tênis
que tenha a marca Nike visualmente, mas não marcada ou com a hashtag correspondente não
está, explicitamente, querendo ser “visto” pela corporação.
O segundo modo apontado por Mintz é chamado de reconhecimento-conexão, debruçado
sobre o espaço delimitado pela imagem em si, através apenas de seu dispositivo de registro
(como câmera fotográfica) ou produção (ilustração, pintura, etc.). Para o autor, trata-se de
“reconhecer padrões registrados pela imagem (como rostos e objetos) e conectá-los a redes
semânticas de dimensões variáveis, pela qual os programas realizam diferentes percursos
interpretativos do visível” (MINTZ, 2016, p. 160). Neste sentido, as redes semânticas podem ser
exploradas pelos analistas de comunicação e marketing com fins de estudar um universo de
atividades férias, no caso de nosso estudo a seguir.
ESTUDANDO #FÉRIAS NO INSTAGRAM
8
Como estudo de caso de realização de produto de inteligência comercial baseado na
computação visual, apresentamos estudo realizado pelo IBPAD partindo das seguintes questões
de pesquisa: como usar a computação visual para entender como os brasileiros representam as
férias no Instagram e qual sua relevância para estudos de mídias sociais?
12
. A relevância da
imagem do produto turístico (localidade, transporte aéreo, hotelaria, atração, etc.) é essencial no
momento de consideração da viagem:
a imagem de um produto turístico, a maneira pela qual o produto é apresentado
ou sua promessa básica são fundamentais para a decisão de compra do turista,
que compra uma experiência impossível de ser avaliada, antes de ser
efetivamente vivida. Ele compra, na maioria das vezes, uma imagem que
significa uma promessa de performance (NOGUEIRA, 2016, p.11).
Durante o processo de compra, os dois domínios básicos de sentido da imagem como
representação se confundem como a abordagem acima da imagem em torno da representação
mental intangível (visões, fantasias, imaginações e modelos) e as imagens como representações
visuais em seus aspectos tangíveis em formatos específicos, como fotografias publicadas no
Instagram. Estas imagens que circulam nas mídias sociais produzidas por usuários comuns
construindo suas representações da atividade “férias” cria pontos de criação de desejo e normas
de consumo, “em virtude de o produto turístico compor-se de elementos e percepções
intangíveis, sendo sentido como experiência” (NOGUEIRA, 2016, p.37).
Com estas questões e pressupostos em mente, a ferramenta Netlytic foi utilizada para
coletar imagens publicadas com a hashtag #férias no Instagram, resultando nas informações,
métricas e URLs de cerca de 10 mil imagens. Em seguida, depois da limpeza do dataset, o
arquivo .csv resultante foi processado através do script Memespector originalmente desenvolvido
por Bernard Rieder (2017) e adaptado para Python por Mintz (2017a), para consultar a API da
Google Vision através de procedimentos metodológicos propostos por Mintz (2018). As imagens
acessíveis publicamente totalizaram 8.591 imagens processadas.
Com o processamento das imagens no Instagram através do script, cada linha de dados
referente a uma imagem recebe novas camadas informacionais a depender dos recursos
solicitados para processamentos, tais como Marcadores, Marcadores Web, Detecção de
Logotipos, Detecção Facial, etc.
12
O estudo completo em formato de apresentação pode ser acessado em https://www.ibpad.com.br/blog/comunicacao-
digital/estudando-imagens-com-inteligencia-artificial-ferias-nas-midias-sociais
9
Figura 3: Exemplo de marcadores (Labels) atribuídas às imagens através da Google Vision API.
Os dados resultantes na planilha anotada (Figura 3) possuem inúmeras aplicações para o
analista de comunicação e marketing. O mais simples trata simplesmente do resgate de imagens
que contenham um determinado aspecto. Por exemplo, as imagens que incluam “neve” podem
ser comparadas às imagens sobre “mar” em categorias quantitativas ou qualitativas. Também é
simples a quantificação destes marcadores, de modo que representem os objetos, conceitos e
entidades mais salientes sobre determinada atividade.
A proximidade dos marcadores nas fotos permite encontrar agrupamentos de entidades e
temas nas imagens analisadas. Através da lógica relacional dos dados, a co-ocorrência dos
marcadores nas mesmas fotos os aproximam, permitindo construir redes bi-modais, composta de
ligações entre nós que representam imagens e nós que representam os marcadores. A Figura 4
abaixo mostra alguns dos marcadores posicionados em visualização do Gephi.
Figura 4: Detalhe da rede bi-modal entre imagens e marcadores, visualizada no Gephi. Os rótulos sem legenda
representam links para as imagens coletadas e processadas.
Uma vez que esta rede foi construída, unindo imagens e marcadores de acordo com suas
similaridades conceituais, foi aplicado o script Imagenet Plotter (Mintz, 2017b) que acessa as
imagens coletadas e os dispõe em uma página para a exploração e visualização posterior, em um
10
arquivo vetorial de extensão SVG, que pode ser aberto e editado em programas como Inkscape e
Adobe Illustrator. Como os nós foram distribuídos com o recurso do algoritmo Force Atlas 2 do
Gephi, a visualização dispõe as imagens de forma significante, permitindo ao analista descobrir
os agrupamentos temáticos de forma quase intuitiva.
A visualização resultante pode ser vista na Figura 5, com as indicações dos
agrupamentos descobertos. Ao menos 13 clusters puderam ser identificados na rede: Selfies em
Paisagens; Selfies no Lar e Close Up de rostos; Praia, Mar e Piscinas; Consumo na Praia;
Arquitetura Turística; Pôr-do-Sol; Mobilidade; Cachoeira / Trilhas; Modas / Trajes de Banho;
Feiras; Alimentação; Bebidas; Cachorros e Pets.
Figura 5: Rede de Imagens resultante da análise, com as temáticas agrupadas em destaque.
Vale destacarmos como a análise automatizada das imagens e decorrente agrupamento
pode permitir o surgimento de recortes analíticos posteriores para os profissionais de
comunicação. O agrupamento de Bebidas, por exemplo, traz evocações dos usuários ao lazer
11
mais acessível e à quebra da rotina de regulação de horários. Em um contexto de mercado, o
entendimento da relação de consumo de bebidas com momentos de lazer tem potencial para as
marcas identificarem em quais contextos elas estão sendo consumidas e a percepção das pessoas
com relação ao produto.
O período de férias está bastante associado com viagens e passeios de todos os tipos, e é
possível perceber as tipologias de destinos/atrações mais presentes: centros históricos das
cidades, prédios ou monumentos importantes, parques, lagoas, montanhas, rios,
casa/sítio/fazenda construídos para momentos de lazer. Muitas das fotos para viagens na Europa
se agrupam nesse cluster, devido à surpresa de viajantes ao se depararem com estilos clássicos de
arquitetura e prédios históricos, além de condições climáticas que podem apresentar novas
experiências para quem vive em regiões com climas diferentes.
É interessante também perceber as potenciais aplicações desse tipo de estudo para a
auxiliar a gestão pública, principalmente àquelas ligadas ao turismo e planejamento urbano e
bem-estar social, uma vez que a análise de conteúdo no Instagram tem potencial para apontar
características de usufruto da cidade e análise de sentimentos a partir da visão centrada no ser
humano - os próprios cidadãos. Alguns estudos já demonstram a utilização de monitoramento de
mídias sociais, em especial em ferramentas de microblogging, como o Twitter, para entender os
potenciais deste métodos de pesquisa para estudar as cidades (HOLLANDER et al, 2016).
A presença de imagens com meios de locomoção está ligada a meios para chegar ou
voltar de viagens e passeios, como carros na estrada, ônibus e avião. A descoberta de marcadores
de meios de transporte através da Google Vision permitiu a clusterização destas imagens, fonte
rica para compreensão da construção da experiência de viagem e turismo em várias fases desta
jornada e não necessariamente com foco na principal atração. E ainda que o cluster “mobilidade”
pareça elementar, é preciso levar em consideração que “os aspectos visuais no planejamento
destas experiências são fontes de inspiração e informação para a tomada de decisões referentes
às fases da jornada que antecedem a viagem” (TERTUNNEN, 2016, p. 53) - respondendo a
questões como “qual é o meio de transporte mais comum no local de origem? como se
parece?”) -; nas horas seguintes após a fotografia ser feita, ou após o retorno para a cidade de
origem, com destaque para a associação das hashtags #tbt a #férias, usadas em conjunto para
lembrar de uma sensação vivida durante o período e que servem de referência para outras
pessoas que podem estar interessadas nos destinos e atrações presentes imagens.
12
Há também a esfera na qual o próprio meio de locomoção faz parte do evento, como é o
caso de road trips e passeios de buggy em praias (que podem ser acessadas para responder a
questões como “qual é qualidade do conforto no percurso? o trajeto é visualmente convidativo?
como as pessoas dizem se sentir?”), bem como para os amantes de corridas e passeios de
moto/bicicleta com aspirações semi-profissionais e que vão além dos passeios casuais, pois
demonstram certo preparo - seja físico ou de equipamentos.
A partir da análise conseguimos identificar as principais temáticas visuais relacionadas ao
usufrutos das férias por meio de treze agrupamentos principais e a partir disso entender algumas
peculiaridades de comportamento do brasileiro com este momento, como por exemplo a forte
presença de imagens em praias e balneários, que está ligado a geografia brasileira - para citar
apenas um fator; identificar e elaborar potenciais relações de consumo que podem ser analisadas
com maior foco em determinadas categorias, a exemplo de “moda praia” e “gastronomia”; e
enxergar com mais clareza a aplicabilidade da computação visual para o desenvolvendo
hipóteses que possam gerar futuros estudos focados na compreensão do usos de espaços públicos
e na percepção de bem estar social a partir de narrativas visuais geradas pelos usuários.
CONSIDERAÇÕES FINAIS
Técnicas para realização de análise automatizada de imagens através de recursos como
Google Vision API e similares abrem novas fronteiras tecnológicas para os profissionais de
comunicação e marketing. Compreender o modo pelo qual estes recursos prontos podem ser
utilizados para a construção de produtos de inteligência analítica, resumo, descrição e síntese de
grandes volumes de dados pode gerar a incorporação criativa da inteligência artificial e
computação visual no cotidiano do analista de comunicação.
A metodologia também ganha relevância no contexto cada vez mais visual que se faz
presente nas mídias sociais, visto que as marcas devem se preparar para um cenário no qual a já
consolidada análise textual deve seguir paralela à métodos de pesquisa relacionados a imagens.
Nesse cenário, as técnicas aqui apresentadas também podem - e devem - ser adaptadas à análise
visual de vídeos, utilizando como base as sequências de frames que compõe uma obra
audiovisual. Esta é uma possibilidade bastante interessante que tem, em trabalhos internos,
gerado frutos de inteligência estratégica para clientes dos mais diversos segmentos.
13
Por fim, porém não menos importante, atentamos também para as limitações e os perigos
da utilização de APIs em temáticas sensíveis e/ou complexas demais. A técnica de machine
learning, utilizada pela Google Vision e demais ferramentas citadas neste trabalho, segue um
pressuposto de aprendizado constante que, muitas vezes, pode não dar conta da complexidade
sociocultural de teias de significados a qual se amarram os seres humanos. Ao mesmo tempo,
vale ratificar também o quanto esse contexto abre espaço para a replicabilidade de valores e
preconceitos interiores àqueles que desenvolvem este trabalho. Vários casos foram noticiados
de como máquinas e produtos de inteligência artificial atuam dentro da estrutura social que
sustenta a opressão de certos grupos em comparação a outros. Na academia, pesquisadores
responsáveis têm dedicado seus trabalhos à investigação dessa “nova” forma de opressão
(NOBLE, 2018).
Isso significa, na prática, que especificidades culturais de grupos específicos ficar de fora
da lista de interpretações que a máquina já desenvolveu. Isso abre espaço para uma realidade na
qual a inteligência das máquinas terá que ser abastecida por pessoas reais que, em sua total,
plural e complexidade, consigam ensiná-las as nuances de diferentes culturas. A ideia de
machine teaching se soma aos poucos à popularização do machine learning e abre
oportunidades, ameaças e demandas tanto mercadológicas quanto éticas aos profissionais da
comunicação e ciências sociais aplicada.
REFERÊNCIAS
ACKLAND, Robert. Web social science: Concepts, data and tools for social scientists in the digital age. Sage, 2013.
BATISTA, Deborah C.; SILVA, Tarcízio; STABILE, Max; PAEZ, Paula C.; KEARNEY, Matthew C.. Insights from Social
Media on Gender in Latin America. Inter-American Development Bank, 2017.
CORLEY, C.D.; COOK, D.J.; MIKLER, A.R.; SINGH, K.P. Text and Structural Data Mining of Influenza Mentions in Web and
Social Media. Int. J. Environ. Res. Public Health 2010, 7, 596-615.
DODDS, Peter Sheridan; DANFORTH, Christopher M. Measuring the happiness of large-scale written expression: Songs, blogs,
and presidents. Journal of happiness studies, v. 11, n. 4, p. 441-456, 2010.
ETLINGER, Susan. Image Intelligence: Making Visual Content Predictive. Altimeter Group. Online. Disponível em:
<https://www.prophet.com/2016/07/image-intelligence-making-visual-content-predictive>
GUELLIL, Imene; BOUKHALFA, Kamel. Social big data mining: A survey focused on opinion mining and sentiments analysis.
In: Programming and Systems (ISPS), 2015 12th International Symposium on. IEEE, 2015. p. 1-10.
HOLLANDER, Justin; GRAVES, Erin.; RENSKI, Henry.; FOSTER-KARIM, Cara.; WILEY, Andrew; DAS, Dibyendu. Urban
Social Listening Potential and Pitfalls for Using Microblogging Data in Studying Cities. Palgrave Macmillan, London, 2016.
KENNEDY, Helen. Post, Mine, Repeat. Ebook: Palgrave Macmillan, 2016.
14
LAESTADIUS, L. Instagram. IN: A. Quan-Haase et L. Sloan (org.). The SAGE Handbook of Social Media Research Methods,
Sage Publications: Thousand Oak, 2017.
LYNCH, Marc; FREELON, Deen; ADAY, Sean. Syria's Socially Mediated Civil War. United States Institute of Peace,
Washington: 2014. Disponível em https://www.usip.org/sites/default/files/PW91-
Syrias%20Socially%20Mediated%20Civil%20War.pdf
MACNAMARA, J. Creating an ‘architecture of listening’ in organizations: The basis of engagement, trust, healthy
democracy, social equity, and business sustainability. Sydney, NSW: University of Technology Sydney, 2015.
MANOVICH, Lev. Instagram and Contemporary Image. Disponível em http://manovich.net/content/04-projects/147-
instagram-and-contemporary-image/instagram_book_manovich.pdf
MANOVICH, Lev et al. The exceptional and the everyday: 144 hours in kiev. In: Big Data (Big Data), 2014 IEEE
International Conference on. IEEE, 2014. p. 72-79.
MINTZ, André. Máquinas que veem: visão computacional e agenciamentos do visível. In: MENOTTI, Gabriel; BASTOS,
Marcus; MORAN, Partrícia (orgs.). Cinema apesar da imagem. São Paulo: Intermeios, 2016.
MINTZ, André. Memespector. Software. Disponível no Github em < https://github.com/amintz/memespector-pythonr>. 2017a.
Acesso em abril de 2018.
MINTZ, André. Imagenet plotter. Software. Disponível no Github em < https://github.com/amintz/imagenet-plotter-py> 2017b.
Acesso em abril de 2018.
MINTZ, André. Image Networks: Automated Analysis of Visual Content. Workshop realizado no #DigitalMedia Winter
Institute, promovido pelo iNOVA Media Lab. Lisboa, Portugal, 2018.
NOBLE, Safiya Umoja. Algorithms of Oppression: How search engines reinforce racism. NYU Press, 2018.
NOGUEIRA, Adinan. A Imagem no Marketing Turístico: conceitos metodologias de medição. São Paulo: Clube dos Autores,
2016.
RABELLO, Elaine T.; MATTA, Gustavo C. Visualising engagement on Zika epidemic. Online, 2018. Disponível em:
https://smart.inovamedialab.org/smart-2018/project-reports/visualising-engagement-on-zika-epidemic/
REDI, Miriam; CROCKETT, Damon; MANOVICH, Lev; OSINDERO, Simon. What Makes Photo Cultures Different?.
In: Proceedings of the 2016 ACM on Multimedia Conference. ACM, 2016. p. 287-291.
RIEDER, Bernhard. Memespector. Software. Disponível no Github em < https://github.com/bernorieder/memespector>. 2017.
Acesso em abril de 2018.
RYKOV, Yuri; NAGORNYY, Oleg; KOLTSOVA, Olessia; NATTA, Herbert; KREMENETS, Alexander; MANOVICH, Lev;
CERRONE, Damiano; CROCKETT, D. Semantic and Geospatial Mapping of Instagram Images in Saint-Petersburg. power, v.
2607, p. 75, 2016.
SILVA, Tarcízio. Monitoramento de Marcas e Conversações: alguns pontos para discussão. In: SILVA, Tarcizio et al.
#MidiasSociais: perspectivas, tendências e reflexões. Florianópolis: Bookess, 2010.
SILVA, Tarcízio; STABILE, Max (org.). Pesquisa e Monitoramento de Mídias Sociais: metodologias, aplicações e inovações.
São Paulo: Uva Limão, 2016.
SILVA, Tarcízio. Inovação em Software as a Service: funcionalidades em ferramentas de monitoramento de mídias
sociais. Animus. Revista Interamericana de Comunicação Midiática, v. 16, n. 31, 2017.
TERTTUNEN, Anna. The influence of Instagram on consumers’ travel planning and destination choice. Tese de Mestrado
na University of Applied Sciences Haaga-Helia, 2017.
TIFENTALE, Alise; MANOVICH, Lev. Selfiecity: Exploring photography and self-fashioning in social media. In: Postdigital
Aesthetics. Palgrave Macmillan, London, 2015. p. 109-122.
VAN RAAIJ, W. Fred; FRANCKEN, Dick A. Vacation decisions, activities, and satisfactions. Annals of Tourism Research, v.
11, n. 1, p. 101-112, 1984.
WANG, JuHong; ZHANG, SongHai; MARTIN, Ralph R. New advances in visual computing for intelligent processing of visual
media and augmented reality. Science China Technological Sciences, v. 58, n. 12, p. 2210-2211, 2015.
ZANDAVALLE, Ana Claudia. O mercado de inteligência de mídias sociais. In: SILVA, Tarcízio; STABILE, Max (org.).
Pesquisa e Monitoramento de Mídias Sociais: metodologias, aplicações e inovações. São Paulo: Uva Limão, 2016.
ZANDAVALLE, Ana Claudia. Análise de Dados Visuais no Instagram: perspectivas e aplicações. IN: SILVA, Tarcízio;
BUCKSTEGGE, Jaqueline (orgs.). Estudando Cultura e Comunicação com Mídias Sociais. Brasília: IBPAD, 2018. (no
prelo).
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
O presente artigo busca descrever o lançamento de inovação incremental em softwares de monitoramento de mídias sociais. A tática, típica de produtos SaaS (software as a service) vai ao encontro do conceito de beta perpétuo, característico das mídias sociais e web 2.0. Como estudo de caso, trazemos a referência ao lançamento de módulos de análise de redes baseadas em grafos em 4 fornecedoras de serviço: Sysomos, Pulsar, Digimind, V-Tracker.
Chapter
Full-text available
User-generated visual media such as images and video shared on Instagram, YouTube and Flickr open up fascinating opportunities for the study of digital visual culture and thinking about the postdigital. Since 2012, the research lab led by Lev Manovich (Software Studies Initiative, softwarestudies.com) has used computational and data visualization methods to analyse large numbers of Instagram photos. In our first project, Phototrails (phototrails.net), we analysed and visualized 2.3 million Instagram photos shared by hundreds of thousands of people in 13 global cities. Given that everybody is using the same Instagram app, with the same set of filters and image-correction controls, and even the same image square size, and that users can learn from each other what kinds of subjects get most attention, how much variance between the cities do we find? Are networked apps such as Instagram creating a new universal visual language that erases local specificities?
Conference Paper
Full-text available
How can we use computational analysis and visualization of content and interactions on social media network to write histories? Traditionally, historical timelines of social and political upheavals give us only distant views of the events, and singular interpretation of a person constructing the timeline. However, using social media as our source, we can potentially present many thousands of individual views of the events. We can also include representation of the everyday life next to the accounts of the exceptional events. This paper explores these ideas using a particular case study – images shared by people in Kiev on Instagram during 2014 Ukranian Revolution. Using Instagram public API we collected 13208 geo-coded images shared by 6165 Instagram users in the central part of Kiev during February 17-22, 2014. We used open source and our own custom software tools to analyze the images along with upload dates and times, geo locations, and tags, and visualize them in different ways.
Book
As seen in Wired and Time A revealing look at how negative biases against women of color are embedded in search engine results and algorithms Run a Google search for “black girls”—what will you find? “Big Booty” and other sexually explicit terms are likely to come up as top search terms. But, if you type in “white girls,” the results are radically different. The suggested porn sites and un-moderated discussions about “why black women are so sassy” or “why black women are so angry” presents a disturbing portrait of black womanhood in modern society. In Algorithms of Oppression, Safiya Umoja Noble challenges the idea that search engines like Google offer an equal playing field for all forms of ideas, identities, and activities. Data discrimination is a real social problem; Noble argues that the combination of private interests in promoting certain sites, along with the monopoly status of a relatively small number of Internet search engines, leads to a biased set of search algorithms that privilege whiteness and discriminate against people of color, specifically women of color. Through an analysis of textual and media searches as well as extensive research on paid online advertising, Noble exposes a culture of racism and sexism in the way discoverability is created online. As search engines and their related companies grow in importance—operating as a source for email, a major vehicle for primary and secondary school learning, and beyond—understanding and reversing these disquieting trends and discriminatory practices is of utmost importance. An original, surprising and, at times, disturbing account of bias on the internet, Algorithms of Oppression contributes to our understanding of how racism is created, maintained, and disseminated in the 21st century.
Conference Paper
Billions of photos shared online today are created by people with different socio-economic characteristics living in different locations. We introduce a number of methods for quantifying the differences between such "photo cultures" and apply them to a large collection of Instagram images shared in five mega-cities around the world. First, we extract image content and style features and use them to design a new visualization technique for qualitative analysis of photo cultures. We then use supervised learning to automatically recognize and compare visual activity at different locations and expose surprising connections between geographically distant photo cultures. Finally, we perform a low-level quantitative analysis to understand what makes photo cultures different from each other.
Article
The importance of quantifying the nature and intensity of emotional states at the level of populations is evident: we would like to know how, when, and why individuals feel as they do if we wish, for example, to better construct public policy, build more successful organizations, and, from a scientific perspective, more fully understand economic and social phenomena. Here, by incorporating direct human assessment of words, we quantify happiness levels on a continuous scale for a diverse set of large-scale texts: song titles and lyrics, weblogs, and State of the Union addresses. Our method is transparent, improvable, capable of rapidly processing Web-scale texts, and moves beyond approaches based on coarse categorization. Among a number of observations, we find that the happiness of song lyrics trends downward from the 1960s to the mid 1990s while remaining stable within genres, and that the happiness of blogs has steadily increased from 2005 to 2009, exhibiting a striking rise and fall with blogger age and distance from the Earth’s equator. KeywordsHappiness-Hedonometer-Measurement-Emotion-Written expression-Remote sensing-Blogs-Song lyrics-State of the Union addresses
Article
Vacations are a major consumer expense category. People devote considerable attention to deciding whether to take one or not (generic decision), to making joint decisions as husband, wife, and children, and to acquiring information from different sources and media. Information functions to sensitize, persuade, heighten appreciation, and legitimize choices. Several vacation types can be distinguished. Life-style, as a broader concept, may server as a good basis of explanation for vacation behavior. Equity and attribution are important concepts in understanding vacationer (dis)satisfaction and complaint behavior.RésuméLes vacances forment une part importante des dépenses des consommateurs. Les gens consacrent une attention considérable à la'ecision dáller ou non en vacance (la décision générique); á la prise en commun des décisions des vacances par le mari, la femme et les enfants; et à l'acquisition des informations à partir des sources et média différents. L'acquisition de l'information joue un rôle primordial dans la sensibilisation, la persuasion, l'appréciation et la légitimation des choix. Plusieurs types des vacances peuvent être utilisé comme concept pour expliquer le comportement du vacancier. Equité et attribution sont des concepts importants pour comprendre la satisfaction ou la dissatisfaction et le comportement des plaints.