Content uploaded by Víctor Yeste
Author content
All content in this area was uploaded by Víctor Yeste on Mar 09, 2022
Content may be subject to copyright.
Congreso COMRED
II Congreso Internacional Comunicación y Redes
Sociales de la Sociedad de la Información
UAL, 31 de marzo y 1 de abril, 2021
Análisis predictivo colectivo del uso de hashtags en
medios nativos digitales hispanos
Collective predictive analysis of the use of hashtags in
Hispanic digital native media
Víctor Yeste-Morenoa, Ángeles Calduch-Losab y Jorge Serrano-
Cobosc
aUniversitat Politècnica de València, València, España,
vicyesmo@inf.upv.es, bUniversitat Politècnica de València, València,
España, mcalduch@eio.upv.es y cUniversitat Politècnica de València,
València, España, jorserc2@har.upv.es.
Resumen
En la literatura científica se suelen encontrar estudios de medios
desde la perspectiva del caso, analizando proyectos específicos; o,
por el contrario, de forma genérica, incluyendo medios tanto nativos
como no nativos digitales. En esta investigación, se realizará el
análisis de la actividad conjunta de los nuevos medios nativos
digitales (aquellos nacidos desde y para el entorno online) españoles
y portugueses en Twitter, extrayendo datos cibermétricos de hashtags
comunes y específicos utilizados por estos nuevos medios nativos.
Sobre esos datos, se estudia y aplica la capacidad predictiva (para
ciertos parámetros de éxito en términos de marketing y comunicación
digital) de la regresión de Poisson o la regresión binomial negativa,
unos tipos de modelo lineal generalizados que se usan para trabajar
con datos de conteo (número de veces que ocurre cierto fenómeno),
tomando muestras de datos del inicio de 2021. Como resultado
obtendremos un mapa de ciertas características de comunicación
empleadas por este subconjunto de medios, a través de esta red
social, cuyo rendimiento futuro podrá ser aproximado en base a la
capacidad de predicción de distintas variables, que permitirían a esos
medios nativos ser más sostenibles y rentables, en términos de éxito
digital.
Abstract
In the scientific literature, media studies are usually found from the
perspective of the case, analyzing specific projects; or, conversely, in
a generic way, including both native and non-native digital media. In
this research, the joint activity of the new Spanish and Portuguese
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
native digital media (those born from and for the online environment)
will be carried out on Twitter, extracting cybermetric data from common
and specific hashtags used by these new native media. On these data,
the predictive capacity (for certain parameters of success in terms of
marketing and digital communication) of the Poisson regression or
negative binomial regression, a generalized linear model type used to
work with count data (number of times that a certain phenomenon
occurs) by taking data samples from the beginning of 2021. As a result,
we will obtain a map of certain communication characteristics used by
this subset of media, through this social network, whose future
performance can be approximated based on the ability to prediction of
different variables, which would allow these native media to be more
sustainable and profitable, in terms of digital success.
Palabras clave
analítica de redes sociales, analítica de Twitter, análisis de hashtags,
análisis de tendencias, predicción de tendencias
Keywords
social media analytics, Twitter analytics, hashtag analysis, trend
analysis, trend prediction
1. Introducción
Cabrera, Codina y Salaverría (2019) definieron, tras un consenso con
otros 70 expertos en la materia, la expresión “nuevo medio”, “medio
nativo digital” o “cibermedio”, como "un ecosistema mediático
alternativo al tradicional, que innova, utiliza nuevos formatos
narrativos y tiene una nueva relación con la audiencia".
De éstos, López García et. al. (2015) analiza diversos medios
españoles y portugueses, y no sólo comprueba la explosión de estos
cibermedios, sino que los caracteriza, detectando la fuerte inclusión
de "vías de participación de los ciudadanos en el producto", con
estrategias en las redes sociales, lo que también comprueba Martínez
(2017) en una muestra más amplia de nuevos medios. Por tanto, es
apropiado interesarse por estas estrategias, y observar posibles
semejanzas y diferencias entre medios nativos o cibermedios de
países como España y Portugal.
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
Algunos autores exploran una de las características recurrentes en
buena parte de estos medios, su condición geográficamente localista,
como por ejemplo Moreno (2017) o Fondevila-Gascón, Rom-
Rodríguez y Santana-López (2016) en su especialización temática.
Pero es en esa fuerte vinculación a las redes sociales donde se
pueden encontrar aspectos que sirvan para comparar sus patrones de
comportamiento, y predecir ese comportamiento específico, donde
diferentes medios, dependiendo de su contexto y área de intención de
influencia (ya sea geográfica, por edad, etc.) trabajan en distintas
redes sociales, como observa Abdulaziz (2020).
Así, al respecto, Cea y De Vicente (2020) investigan la medición de
engagement en las redes sociales, métrica o conjunto de métricas que
podrían resultar apropiadas para esta caracterización, aunque se
realiza en un ámbito reducido de medios. Si restringimos el análisis a
una de las redes sociales más utilizadas en este tipo de medios en
España y Portugal, Twitter, se observan muy distintas variables de
análisis, hasta 102 indicadores según Navas (2018) que ayudan a
entender cómo se expresan, interactúan y comparten información de
terceros estos medios a través de sus cuentas sociales. Otros
estudios, como el de Peña et. al. (2015), se fijan en el impacto de las
redes sociales en cuanto a difusión de noticias, pero lo hacen con 73
principales medios de comunicación en España, sin segmentar, lo que
sucede en otros casos, como González-Molina y Ramos del Cano,
donde se trabaja con medios de comunicación en general, no con
medios nativos o cibermedios tan sólo.
Las redes sociales se han utilizado desde sus inicios para realizar
múltiples análisis estadísticos, por separado o de forma grupal, pero
normalmente para describir o predecir comportamientos hacia un
evento o una temática concreta, con estudios como los de Franch y
Micó (2021) sobre política en los medios sociales; la capacidad de
predicción del éxito de películas, donde Rouwenhorst, en 2018,
calculó la mayor utilidad predictiva de Instagram, en comparación con
Twitter, analizando 40.000 posts; o el análisis predictivo de
comunidades, como Shahriari et. al. (2016), que emplea un
clasificador logístico para la detección de la evolución de la
comunidad social en su conjunto.
Precisamente en este sentido se enmarca el actual trabajo de
investigación, que busca por un lado la detección de variables de
predicción que puedan resultar útiles a los medios nativos digitales o
cibermedios para predecir el éxito de sus publicaciones, y estudiar a
una comunidad en su conjunto, tal es el caso de los medios nativos
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
españoles y portugueses, de forma que se puedan comparar como
conjuntos de medios, diferenciados por su contexto geopolítico y
lingüístico, pero unidos por el momento de análisis.
2. Diseño y Método
En el presente trabajo se ha estudiado el resultado en retweets que
ha tenido el uso de hashtags por un conjunto de medios nativos
digitales (aquellos nacidos desde y para el entorno online) españoles
y portugueses en Twitter, desde el punto de vista del análisis de
tendencias.
Se trata de una investigación explicativa, cuantitativa y no
experimental, que utiliza un tipo de inferencia inductiva con un
seguimiento longitudinal. Para ello, se analiza el uso de hashtags
tomando el conteo de retweets como variable principal, y se plantea
como hipótesis que es posible realizar la predicción de la variable 14
días después.
El ámbito de estudio, por lo tanto, es el de las cuentas de Twitter de
los medios nativos digitales generalistas que han nacido desde y para
el entorno online en España y Portugal. Se ha extraído una muestra
de 96 cuentas, 48 de ellas de medios españoles y las otras 48 de
medios portugueses. Se ha utilizado un tipo de muestreo de cuota
utilizando como fuentes: Entidade Reguladora Para A Comunicaçao
Social (https://www.erc.pt/pt/listagem-registos-na-erc) y Observatorio
de Nuevos Medios (https://nuevosmedios.es/).
Este estudio consta de dos dimensiones aplicadas al uso de cada
hashtag:
1) El tipo de emisor de los tweets: el conjunto seleccionado de
medios nativos digitales (prefijo “m_” en las variables) o el
conjunto de usuarios de Twitter en general, utilizando para este
último la funcionalidad de búsqueda de la API de Twitter (prefijo
“tw_” en las variables).
2) El idioma utilizado por el emisor de cada tweet: español (sufijo
“_es” en las variables) o portugués (sufijo “_pt” en las variables).
Teniendo en cuenta estas dimensiones, se han tomado los datos
haciendo uso de las siguientes variables de análisis, todas ellas en
modo conteo, es decir, sumando el total de los datos captados por
cada tweet en el que se ha incluido el hashtag analizado:
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
1) Tweets (nombre de variable “num_tweets”)
2) Retweets (nombre de variable “retweet_count”)
3) Favoritos (nombre de variable “favorite_count”)
4) Seguidores de los autores de los tweets (nombre de variable
“user_num_followers”)
5) Tweets publicados por los autores de los tweets (nombre de
variable “user_num_tweets”)
6) Edad en días de las cuentas de Twitter de los autores de los
tweets (nombre de variable “user_age”)
7) Tweets que incluyen una URL (nombre de variable “url_inclusion”)
Estas variables de análisis han servido para realizar una técnica de
investigación de tipo correlacional, mediante la cual se realiza un
análisis de regresión con el objetivo de averiguar las relaciones entre
las variables y analizar la posibilidad de predecir la cantidad de
retweets. Para ello, se han hecho dos tomas, una toma inicial (sufijo
“_t0” en las variables) y una toma 14 días después (sufijo “_t1” en las
variables).
3. Trabajo de Campo y Análisis de Datos
3.1. Obtención de los datos
Para realizar el estudio, ha sido necesario llevar a cabo dos tomas de
datos: una primera toma cuya obtención y procesamiento se realizó
entre el 13 de enero y el 22 de enero de 2021, mientras que la
segunda toma se produjo entre el 27 de enero y el 5 de febrero. La
duración de las mismas vino determinada por las limitaciones
metodológicas relacionadas con el uso de la versión estándar de la
API de Twitter (versión 1.1), ya que sólo permite realizar 180
peticiones cada 15 minutos, dando cada petición como resultado un
conjunto de 100 tweets y produciendo un total de 18.000 posibles
tweets en cada intervalo de 15 minutos (Standard search API, s.f.).
Las funcionalidades de captación de datos de la API de Twitter
también han impuesto un máximo al conjunto de tweets recogidos por
el algoritmo. La funcionalidad de procesado de tweets de las cuentas
de los medios nativos sólo puede devolver los últimos 3.200 tweets
publicados por cada cuenta de Twitter (GET statuses/user_timeline,
s.f.). Por otro lado, la funcionalidad de búsqueda, que permite la
recogida de datos del uso de cada hashtag en Twitter en general, sólo
devuelve una muestra de los tweets publicados en los 7 días
anteriores a la petición (Search Tweets: standard v1.1, s.f.).
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
3.2. Análisis estadístico
Una vez obtenidos los datos de las variables de análisis en las tres
dimensiones mencionadas en el apartado 2, se ha realizado el análisis
multivariado de las variables recogidas en la toma de datos inicial. Así,
se ha observado la correlación Pearson que existe entre las variables
y se ha realizado un filtro de alta correlación para evitar la colinealidad
entre ellas.
Para el análisis de regresión, puede suceder que el número de
retweets en la toma 14 días después (la variable dependiente) sea
una combinación lineal de una variable independiente de la toma
inicial, es decir, que exista una correlación muy fuerte (cercana a 1)
entre la variable dependiente y una o más de una de las variables
independientes. En ese caso, se tendrá que realizar la regresión lineal
simple de la variable objetivo en base a aquella con la que comparta
una correlación muy fuerte, ya que no sería adecuado realizar otro
tipo de regresiones como las que se explicarán a continuación,
siempre y cuando los datos sigan una distribución normal, condición
indispensable para cualquier regresión lineal (Barón López & Téllez
Montiel, s.f.).
En el caso de que no exista ninguna correlación muy fuerte entre la
variable dependiente y alguna de las independientes, se ha hecho uso
de los modelos de Poisson y regresión binomial negativa, ya que son
los más utilizados para datos de tipo conteo. El modelo de Poisson es
más adecuado cuando no hay sobredispersión en los datos, siendo
en caso contrario más adecuado utilizar el de regresión binomial
negativa (Lawless, 1987). Esto último se debe a que el modelo de
regresión binomial negativa puede captar parte de la varianza que no
encuentra el modelo de Poisson, y de haber sobredispersión se
provocaría una subestimación en los errores estándares de los
coeficientes. La sobredispersión, como luego se comprobará en este
estudio, es muy frecuente en fenómenos recurrentes como el
contenido online (Navarro, Utzet, Puig, Caminal, & Martín, 2001).
Para seleccionar el método de regresión a utilizar, se ha realizado la
prueba de dispersión estadística chi-cuadrada de Pearson,
devolviendo el valor de uno si la varianza es igual a la media. Si esta
dispersión está cercana a uno, la regresión de Poisson será la
utilizada. Si no es así, se utilizará la regresión binomial negativa.
Todos estos análisis estadísticos se han realizado gracias al
programa STATGRAPHICS 18.
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
3.3. Cálculo del error
Una vez obtenidas las ecuaciones de regresión y la variabilidad que
explican (R-cuadrada), se calcularán los valores predichos para el
número de retweets de cada combinación de dimensiones. Para cada
una, se obtendrá asimismo la raíz del error medio cuadrático (RMSE),
es decir, la desviación estándar de los errores de predicción, así como
el error medio absoluto (MAE), obteniendo así la precisión con la que
se ha predicho la variable objetivo en la toma 14 días después.
Se aportan ambas mediciones del error debido a que son muy
utilizadas en los estudios de evaluación de modelos. RMSE es más
adecuado cuando se desea dar un mayor peso a los valores
anómalos, ya que presenta una mayor sensibilidad a estos. En este
estudio, debido a una gran sobredispersión en los datos, resulta
conveniente añadir también el MAE para poder contar con un error
que no esté tan afectado por valores atípicos. (Chai & Draxler, 2014)
La fórmula para calcular el RMSE es: (Sridhar & Khan, 2014)
𝑅𝑀𝑆𝐸 =&
'∑
(𝑋!− 𝑋")#/𝑁
,
La fórmula para calcular el MAE es: (Chai & Draxler, 2014)
𝑀𝐴𝐸 =&
∑
(𝑋!− 𝑋")/𝑁
,
Donde
𝑋!
: Valor obtenido en la toma 14 días después
𝑋"
: Valor predicho por la ecuación de regresión
𝑁
: Número de puntos de datos medidos
4. Resultados
4.1. Resumen de los datos recogidos
Se han obtenido un total de 1.321.500 datos, detectando el uso de
12.424 hashtags diferentes por parte de las cuentas de Twitter de la
muestra en dos momentos temporales diferentes.
Se han procesado un total de 12.037.095 tweets, que se pueden
clasificar según las dos dimensiones en las siguientes cifras:
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
Figura 1. Resumen de tweets procesados en sus diferentes
dimensiones. Fuente propia
El 98,84% de los tweets en total incluyen una URL, siendo un número
realmente parecido para ambos idiomas: el 98,81% de los tweets en
español y el 98,85% de los tweets en portugués incluyen una URL.
Puesto que se ha guardado la edad en días de la cuenta que publica
cada tweet, se ha extraído que los tweets publicados por los medios
nativos digitales hispanos han presentado un promedio de 3.287,53
días de edad en sus cuentas de procedencia, siendo este número
3.943,37 en el caso de los tweets en español, y 2.690,55 en el de los
tweets en portugués.
4.2. Listados de Hashtags según su uso y
comportamiento
A continuación, se mostrará una serie de listados de los hashtags más
utilizados y que más retweets han recibido en la toma inicial:
Tabla 1. Listado de los diez hashtags más utilizados en las cuentas de
medios nativos digitales hispanos
12.037.095 tweets
procesados
163.721 tweets
de medios nativos
digitales hispanos
77.751 tweets
en español
85.970 tweets
en portugués
11.873.374 tweets
de la búsqueda en
Twitter
10.315.091 tweets
en español
1.558.283 tweets
en portugués
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
Medios nativos
digitales hispanos
Español
Portugués
Hashtag
Tweets
Hashtag
Tweets
Hashtag
Tweets
covid19
3016
clm
1489
covid19
2057
politica
1819
coronavirus
1205
home
1359
coronaviru
s
1743
españa
1061
politica
1336
clm
1489
sucesos
1028
desportoao
minuto
1104
home
1359
covid19
959
emdireto
802
desportoao
minuto
1104
ourense
890
portugal
734
españa
1061
granada
848
mundoaomi
nuto
577
sucesos
1028
sociedad
835
coronavirus
538
ourense
890
huelva
776
olargopt
532
granada
850
lomásleído
635
saúde
524
Fuente propia
Siete de los hashtags más utilizados por los medios españoles están
presentes entre los diez más utilizados por los medios nativos digitales
hispanos mientras que, en el caso de los medios portugueses, cinco
están entre ellos.
Tabla 2. Listado de los diez hashtags que más retweets (RT)
recibieron en las cuentas de medios nativos digitales hispanos
Medios nativos
digitales hispanos
Español
Portugués
Hashtag
RT
Hashtag
RT
Hashtag
RT
leymordaz
a
5520
leymordaz
a
5520
legislativas20
19
270
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
leyesmord
aza
5105
leyesmord
aza
5105
videocheck
244
vídeo
3538
vídeo
3536
covid19
174
Últimahora
3243
Últimahora
3231
fcporto
112
sinmordaz
as
2770
sinmordaz
as
2770
liganos
106
refugiados
2523
refugiados
2521
coronavirus
99
periodista
2507
periodista
2507
portugal
96
on29
2346
on29
2346
mundoaomin
uto
76
granada
2300
granada
2297
politica
68
urgente
2292
urgente
2292
viagens
67
Fuente propia
Los hashtags más retwitteados provienen de los medios españoles.
Otro dato interesante es que sólo el hashtag “granada” está presente
entre los más utilizados y los más retwitteados por los medios
nativos digitales hispanos, así como en los españoles. En el caso de
los portugueses, coinciden en ambos listados “covid19”,
“coronavirus”, “mundoaominuto” y “politica”.
Tabla 3. Listado de los diez hashtags más utilizados en Twitter de los
empleados por los medios nativos digitales hispanos
Twitter
Español
Portugués
Hashtag
Tweets
Hashtag
Tweets
Hashtag
Tweets
covid19
35345
caracas
32940
flamengo
17722
coronaviru
s
34679
china
32780
covid19
17623
brasil
34428
ddhh
29794
bbtvi
17615
caracas
33015
estadosuni
dos
28001
impeachme
nt
17444
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
china
32780
fútbol
24221
coronavirus
16967
v
30244
empleo
23107
brasil
16809
ddhh
29813
facebook
22126
vacina
16530
libra
29660
efemeride
19784
leao
14410
cáncer
29602
internacion
al
19187
info
13984
estadosuni
dos
28238
honduras
18306
cáncer
13105
Fuente propia
En el caso del análisis del uso de los hashtags en Twitter mediante la
funcionalidad de búsqueda, cuatro de los hashtags más utilizados por
los usuarios españoles están presentes entre los diez más utilizados
por Twitter, repitiéndose la misma cifra en el caso de los usuarios
portugueses.
Tabla 4. Listado de los diez hashtags que más retweets (RT)
recibieron en Twitter de los empleados por los medios nativos digitales
hispanos
Twitter
Español
Portugués
Hashtag
RT
Hashtag
RT
Hashtag
RT
perros
5003697
65
perros
500369
491
v
36345
2511
v
3683871
09
opinión
179852
880
flamengo
20201
767
opinión
1798530
85
uci
787054
47
presidenciais2
021
17750
061
uci
7870545
0
sanitarios
782839
63
covid19
17443
132
sanitarios
7828396
3
hospital
778388
12
rip
14638
966
hospital
7783895
6
urgente
424100
53
diadesporting
88507
86
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
urgente
4560417
3
málaga
331610
68
allianzcup
58895
89
málaga
3316106
8
violenciade
genero
304188
88
gta6
50842
61
violenciade
genero
3041889
2
misericórdi
a
261691
94
impeachment
47954
54
misericórdi
a
2677475
1
niunameno
s
222854
49
covid19?
44153
38
Fuente propia
Los hashtags más retwitteados coinciden en su mayor parte con los
más retwitteados por usuarios españoles, con la salvedad del
hashtag “v”. Otro dato interesante es que sólo el hashtag “v” está
presente entre los más utilizados y los más retwitteados por los
usuarios de Twitter. En el caso de los españoles, no coincide
ninguno, y en el de los portugueses, coinciden en ambos listados
“flamengo” y “covid19”.
4.3. Análisis de correlación Pearson de las variables
independientes
El listado inicial de variables comprende las siete variables
estadísticas descritas en el apartado 2 en sus dos dimensiones
(origen e idioma), sumando un total de 28 variables divididas en cuatro
conjuntos: medios digitales españoles, medios digitales portugueses,
usuarios de Twitter españoles y usuarios de Twitter portugueses.
Puesto que, para realizar las regresiones, las variables
independientes no pueden tener una correlación fuerte entre sí,
resulta necesario realizar un análisis multivariado de todas las
variables. Se entenderá como correlación fuerte cualquiera que iguale
o supere el valor de 0,7 absoluto.
En primer lugar, se realizó un análisis de las correlaciones Pearson
de todas las variables a la vez:
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
Figura 2. Correlaciones Pearson de todas las variables obtenidas en
la toma inicial. Fuente propia a partir de STATGRAPHICS 18
Se puede observar visualmente que no hay una correlación fuerte
entre los cuatro conjuntos de variables, por lo que se procede a
analizar las correlaciones Pearson de cada uno de los conjuntos por
separado, empezando por el conjunto de los medios nativos digitales
españoles:
Figura 3. Correlaciones Pearson de las variables obtenidas en la toma
inicial de los medios nativos digitales españoles. Fuente propia a partir
de STATGRAPHICS 18
Se advierte la presencia de correlaciones fuertes entre algunas de las
variables, por lo que es necesario realizar un filtro de alta correlación
en las mismas hasta que sólo estén aquellas que tengan una
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
correlación Pearson menor que 0,7. El criterio que se ha seguido para
escoger entre una y otra de las que estén fuertemente
correlacionadas es elegir la de menores curtosis y sesgo
estandarizadas.
Figura 4. Correlaciones Pearson de las variables obtenidas en la toma
inicial de los medios nativos digitales españoles tras el filtro de alta
correlación. Fuente propia a partir de STATGRAPHICS 18
De esta manera, el listado final del conjunto de variables de los medios
nativos digitales españoles es: tweets, retweets, favoritos y
seguidores de los usuarios que han publicado tweets con los
hashtags.
A continuación, se realizará la misma metodología para el conjunto de
variables de los usuarios españoles en Twitter:
Figura 5. Correlaciones Pearson de las variables obtenidas en la toma
inicial de usuarios españoles de Twitter. Fuente propia a partir de
STATGRAPHICS 18
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
Se aprecia la presencia de correlaciones fuertes entre algunas de las
variables, por lo que es necesario realizar un filtro de alta correlación,
con el mismo criterio del anterior conjunto:
Figura 6. Correlaciones Pearson de las variables obtenidas en la toma
inicial de los usuarios españoles de Twitter tras el filtro de alta
correlación. Fuente propia a partir de STATGRAPHICS 18
De esta manera, el listado final del conjunto de variables de los
usuarios españoles de Twitter es: tweets, retweets y seguidores de
los usuarios que han publicado tweets con los hashtags.
A continuación, se analizará el conjunto de los medios nativos
digitales portugueses:
Figura 7. Correlaciones Pearson de las variables obtenidas en la toma
inicial de los medios nativos digitales portugueses. Fuente propia a
partir de STATGRAPHICS 18
Se advierte la presencia de correlaciones fuertes entre algunas de las
variables, por lo que es necesario realizar un filtro de alta correlación,
con el mismo criterio del anterior conjunto:
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
Figura 8. Correlaciones Pearson de las variables obtenidas en la toma
inicial de los medios nativos digitales portugueses tras el filtro de alta
correlación. Fuente propia a partir de STATGRAPHICS 18
De esta manera, el listado final del conjunto de variables de los medios
nativos digitales portugueses es: retweets, seguidores de los usuarios
que han publicado tweets con los hashtags y edad en días de los
usuarios que han publicado tweets con los hashtags.
A continuación, se realizará la misma metodología para el conjunto de
variables de los usuarios portugueses en Twitter:
Figura 9. Correlaciones Pearson de las variables obtenidas en la toma
inicial de usuarios portugueses de Twitter. Fuente propia a partir de
STATGRAPHICS 18
Se aprecia la presencia de correlaciones fuertes entre algunas de las
variables, por lo que es necesario realizar un filtro de alta correlación,
con el mismo criterio del anterior conjunto:
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
Figura 10. Correlaciones Pearson de las variables obtenidas en la
toma inicial de los usuarios portugueses de Twitter tras el filtro de alta
correlación. Fuente propia a partir de STATGRAPHICS 18
De esta manera, el listado final del conjunto de variables de los
usuarios portugueses de Twitter es: tweets, retweets, seguidores de
los usuarios que han publicado tweets con los hashtags y tweets
publicados por los usuarios que han publicado tweets con los
hashtags.
En conclusión, el listado final completo consta de 14 variables
independientes, utilizándose las correspondientes al idioma de cada
variable dependiente:
• Medios nativos digitales españoles: tweets, retweets, favoritos
y seguidores de los usuarios que han publicado tweets con los
hashtags.
• Usuarios españoles de Twitter: tweets, retweets y seguidores
de los usuarios que han publicado tweets con los hashtags
• Medios nativos digitales portugueses: retweets, seguidores de
los usuarios que han publicado tweets con los hashtags y edad
en días de los usuarios que han publicado tweets con los
hashtags.
• Usuarios portugueses de Twitter: tweets, retweets, seguidores
de los usuarios que han publicado tweets con los hashtags y
tweets publicados por los usuarios que han publicado tweets
con los hashtags.
4.4. Análisis de regresión
Una vez obtenidas las variables independientes, se realizará el
análisis de regresión más adecuado para cada variable dependiente:
el número de retweets de los medios nativos digitales españoles, el
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
número de retweets de los usuarios españoles de Twitter, el número
de retweets de los medios nativos digitales portugueses y el número
de retweets de los usuarios portugueses de Twitter.
En primer lugar, se realiza el análisis de regresión del número de
retweets de los medios nativos digitales españoles. Esta variable
presenta un promedio de 10,71, un sesgo estandarizado de 1.266,64
y una curtosis estandarizada de 22.567,7, unos valores que se alejan
mucho de los propios de una distribución normal.
Se lleva a cabo el análisis multivariado de esta variable junto con las
variables dependientes mencionadas en el apartado 4.3 con idioma
español, extrayendo las correlaciones Pearson entre ellas:
Figura 11. Correlaciones Pearson de las variables obtenidas en la
toma inicial de los medios nativos digitales españoles y los retweets
obtenidos en la toma de 14 días después. Fuente propia a partir de
STATGRAPHICS 18
En la figura anterior, se puede comprobar que existe una correlación
muy fuerte (cercana a 1) entre el número de retweets en la toma inicial
y en la toma de 14 días después, con valor de 0,99. Es, por tanto, más
adecuado realizar una regresión lineal simple entre ambas variables.
Sin embargo, ambas variables presentan valores de sesgo y curtosis
estandarizados que demuestran que no siguen una distribución
normal. Se ha intentado su normalización mediante una
transformación logarítmica e incluso una transformación doble, pero
no ha sido posible normalizar los datos. Por ello, se descarta la opción
de utilizar la regresión lineal simple.
Se realiza la prueba chi-cuadrado en el número de retweets de los
medios nativos digitales españoles, calculando así su desviación
estándar. El resultado es 1,72131E8 con p-valor cercano a cero, un
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
valor muy lejano del 1, por lo que la regresión binomial negativa es
más adecuada que la de Poisson con un 95% de confianza.
Se realiza, por tanto, la regresión binomial negativa con una selección
de factores ajustada a pasos hacia atrás, es decir, comenzando con
todas las variables y eliminando aquellas que presenten un p-valor
mayor a 0,05, ya que esto nos indicaría que no son significativas. De
esta manera, se obtiene un modelo ajustado con p-valor cercano a
cero que explica el 60,84% de la variabilidad del número de retweets,
con una raíz del error medio cuadrático (RMSE) de 66.052.857,62 y
un error absoluto medio (MAE) de 265.150, siendo este último el valor
promedio de los residuos. La ecuación del modelo ajustado es:
m_retweet_count_es_t1 = exp(1,9353 +
0,00128398*m_num_tweets_es_t0 +
0,00182371*m_retweet_count_es_t0 +
0,00014033*m_favorite_count_es_t0 +
1,51891E-8*m_user_num_followers_es_t0 +
0,0000930838*tw_num_tweets_es_t0)
Donde:
m_retweet_count_es_t1 = Número de retweets de los medios nativos
digitales españoles en la toma 14 días después
m_num_tweets_es_t0 = Número de tweets de los medios nativos
digitales españoles en la toma inicial
m_retweet_count_es_t0 = Número de retweets de los medios nativos
digitales españoles en la toma inicial
m_favorite_count_es_t0 = Número de favoritos de los medios nativos
digitales españoles en la toma inicial
m_user_num_followers_es_t0 = Seguidores de los autores de los
tweets de los medios nativos digitales españoles en la toma inicial
tw_num_tweets_es_t0 = Número de tweets de los autores de los
tweets de los usuarios españoles de Twitter en la toma inicial
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
Figura 12. Relación entre los valores observados y los predichos por
la ecuación de regresión de los retweets de los medios nativos
digitales españoles en la toma de 14 días después. Fuente propia a
partir de STATGRAPHICS 18
Se puede comprobar gráficamente en la figura anterior que la
ecuación de regresión comprende una variabilidad alta, ya que los
valores observados se acercan a la línea que supone la ecuación de
regresión, pero hay un cierto porcentaje que se aleja de la misma.
A continuación, se realiza el análisis de regresión del número de
retweets de los usuarios españoles de Twitter. Esta variable presenta
un promedio de 122.981, un sesgo estandarizado de 2.859,84 y una
curtosis estandarizada de 118.420, valores muy alejados de una
distribución normal.
Se lleva a cabo el análisis multivariado de esta variable junto con las
variables dependientes mencionadas en el apartado 4.3 con idioma
español, extrayendo las correlaciones Pearson entre ellas:
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
Figura 13. Correlaciones Pearson de las variables obtenidas en la
toma inicial de los usuarios españoles de Twitter y los retweets
obtenidos en la toma de 14 días después. Fuente propia a partir de
STATGRAPHICS 18
En la figura anterior, se puede comprobar que no existe ninguna
correlación muy fuerte (cercana a 1) entre el número de retweets en
la toma inicial y en la toma de 14 días después. Es por ello por lo que
se plantea realizar una regresión binomial negativa o una regresión
de Poisson.
Se realiza la prueba chi-cuadrado en el número de retweets de los
usuarios españoles de Twitter, calculando así su desviación estándar.
El resultado es 6,40832E16 con p-valor cercano a cero, un valor muy
lejano del 1, por lo que la regresión binomial negativa es más
adecuada que la de Poisson con un 95% de confianza.
Se realiza, por tanto, la regresión binomial negativa con una selección
de factores ajustada a pasos hacia atrás, es decir, comenzando con
todas las variables y eliminando aquellas que presenten un p-valor
mayor a 0,05, ya que esto nos indicaría que no son significativas. De
esta manera, se obtiene un modelo ajustado con p-valor cercano a
cero que explica el 2,91% de la variabilidad del número de retweets,
con una raíz del error medio cuadrático (RMSE) de 1,78599E50 y un
error absoluto medio (MAE) de 4,53021E25, siendo este último el
valor promedio de los residuos. La ecuación del modelo ajustado es:
tw_retweet_count_es_t1 = exp(40,1302 -
0,0025989*m_retweet_count_es_t0 +
0,00126423*m_favorite_count_es_t0 -
1,55773E-7*m_user_num_followers_es_t0 +
0,000022351*tw_num_tweets_es_t0 -
1,39404E-9*tw_retweet_count_es_t0 +
8,63604E-9*tw_user_num_followers_es_t0)
Donde:
tw_retweet_count_es_t1 = Número de retweets de los usuarios
españoles en Twitter en la toma 14 días después
m_retweet_count_es_t0 = Número de retweets de los medios nativos
digitales españoles en la toma inicial
m_favorite_count_es_t0 = Número de favoritos de los medios nativos
digitales españoles en la toma inicial
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
m_user_num_followers_es_t0 = Seguidores de los autores de los
tweets de los medios nativos digitales españoles en la toma inicial
tw_num_tweets_es_t0 = Número de tweets de los autores de los
tweets de los usuarios españoles de Twitter en la toma inicial
tw_retweet_count_es_t0 = Número de retweets de los usuarios
españoles en Twitter en la toma inicial
tw_num_followers_es_t0 = Seguidores de los autores de los tweets
de los usuarios españoles de Twitter en la toma inicial
Figura 14. Relación entre los valores observados y los predichos por
la ecuación de regresión de los retweets de los usuarios españoles de
Twitter en la toma de 14 días después. Fuente propia a partir de
STATGRAPHICS 18
Se puede comprobar gráficamente en la figura anterior que la
ecuación de regresión comprende una variabilidad muy baja, ya que
los valores observados se alejan mucho de la línea que supone la
ecuación de regresión.
En tercer lugar, se realiza el análisis de regresión del número de
retweets de los medios nativos digitales portugueses. Esta variable
presenta un promedio de 0,4, un sesgo estandarizado de 1.675,26 y
una curtosis estandarizada de 39.716,4, valores muy lejanos de ser
propios de una distribución normal.
Se lleva a cabo el análisis multivariado de esta variable junto con las
variables dependientes mencionadas en el apartado 4.3 con idioma
portugués, extrayendo las correlaciones Pearson entre ellas:
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
Figura 15. Correlaciones Pearson de las variables obtenidas en la
toma inicial de los medios nativos digitales portugueses y los retweets
obtenidos en la toma de 14 días después. Fuente propia a partir de
STATGRAPHICS 18
En la figura anterior, se puede comprobar que existe una correlación
muy fuerte (cercana a 1) entre el número de retweets en la toma inicial
y en la toma de 14 días después, con valor de 0,99. Es, por tanto, más
adecuado realizar una regresión lineal simple entre ambas variables.
No obstante, ambas variables presentan valores de sesgo y curtosis
estandarizados alejados de los propios de una distribución normal. Se
ha intentado normalizarlas mediante una transformación logarítmica e
incluso una transformación doble, pero no ha sido posible. Por ello, se
descarta la opción de utilizar la regresión lineal simple.
Se realiza la prueba chi-cuadrado en el número de retweets de los
medios nativos digitales portugueses, calculando así su desviación
estándar. El resultado es 293.925 con p-valor cercano a cero, un valor
muy lejano del 1, por lo que la regresión binomial negativa es más
adecuada que la de Poisson con un 95% de confianza.
Se realiza la regresión binomial negativa con una selección de
factores ajustada a pasos hacia atrás, es decir, comenzando con
todas las variables y eliminando aquellas que presenten un p-valor
mayor a 0,05, ya que esto nos indicaría que no son significativas. De
esta manera, se obtiene un modelo ajustado con p-valor cercano a
cero que explica el 55,73% de la variabilidad del número de retweets,
con una raíz del error medio cuadrático (RMSE) de 2.943.786,677 y
un error absoluto medio (MAE) de 19.404,1, siendo este último el valor
promedio de los residuos. La ecuación del modelo ajustado es:
m_retweet_count_pt_t1 = exp(-1,26208 +
0,0413543*m_retweet_count_pt_t0 +
3,7544E-7*m_user_num_followers_pt_t0 +
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
1,47056E-7*m_user_age_pt_t0 –
0,0000857981*tw_num_tweets_pt_t0 +
9,96207E-9*tw_user_num_followes_pt_t0)
Donde:
m_retweet_count_pt_t1 = Número de retweets de los medios nativos
digitales portugueses en la toma 14 días después
m_retweet_count_pt_t0 = Número de retweets de los medios nativos
digitales portugueses en la toma inicial
m_user_num_followers_pt_t0 = Seguidores de los autores de los
tweets de los medios nativos digitales portugueses en la toma inicial
m_user_age_pt_t0 = Edad en días de las cuentas de Twitter de los
autores de los tweets de los medios nativos digitales portugueses en
la toma inicial
tw_num_tweets_pt_t0 = Número de tweets de los autores de los
tweets de los usuarios portugueses de Twitter en la toma inicial
tw_user_num_followers_pt_t0 = Seguidores de los autores de los
tweets de los medios nativos digitales portugueses en la toma inicial
Figura 16. Relación entre los valores observados y los predichos por
la ecuación de regresión de los retweets de los medios nativos
digitales portugueses en la toma de 14 días después. Fuente propia a
partir de STATGRAPHICS 18
Se puede comprobar gráficamente en la figura anterior que la
ecuación de regresión comprende una variabilidad alta, ya que los
valores observados se acercan a la línea que supone la ecuación de
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
regresión, pero sí que se aprecia que un porcentaje de ellos se aleja,
explicando la variabilidad que no se ha captado.
Por último, se realiza el análisis de regresión del número de retweets
de los usuarios portugueses de Twitter. Esta variable presenta un
promedio de 42.427,4, un sesgo estandarizado de 4.663,5 y una
curtosis estandarizada de 249.252, muy lejos de una distribución
normal.
Se lleva a cabo el análisis multivariado de esta variable junto con las
variables dependientes mencionadas en el apartado 4.3 con idioma
portugués, extrayendo las correlaciones Pearson entre ellas:
Figura 17. Correlaciones Pearson de las variables obtenidas en la
toma inicial de los usuarios portugueses de Twitter y los retweets
obtenidos en la toma de 14 días después. Fuente propia a partir de
STATGRAPHICS 18
En la figura anterior, se puede comprobar que existe una correlación
muy fuerte (cercana a 1) entre el número de retweets en la toma inicial
y en la toma de 14 días después, con valor de 0,97. Es, por tanto, más
adecuado realizar una regresión lineal simple entre ambas variables.
Sin embargo, ambas variables presentan valores de sesgo y curtosis
estandarizados lejanos a los de una distribución normal. Se ha tratado
de normalizarlas mediante una transformación logarítmica e incluso
una transformación doble, pero no ha sido posible. Por ello, se
descarta la opción de utilizar la regresión lineal simple.
Se realiza la prueba chi-cuadrado en el número de retweets de los
usuarios españoles de Twitter, calculando así su desviación estándar.
El resultado es 9,99349E16 con p-valor cercano a cero, un valor muy
lejano del 1, por lo que la regresión binomial negativa es más
adecuada que la de Poisson con un 95% de confianza.
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
Se realiza, por tanto, la regresión binomial negativa con una selección
de factores ajustada a pasos hacia atrás, es decir, comenzando con
todas las variables y eliminando aquellas que presenten un p-valor
mayor a 0,05, ya que esto nos indicaría que no son significativas. De
esta manera, se obtiene un modelo ajustado con p-valor cercano a
cero que explica el 7,49% de la variabilidad del número de retweets,
con una raíz del error medio cuadrático (RMSE) de 1,56914E49 y un
error absoluto medio (MAE) de 1,12741E25, siendo este último el
valor promedio de los residuos. La ecuación del modelo ajustado es:
tw_retweet_count_pt_t1 = exp(40,6751 +
7,92098E-9*tw_user_num_tweets_pt_t0)
Donde:
tw_retweet_count_pt_t1 = Número de retweets de los usuarios
portugueses en Twitter en la toma 14 días después
tw_user_num_tweets_es_t0 = Número de tweets de los autores de los
tweets de los usuarios portugueses de Twitter en la toma inicial
Figura 18. Relación entre los valores observados y los predichos por
la ecuación de regresión de los retweets de los usuarios portugueses
de Twitter en la toma de 14 días después. Fuente propia a partir de
STATGRAPHICS 18
Se puede comprobar gráficamente en la figura anterior que la
ecuación de regresión comprende una variabilidad muy baja, ya que
no se observa la cercanía de muchos valores observados a la línea
de regresión.
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
5. Conclusiones y Discusión
Al realizar el análisis de regresión de la variable de retweets en sus
cuatro apartados, se ha podido obtener una ecuación de regresión
con una variabilidad muy alta en dos de los casos: los medios nativos
digitales en ambos idiomas. En los casos de los retweets provenientes
de los usuarios de Twitter en ambos idiomas no ha podido predecirse
con un gran acierto a partir de las variables estadísticas aportadas.
Es por ello que podemos afirmar que sí se cumple la hipótesis de que
se puede predecir la variable de retweets obtenidos 14 días después
a partir de las variables propuestas en este estudio en los casos de
los medios nativos digitales en ambos idiomas. En los conjuntos de
los usuarios de Twitter, la hipótesis es rechazada debido a haber
obtenido una variabilidad muy baja.
Este estudio no sólo plantea una respuesta a la hipótesis propuesta,
sino que también aporta información sobre el uso de los hashtags en
las cuentas de la población estudiada, así como cuáles han tenido una
mayor exposición en forma de mayor número de retweets.
Puesto que se ha obtenido un alto número de datos de diversas
variables, sería interesante tratar de predecir otras variables que
expliquen el uso de los hashtags de Twitter por parte de los medios
nativos digitales hispanos desde otras perspectivas. Futuros estudios
podrían englobar estas u otras nuevas variables, realizar más tomas
y confirmar la precisión de las ecuaciones con datos de test.
También sería interesante estudiar las características de los valores
anómalos de las variables, por ejemplo, separándolos en una muestra
diferente, y no sólo por su influencia negativa en la precisión de las
predicciones. En casos como el número de retweets, su presencia es
incluso beneficiosa, y podría resultar muy productivo identificar sus
características principales, de manera que se consiga detectarlos y
aumentar el uso de los hashtags que los motiven.
6. Referencias
Abdulaziz, N. (2020). How Social Media Changes Today’s Marketing
Strategies Nationalism Role on Local Brands Preference: Evidences
from Turkey Clothes Market View project How Social Media Changes
Today’s Marketing Strategies. International Journal of Innovative
Science and Research Technology, 5(9), pp. 725-736.
https://doi.org/10.38124/IJISRT20SEP218
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
Barón López, F. J., Téllez Montiel, F. (s.f.). Regresión múltiple.
Recuperado el 15 de febrero de 2021, de Apuntes de Bioestadística:
https://www.bioestadistica.uma.es/baron/apuntes/ficheros/cap06.pdf
Cabrera, M., Codina, Ll., Salaverría, R. (2019). Qué son y qué no son
los nuevos medios. 70 visiones de expertos hispanos. Revista Latina
de Comunicación Social, 74, pp. 1506-1520.
http://www.revistalatinacs.org/074paper/1396/79es.html
Cea, N., De Vicente, A. M. (2020). Cibermedios y redes sociales:
análisis de audiencias y métricas para los contenidos periodísticos. En
Universidad del País Vasco (Ed.), XI Congreso Internacional de
Ciberperiodismo, pp. 24–36.
https://www.researchgate.net/profile/Jose-
Lavin/publication/337244070_Journalism_addressable_TV_and_mea
surability_of_audiences_a_legislative_proposal/links/5e96eb14299bf
130799b16b8/Journalism-addressable-TV-and-measurability-of-
audiences-a-legislative-proposal.pdf
Fondevila-Gascón, J., Rom-Rodríguez, J., & Santana-López, E.
(2016). Comparativa internacional del uso de recursos digitales en el
periodismo digital deportivo: estudio de caso de España y Francia.
Revista Latina de Comunicación Social, 71, pp. 124-140.
https://doi.org/10.4185/RLCS-2016-1087
Franch, P., & Micó, J.-L. (2021). Políticos y periodistas: un bucle
endogámico en los medios sociales: dominios compartidos en Twitter
por diputados y periodistas españoles. Transinformação, 33.
https://doi.org/10.1590/2318-0889202133e200025
GET statuses/user_timeline. (s.f.). Recuperado el 10 de febrero de
2021, de Twitter Developers:
https://developer.twitter.com/en/docs/twitter-
api/v1/tweets/timelines/api-reference/get-statuses-user_timeline
González-Molina, S., & Ramos del Cano, F. (2014). Las redes sociales
en el ámbito periodístico: ¿cómo usan los medios europeos de
referencia sus perfiles en Twitter y Facebook? Comunicación y
Hombre, 10, pp. 37–52.
http://repositori.uji.es/xmlui/handle/10234/133285
Lawless, J. F. (1987). Negative binomial and mixed Poisson
regression. The Canadian Journal of Statistics, 15(3), pp. 209-225.
López García, X., Toural Bran, C., Rodríguez Vázquez, A. I., & Silva
Rodríguez, A. (2015). Cibermedios de proximidad en España y
Víctor Yeste-Moreno, Ángeles Calduch-Losa y Jorge Serrano-Cobos
Portugal en las redes sociales: vías para estrechar vínculos en
comunidades locales. Revista Latina de Comunicación Social, ISSN-
e 1138-5820, 70(7), pp. 833-858, pp. 833–858.
https://doi.org/10.4185/RLCS-2015-1074
Martínez Polo, J. (2017). Nuevos medios periodísticos y participación
del usuario. Universidad Católica de Murcia.
http://repositorio.ucam.edu/handle/10952/3371
Moreno Mesa, J. M. (2017). La innovación en los medios digitales
locales [Universidad de Sevilla].
https://idus.us.es/handle/11441/76269
Navarro, A., Utzet, F., Puig, P., Caminal, J., & Martín, M. (2001).
Negative binomial distribution versus Poisson in the analysis of
recurrent phenomena. Gaceta sanitaria / S.E.S.P.A.S, 15(5), pp. 447-
452.
Navas, A. (2018). Modelo de variables de desempeño e impacto en
Twitter. Un análisis comunicacional. Universidad de Navarra.
https://dadun.unav.edu/handle/10171/58477
Peña Fernández, S., Ángel, J., Dasilva, P., Santamarina, D. R., &
Galdospín, T. M. (2015). Las redes sociales como herramientas para
la redistribución de contenidos editoriales. El caso de los medios de
comunicación españoles. Universidad del País Vasco (Ed.), VII
Congreso Internacional de Ciberperiodismo y Web 2.0.
Rouwenhorst, J. H. J. (2018). A picture is worth a thousand words :
investigating the value of Instagram posts and Twitter posts in
predicting movie box office revenues. Univerity of Twente.
https://essay.utwente.nl/75083/
Search Tweets: standard v1.1. (s.f.). Recuperado el 10 de febrero de
2021, de Twitter Developers:
https://developer.twitter.com/en/docs/twitter-
api/v1/tweets/search/overview
Shahriari, M., Gunashekar, S., Domarus, M. von, & Klamma, R.
(2016). Predictive Analysis of Temporal and Overlapping Community
Structures in Social Media. Proceedings of the 25th International
Conference Companion on World Wide Web - WWW ’16 Companion,
pp. 855–860. <https://doi.org/10.1145/2872518.2889292>
Sridhar, B., & Khan, M. Z. (2014). RMSE comparison of Path Loss
Models for UHF/VHF bands in India. IEEE Region 10 Symposium, pp.
330-335.
Análisis predictivo colectivo del uso de hashtags en medios nativos digitales hispanos
Standard search API. (s.f.). Recuperado el 10 de febrero de 2021, de
Twitter Developers: https://developer.twitter.com/en/docs/twitter-
api/v1/tweets/search/api-reference/get-search-tweets