Content uploaded by Víctor Yeste
Author content
All content in this area was uploaded by Víctor Yeste on Jun 15, 2022
Content may be subject to copyright.
Análisis predictivo colectivo del uso de hashtags
en medios nativos digitales hispanos
YESTE-MORENO, VÍCTOR
UNIVERSITAT POLITÈCNICA DE VALÈNCIA, VALÈNCIA, ESPAÑA
vicyesmo@inf.upv.es
CALDUCH-LOSA, ÁNGELES
UNIVERSITAT POLITÈCNICA DE VALÈNCIA, VALÈNCIA, ESPAÑA
mcalduch@eio.upv.es
SERRANO-COBOS, JORGE
UNIVERSITAT POLITÈCNICA DE VALÈNCIA, VALÈNCIA, ESPAÑA
jorserc2@har.upv.es
INTRODUCCIÓN
•“Medio nativo digital” o “cibermedio”: “Ecosistema mediático alternativo al
tradicional, que innova, utiliza nuevos formatos narrativos y tiene una nueva
relación con la audiencia.”
Cabrera, Codina y Salaverría (2019)
•Explosión de los cibermedios.
•Fuerte inclusión de “vías de participación de los ciudadanos en el producto”.
López García et. al. (2015), Martínez (2017)
•Condición geográficamente localista.
•Especialización temática.
•Uso de redes sociales => comparar patrones y predecir su comportamiento.
Moreno (2017), Fondevila-Gascón, Rom-Rodríguez y Santana-López (2016)
INTRODUCCIÓN
Análisis:
•Engagement en redes sociales, pero con un ámbito reducido de medios.
•Twitter pero con variables distintas.
•Difusión de noticias sin segmentar.
•Medios de comunicación en general.
Cea y De Vicente (2017), Navas (2018), Peña et al. (2015), González-Molina y Ramos del Cano (2014)
•Descripción o predicción de comportamientos hacia un evento o temática
concretos: política, películas o comunidades sociales.
Franch y Micó (2021), Rouwenhorst(2018), Shahriari et al. (2016)
DISEÑO Y MÉTODO
• Explicativa, cuantitativa y no experimental.
Tipo de investigación
• Conteo de retweets de cada hashtag.
Variable principal
• Predecir el nº de retweets 14 días después.
Hipótesis
• 96 cuentas = 48 portuguesas + 48 españolas.Muestra
DISEÑO Y MÉTODO
Dimensiones
•Tipo de emisor:
medios nativos digitales o
Twitter en general
•Idioma:
portugués o español
Variables (conteo)
•Tweets
•Retweets
•Favoritos
•Seguidores de los autores
•Tweets de los autores
•Edad en días de las cuentas de los
autores
•Ratio de inclusión de URL en los tweets
TRABAJO DE CAMPO Y ANÁLISIS DE DATOS
A) Obtención de los datos
•Inicial: 13-22 de enero, 2021.
•Final: 27 de enero y 5 de febrero, 2021.
B) Análisis estadístico (STATGRAPHICS 18)
1. Análisis multivariado.
2. Filtro de alta correlación.
3. Datos normales + correlación muy fuerte
(cercana a |1|) => regresión lineal simple.
4. Si no, si sobre dispersión (chi-cuadrado >
1) => Regresión binomial negativa.
5. Si no, regresión de Poisson.
C) Cálculo del error
•Raíz del error medio cuadrático
𝑅𝑀𝑆𝐸 =∑(𝑋!− 𝑋")#/𝑁
•Error medio absoluto
𝑀𝐴𝐸 =∑(𝑋!− 𝑋")/𝑁
𝑋!: Valor obtenido 14 días después
𝑋": Valor predicho
𝑁: Nº datos medidos
RESULTADOS 12.037.095 tweets
procesados
163.721 tweets
medios nativos digitales hispanos
85.970 tweets
en portugués
77.751 tweets
en español
11.873.374 tweets
búsqueda en Twitter
1.558.283 tweets
en portugués
10.315.091 tweets
en español
RESULTADOS
•El 98,84% de los tweets
incluyen una URL:
•98,85% (portugueses)
•98,81% (españoles)
•Promedio de edad de
cuentas: 3.287,53 días:
•2.690,55 (portugueses)
•3.943,37 (españoles)
Medios nativos digitales
•Hashtags + utilizado y
+ retwitteado a la vez:
•Portugueses:
#covid19,
#coronavirus,
#mundoaominuto y
#política
•Españoles: #granada
Twitter en general
•Hashtags + utilizado y
+ retwitteado a la vez:
•Portugueses:
#flamengo y
#covid19
•Españoles: ninguno
RESULTADOS: ANÁLISIS DE REGRESIÓN (X4)
Retweets de los medios nativos digitales
españoles
•Promedio = 10,71
•Sesgo estandarizado = 1.266,64 y
Curtosis estandarizada = 22.567,7 =>
Datos no normales
•Prueba chi-cuadrado con p-valor:
1,72131E8 => Regresión binomial
negativa
RESULTADOS: ANÁLISIS DE REGRESIÓN (X4)
Regresión binomial negativa
•Variabilidad = 60,84%
•RMSE = 66.052.857,62
•MAE = 265.150
Ecuación
m_retweet_count_es_t1 = exp(1,9353 +
0,00128398*m_num_tweets_es_t0 +
0,00182371*m_retweet_count_es_t0 +
0,00014033*m_favorite_count_es_t0 +
1,51891E-8*m_user_num_followers_es_t0 +
0,0000930838*tw_num_tweets_es_t0)
CONCLUSIONES Y DISCUSIÓN
Se cumple la hipótesis (variabilidad
alta) para:
•Retweets de los medios nativos
digitales en ambos idiomas.
Se rechaza la hipótesis (variabilidad baja)
para:
•Retweets de Twitter en general en ambos
idiomas.
CONCLUSIONES Y DISCUSIÓN
Futuras líneas de investigación:
•Predicción de otras variables.
•Más tomas de datos.
•Confirmación de las ecuaciones con datos de test.
•Estudiar los valores anómalos: suben mucho los errores pero su presencia es
incluso beneficiosa.
YESTE-MORENO, VÍCTOR
vicyesmo@inf.upv.es
CALDUCH-LOSA, ÁNGELES
mcalduch@eio.upv.es
SERRANO-COBOS, JORGE
jorserc2@har.upv.es