PresentationPDF Available

Análisis de Sentimientos en Twitter

Presentation

Análisis de Sentimientos en Twitter

Abstract

Las redes sociales han madurado al grado que los gobiernos están formulando políticas sobre cómo deben ser colectados, compartidos y usados estos datos. La minería de redes sociales es tema de interés para emprendedores, tecnólogos y hackers. Basta revisar el impacto de Twitter en temas políticos. Al trabajar en Analytics o Ciencia de Datos es evidente que los datos se generan todo el tiempo y cada vez con mayor rapidez. Los analistas están acostumbrados a trabajar con datos tabulares, generalmente numéricos; sin embargo, actualmente gran parte de los datos es no estructurado y con alto contenido de texto.
Análisis de Sentimientos en
Twitter
Dr. Robert Hernández Martínez
robert@actuariayfinanzas.net
Abril 2021
Análisis de sentimientos en “R”
i. Un paseo por el software “R”
ii. Paquetería para Ciencia de Datos
iii. Caso práctico: El estado de ánimo de
mi libro
iv. Codificación en “R”
v. Corpus del documento
vi. Palabras de opinión negativa y de
opinión positiva
vii. Sentiment score
viii. Gráfica de nube de palabras
Minería de datos en Twitter para
sentiment analysis
i. Creación de cuenta para desarrollador:
Application Programming Interface
(API)
ii. Paquetería para Twitter Mining
iii. Caso práctico: El estado de ánimo de
los tuiteros respecto a Bideny
Trump”
iv. Codificación en “R” para extraer
tweets de la red social
v. Corpus del documento
vi. Palabras de opinión negativa y de
opinión positiva
vii. Sentiment score
viii. Gráfica de nube de palabras
Agenda
Un paseo por el software “R”
Fuente: https://cran.r-project.org/
Paquetería para Ciencia de Datos
Fuente:
https://www.tidyverse.org/
Caso práctico:
El estado de
ánimo de mi
libro
Codificación en “R”
Paquetes requeridos
Leer el libro TXT
Concatenar el texto en un
solo vector
Crear corpus de palabras
Corpus del documento
Reemplazar caracteres alfanuméricos con espacios en
blanco
Cambiar letras mayúsculas a minúsculas
Remover palabras comunes que proveen poca
información
Remover múltiples espacios en blanco y dejar uno solo
Construir gráfico de nube de palabras
Corpus del documento
Scanear archivos de palabras de opinión
negativa y de opinión positiva
Separar la bolsa de palabras positivas y
negativas encontradas en el corpus
Contar el número de positivas y negativas
en el corpus creado
Palabras de opinión negativa y de opinión positiva
Fuente:
https://ptrckprry.com/course/ssd/data/
negative-words.txt
Fuente:
https://ptrckprry.com/course/ssd/data/
positive-words.txt
Sentiment score: Harry Potter
Obtener la diferencia del
número de palabras
positivas menos negativas =
SENTIMENT SCORE
¿Es Harry Potter un libro
triste?
Gráfica de
nube de
palabras
Caso
práctico: El
estado de
ánimo de mi
libro
Sentiment score: Beauty Pays
Obtener la diferencia del
número de palabras
positivas menos negativas =
SENTIMENT SCORE
¿Estereotipos?
Gráfica de
nube de
palabras
Minería de
datos en
Twitter para
sentiment
analysis
Creación de
cuenta para
desarrollador:
Application
Programming
Interface (API)
Paquetería para Twitter Mining
Paquetes requeridos
Application
Programming
Interface (API)
CLAVES DE ACCESO
Caso práctico: El
estado de ánimo
de los tuiteros
respecto a
“Biden”, “Trump”
u otro tópico de
interés
Codificación en “R” para extraer tweets de la red social
Recuperar un número de tweets
que contengan la palabra
“Biden”
Elegir entre tweets recientes,
populares o una mezcla de
ambos
Recuperar tweets en idioma
Inglés
Crear el listado de tweets en un vector
Crear un corpus de palabras
Remover emojis
Codificación en “R” para extraer tweets de la red social
Codificación en “R” para extraer tweets de la red social
Fuente:
https://developer.twitter.com/en/docs/t
witter-api/v1/rules-and-filtering/search-
operators
Sentiment score: Biden
Obtener la diferencia del
número de palabras
positivas menos negativas =
SENTIMENT SCORE
Gráfica de
nube de
palabras
¿Aún no prende Biden en
el ánimo de los
estadounidenses?
Sentiment score: Trump
Obtener la diferencia del
número de palabras
positivas menos negativas =
SENTIMENT SCORE
Gráfica de
nube de
palabras
¿Trump sigue fuerte en el
ánimo de los
estadounidenses?
Más herramientas
Fuente:
https://chirpty.com/user/actuariayfinanz
Más herramientas
Fuente:
https://www.wordclouds.com/
Más herramientas
Fuente:
https://www.ibm.com/demos/live/natural-language-
understanding/self-service/home
https://www.nytimes.com/interactive/2020/09/27/us/donald-
trump-taxes.html
Más herramientas
Silge (2017) Text Mining with R. A Tidy
Approach. O’Reilly Media, Inc., USA.
Más herramientas
Rusell (2019) Mining the Social Web.
Data Mining Facebook, Twitter, LinkedIn,
Instagram, GitHub and More. O’Reilly
Media, Inc., Canada.
Twitter Mining
Statistics &
Data
Analysis
Data
Engineering Data
Science
Contexto de
aplicación
práctica
Se requieren profesionales con
habilidades para analizar e
interpretar información y
transformar datos brutos en
conocimientos prácticos. Es
decir, Científicos de Datos.
¿Pero qué es Ciencia de Datos?
Data
Analytics
Ciencia de Datos
¿Por quées
importante la
investigación?
Por la importancia del
flujo de datos que rige al
mundo globalizado y su
impacto en actividades
que van desde la
operación de las Bolsas de
Valores, el internet de las
cosas, estudio del
comportamiento del
consumidor, hasta la
vigilancia de redes
sociales.
Las redes sociales han madurado al grado que los gobiernos están
formulando políticas sobre cómo deben ser colectados, compartidos
y usados estos datos.
La minería de redes sociales es tema de interés para emprendedores,
tecnólogos y hackers. Basta revisar el impacto de Twitter en temas
políticos.
Al trabajar en Analytics o Ciencia de Datos es evidente que los datos
se generan todo el tiempo y cada vez con mayor rapidez. Los analistas
están acostumbrados a trabajar con datos tabulares, generalmente
numéricos; sin embargo, actualmente gran parte de los datos es no
estructurado y con alto contenido de texto.
Conclusiones
“R” brinda excelentes recursos para ejecutar código para la
interpretación de lenguaje natural; por lo que es buen punto de
partida para aprender otros lenguajes como Python y Julia.
Trabajar texto como si fueran bases de datos o palabras individuales
permite manipular, resumir y visualizar las características del texto
integrando procesamiento de lenguaje natural.
Finalmente, realizar hallazgos y construir una narrativa adecuada para
comunicarlos son habilidades fundamentales en Ciencia de Datos. El
principal ingrediente es la curiosidad.
Conclusiones
Análisis de Sentimientos en Twitter
Dr. Robert Hernández Martínez
robert@actuariayfinanzas.net
https://www.youracclaim.com/users/robert-hernandez.89bffe7b Abril 2021
ResearchGate has not been able to resolve any citations for this publication.
ResearchGate has not been able to resolve any references for this publication.