Content uploaded by Ana Cristina Umaquinga
Author content
All content in this area was uploaded by Ana Cristina Umaquinga on Jan 15, 2018
Content may be subject to copyright.
CAPÍTULO
CAPÍTULO
MORFOLOGÍAS VISUALES DE REPRESENTACIÓN DE DATOS COMO
AUMENTO DE CAPACIDADES ANALÍTICAS HUMANAS: UNA REVISIÓN
DE LITERATURA
Andrés Javier Anaya Isaza1,2, Ana Crisna Umaquinga Criollo3, Gabriela Narváez Olmedo3, Paúl David Rosero
Montalvo3, Diego Hernán Peluo Ordóñez4 *
1Universidad Surcolombiana – Colombia,
2Universidad Tecnológica de Pereira - Colombia,
3Universidad Técnica del Norte - Ecuador,
4Universidad Yachay Tech- Ecuador
* dpeluffo@yachaytech.edu.ec
RESUMEN
La representación visual de datos es una técnica de extracción de conocimiento que permite tener una percepción
de toda la información disponible dentro de Big Data. Para lograr el objetivo de captación de la atención humana,
es necesario representar el conjunto de datos de una manera intuitiva. De esta forma, el usuario pueda tomar
decisiones adecuadas. Consecuentemente, el mejoramiento de la experiencia humano computador se basa en el
uso de técnicas de análisis de datos, donde los recursos computacionales deben ser optimizados. En este trabajo,
se desarrolla una metodología con una investigación de tipo descriptivo, exploratorio y documental con los diferentes
enfoquesdevisualizacióndedatosorientadosalanálisisexploratorioparaeldescubrimientocientícoyaumentode
las capacidades humanas como apoyo a las decisiones automáticas.
Palabras Claves: Big data, minería de datos, morfología visual, visualización.
Abstract
Visual representation is an approach to extract knowledge, which enables users to perceive the information whitin a
context of Big Data. To involve the human perception into the data analysis, an inuitive data representation is needed.
Consequently, any user will be able to make more adequate decisions. Indeed, the enhancement of human-computer
interaction is based on the use of data anaylisis techniques while computational broad is optimized. In this work, a
descriptive,exploratoryanddocumentalmethodologyispresentedaimedathighlightingthebenetofinvolvingthe
human skills within the process of automatic decision making.
Keywords: Big data, data mining, visual morphology, visualization.
34
34
376
INTRODUCCIÓN
Las representaciones visuales de conjuntos de datos que generan los sistemas de visualización computarizados,
normalmente, estánorientados a lamejora de lausabilidad que permitedenir al ser humano, de una manera
adecuada,algunosparámetrosasociadosconlaeciencia,ecaciaysatisfacciónparaejecutartareas(Riquelme,
Ruiz,&Gilbert,2006),(Logreira,2011),(Haoetal.,2012)also called motifs, in data streams has been recognized
asanimportanttask.Tondthesemotifs,weuseanadvancedeventencodingandpatterndiscoveryalgorithm.As
a large time series can contain hundreds of motifs, there is a need to support interactive analysis and exploration.
In addition, for certain applications, such as data center resource management, service managers want to be able
to predict the next day’s power consumption from the previous months’ data. For this purpose, we introduce four
novelvisualanalyticsmethods:(i. En efecto las representaciones pueden realizarse con otras formas de interacción
humana, pero el campo de la visualización ha surgido para utilizar la visión humana en búsqueda del aumento de las
capacidades de percepción del entorno, dado que es el sentido más efectivo y con mayor ancho de banda.
Losejerciciosdevisualizaciónsonasertivoscuandosejusticalanecesidad,porpartedelserhumano,deaumentar
las capacidades sensoriales, en lugar de reemplazar al factor humano con modelos computacionales que ejercen
la toma de decisiones. El enorme espacio de búsqueda de posibles diseños de visualización es incluyente y por
tanto abarca las metodologías para la creación e interactividad de las representaciones visuales que mejoran la
experiencia de usuario frente al ecosistema lógico de los servicios del contexto.
Los problemas que enfrenta el análisis visual son diversos y pueden intersectar diversas áreas del conocimiento,
talescomo:Percepciónhumana,representacióndedatos,algoritmia,computaciónintensiva,einteligenciaarticial,
entreotras(Holzinger&Jurisica,2014).Portanto,plantearseuncaminoparadesarrollarinvestigaciónpuedeserun
temaescurridizoyrequieredeunpanoramatécnicoycientícoquepermitadeterminarunovariosenfoques.
A esto se suma el hecho de que los límites de la cognición y la memoria humana hacen necesario el aumento de las
capacidadesnaturalesdelaconguraciónhumana.Portanto,eldiseñadordeherramientasdevisualizacióndebe
considerar dentro de sus modelos las limitantes, no sólo técnicas sino también de los usuarios. Por ejemplo, debe
consideraraspectosrelacionadosconlaspantallas,elhardwareengeneralylapercepciónhumana(Crisanetal.,
2016).El uso dela visualización, seanaliza de acuerdocon la necesidaddel usuario, comúnmentellamado “el
porqué”,ademásdelosdatosaservisualizadosycómosediseñatodasaquellasestructurasdedatosomorfologías
visualesderepresentación,lasquesedenominan“Modismos”(Idioms).
Para realizar un diagnóstico del estado del arte e instituir un foco para proponer soluciones factibles a los problemas
delavisualización,enestetrabajoseproponerealizarunarevisiónactualdeliteraturacientícacorrespondientea
losenfoquesderepresentaciónvisualcomo:factorhumano,HCIHumanComputerInteraction,análisisexploratorio
paraeldescubrimientocientícoyaumentodelascapacidadeshumanascomoapoyoalasdecisionesautomáticas.
Esto permite validar hipótesis respecto a la explotación de las propiedades del espectro visible a nivel de percepción,
como una herramienta asertiva que faculta al campo visual, para caracterizar adecuadamente la transmisión de
información.
El resto de este documento está organizado así: En la Sección 2, se presenta la metodología empleada para
estructurar el documento en el sentido conceptual y de sistematización de las referencias bibliográcas. En la
Sección3,sepresentaunabrevediscusión.Yporúltimo,enlaSección4,sepresentaloscomentariosnales.
METODOLOGÍA
La presente investigación es de tipo descriptivo, exploratorio y documental, se realiza una revisión de literatura
especializada y el análisis enfocado a la representación visual de datos.
Acontinuación,sepresentalosprincipalesenfoquessereerelapresenteinvestigación:
377
Big Data
Las organizaciones de todo tipo enfrentan varios desafíos para el tratamiento y análisis de información y datos
masivos(estructurados,noestructuradosysemiestructurados),medianteusodeherramientasdedescubrimiento
de conocimiento en base de datos (DCBD o KDD )(Morales, Aguilar, & Marín, 2015), ésta diversidad de datos
generadaprincipalmenteporfuentescomo:personas,redessociales,transacciones,empresas,interconexiónentre
máquinas(M2M),biometría,señalesGPS,lecturasconRFID,datosemitidosporsensores,Internetdelascosas
(IoT)tiendeaincrementarse(Weietal.,2016)(Salazar-Castro,Rosas-Narváez,Pantoja,Alvarado-Pérez,&Peluffo-
Ordóñez,2015)(IBM,2012).Estoproduceunimpactotrascendentalenlasociedad,ciencia,tecnologíayeconomía
(IBM&Martins,2017)
IBMyGartherplanteanunmodeloparareferenciarlascaracterísticaspropiasdeBigDatade3V:Volumen, Veracidad
y Variedad,gracias al avancetecnológicoycrecimientodel volumende datosseañaden3V:Veracidad, Valor y
Visualización(Weietal.,2016).
Sinembargo, existen barrerasorganizacionales y tecnológicasa superar,entre lasquese encuentran(TDWI&
Halper,2016):
Tabla 1. Identicación de barreras organizacionales y tecnológica de Big Data
Barrerasidenticadas %
• Falta de profesionales especializados en análisis de big data 40%
• Propiedad de los datos y otras políticas 36%
• Falta de gobierno o administración 29%
• Costo 28%
• Falta de profesionales capacitados en gestión de grandes volúmenes de datos 27%
• Falta de patrocinio comercial 25%
• Falta de soporte ejecutivo 24%
• Conanza/Cultura 23%
• Proyecto correcto 21%
• No se puede acceder a los datos necesarios 15%
• Otro 6%
Fuente (TDWI & Halper, 2016)
Big data: Pre-procesamiento y visualización
Eldescubrimientodeconocimientoenbasesdedatos(DCBDoKDD)permiterecuperarinformaciónoculta,posee
un proceso que a partir de éstos datos, combina el descubrimiento y análisis de información que conlleva a la
extraccióndepatronesenformadereglasofunciones,conelndegarantizaralusuariolarealizacióndelanálisis
respectivo,constade3etapas:Pre-procesamiento,Mineríadedatos(Datamining)yvisualizacióndeinformación
(Riquelme,Ruiz,&Gilbert,2006),(Logreira,2011),(Haoetal.,2012).
Estas formas de representación del conocimiento requieren de analistas con habilidades en la interpretación de
patronesyextraccióndeconocimiento(Wong,1999),éstaesunadelasrazonesporlasquesurgenlastécnicas
dereducción de dimensionalidad (RD)parareducirelproblemadedimensiónparadichosresultadosalpresenta
resultados visuales en objetos de 1D, 2D, 3D más legibles para los seres humanos.
Actualmente existen herramientas de visualización que permiten una mejor comprensión de información, algunas de
ellasseenfocanenlasetapasdepre-procesamientopost-procesamientoy/ovisualización,quenoseintegranen
todaslasetapasterminandoendatosabstractosoambigüedadenelanálisisvisual.(Wong,1999),(Kerren,Ebert,
&Meyer,20016).
378
Visualización de datos
Los sistemas de visualización de datos pretenden ayudar al ser humano en la ejecución de tareas efectivamente,
utilizando el sentido más efectivo y mayor ancho de banda(Lam, Tory, & Munzner, 2017) para aumentar las
capacidades de percepción del entorno.
Eldiseñadordevisualizacióndebeconsiderarparámetrosolimitantesanivelderecursoscomo:pantallas,hardware,
decomputadoras,ysereshumanos(Bendoly,2016),quedebenseranalizadosdependiendodelasnecesidadesdel
usuario,morfologías,modismos(Moten,Newton,&Jackson,2016).Lagura1.Presentaelanchodebandadel
campo visual humano
Figura.1.
a) Ejes son fundamentalmente diferentes del eje de profundidad.
(b)Alolargodelejedeprofundidadesposibleverunpuntoporcadarayo,frenteamillonesderayosparalosotros
dosejes(Munzner,2014)
Apoyo al Aumento de las Capacidades Humanas como Herramienta Analítica
La visualización permite al ser humano realizar sencillos análisis de cualquier expresión generalizada de
datos, especialmente cuando no se conoce con previamente y con exactitud que interrogantes se requiere
responder(Munzner,2014),conelincrementodedatosmasivosydediferentetipo,seprecisadelasinergiaefectiva
deáreascomolaestadística,probabilidadyaprendizajeautomático(Brehmer,Ng,Tate,&Munzner,2016),(Crisan,
Gardy,&Munzner,2016).
El 72% de problemas de análisis visual, se debe a un mal planteamiento o especicación o especicación del
mismo;porunaparte“laspersonasnosabencómoabordarelproblema”(Crisanetal.,2016),mientrasqueporotra,
no tienen una certeza para determinar cuál de estas preguntas candidatas son correctas a priori o de antemano
(Borkinetal.,2016).
Las herramientas visuales pueden ser transitorias, con el ánimo de maximizar procesos tempranos de transición
exploratorios, donde obtener una comprensión más clara de los requisitos de análisis juega un papel importante
antesdeldesarrolloformaldemodelosmatemáticos,computacionalesosolucionesautomáticas(Handler,Blodgett,
&O’Connor,2016)(Crisanetal.,2016).
379
Análisis Exploratorio para el Descubrimiento Cientíco: El caso más frecuente es el análisis exploratorio para el
descubrimientocientíco,cuyoobjetivoes”acelerarymejorarlacapacidaddeunusuarioparagenerarycomprobar
hipótesis”
La Visualización en Minería de Datos
Mineríadedatos(DataMining),Tambiénllamadaexplotacióndeinformación(Moine,Haedo,&Gordillo,2011),se
denecomoelprocesodedescubrimientodepatrones,tendenciasyrelacionessignicativasalexaminargrandes
volúmenesdedatosparadeterminarlainformaciónsumergida(informaciónoculta).
La visualización de datos se encuentra íntimamente relacionado con una correcta gestión de los datos y la información
(Holzinger&Jurisica,2014).
Reducción de dimensión
La RD tiene como objetivo extraer información de datos de alta dimensión a baja dimensión, lo que permite un
mejor rendimiento computacional del sistema de reconocimiento de patrones, una visualización de datos de manera
inteligible, entre otros
Visualización de datos desde la RD
La percepción humana va más allá de una presentación especial y geométrica. Existen otros factores importantes de
estosaspectosyotrosrelacionadosconelanálisisvisualdedatos,comolavisualización(visualizacióndeinformación
- InfoVis). Esta área se ocupa de todo lo relacionado con la comunicación entre un usuario y la computadora,
(Pimentel,Cataldi,&Muñiz,2013),lainterfazvisualeinteractivacuyoobjetivoprincipalesrepresentarconlamínima
entropíavisualunaseriededatosalusuarionalconlamínimapérdidadeinformación,intuitivo.
Ciertos estudios se han enfocado en el estudio de técnicas de visualización
DISCUSIÓN
Deacuerdoconlosenfoquesdelarepresentaciónvisualmencionados,searmaamododehipótesisnula,quela
codicaciónvisualapoyadirectamenteprocesosqueaumentanlascapacidadesanalíticashumanas,enbeneciode
establecer aquellas morfologías visuales que tengan un alto grado de correspondencia en métricas de efectividad y
expresividadencuantoaCanales(Color,Movimiento,Forma,RegiónEspacial.)yMarcas(PrimitivasGeométricas).
Valela penaresaltarque procesoscomo:Espacio deDiseño y Lenguajede Visualización, puedenser un poco
ambiguos.Estosedebealfactorcreativoysubjetivodeldiseñadordelmodismo.Talarmacióndemuestraqueno
hayunaúnicametodologíaparallegaracrearcodicacionesvisualesquerepresentenaltosíndicesdeexpresividad
y efectividad aplicada a datos con un solo modismo, el cual sigue siendo un problema abierto. Contrariamente a
estaarmación,sepuedecrearunamplioespaciodediseñoquedesarrolleunmejoríndicedeposibilidadespara
manipular, una o varias formas de un modismo, a través de la interactividad como una posible hipótesis alternativa
basadoenlasarmacionesde(Munzner).
Comoultimaconsideraciónynomenosimportante,elanálisisexploratorioparaeldescubrimientocientíco,permite
renar,depuraroampliarmodelosmatemáticosyalgoritmos,paratenerunentendimientodelfenómenodecómo
se afectan las salidas determinísticas de tales modelos a través de los eventos mediante el paso de parámetros.
380
CONCLUSIONES
Estetrabajoidenticalanecesidaddeunarevisiónprofundadelaliteraturaactual,enbeneciodelaportedelas
representaciones de morfologías visuales como apoyo al aumento de las capacidades analíticas humanas en la era
delosdatosmasivos.Talesaportesesbozantemáticasrelacionadasa:VisualizacióndeDatos,comoherramienta
deexplotacióndelcanalconelmayoranchodebandahumano“lavisión”,AnálisisExploratorio,comoherramienta
probatoriaenbúsquedadehipótesis,renamientoydepuraciónparadeterminarpatronesqueclaramenteaportana
componentes relacionados con labores de minería de datos y descubrimiento de conocimiento.
En materia de argumentos con altas complejidades de orden matemático como el campo de la reducción de la
dimensión,sepuedearmarquelarepresentacióndedatosmediantemodismos,ayudaalentendimientointuitivo
en topologías de datos de alta dimensionalidad y que los procesos de interactividad soportados en representaciones
decodicaciónvisualesayudanalentendimientodelfenómeno,paradeterminarlosprocesosintermediosasícomo
también las salidas dentro de los conceptos de representaciones de menor dimensión.
REFERENCIAS BIBLIOGRÁFICAS
Bendoly, E. (2016). Fit, Bias, and Enacted Sensemaking in Data Visualization: Frameworks for Continuous
DevelopmentinOperations and Supply Chain ManagementAnalytics.JournalofBusiness Logistics, 37(1), 6–17.
https://doi.org/10.1111/jbl.12113
Borkin, M. A., Bylinskii, Z., Kim, N. W., Bainbridge, C. M., Yeh, C. S., Borkin, D., … Oliva,A. (2016). Beyond
Memorability:Visualization Recognitionand Recall.IEEE Transactions on Visualizationand ComputerGraphics,
22(1),519–528.https://doi.org/10.1109/TVCG.2015.2467732
Brehmer,M.,Ng,J.,Tate,K.,&Munzner,T.(2016).Matches,Mismatches,andMethods:Multiple-ViewWorkowsfor
EnergyPortfolioAnalysis.IEEETransactionsonVisualizationandComputerGraphics,22(1),449–458.https://doi.
org/10.1109/TVCG.2015.2466971
Crisan,A.,Gardy,J.L.,&Munzner,T.(2016).OnRegulatoryandOrganizationalConstraintsinVisualizationDesign
and Evaluation. En Proceedings of the Sixth Workshop on Beyond Time and Errors on Novel Evaluation Methods for
Visualization(pp.1–9).NewYork,NY,USA:ACM.https://doi.org/10.1145/2993901.2993911
Handler,A., Blodgett, S. L., & O’Connor, B. (2016). Visualizing textual models with in-text and word-as-pixel
highlighting.arXiv:1606.06352[cs,stat].Recuperadoapartirdehttp://arxiv.org/abs/1606.06352
Hao,M.,Marwah,M.,Janetzko,H.,Dayal,U.,Keim,D.,Patnaik,D.,…Sharma,R.(2012).Visualexplorationoffrequent
patternsinmultivariatetimeseries.InformationVisualization,11(1),71–83.https://doi.org/10.1177/1473871611430769
Holzinger,A.,& Jurisica, I.(2014). Knowledge Discoveryand Data MininginBiomedical Informatics:TheFuture
IsinIntegrative,InteractiveMachineLearning Solutions. EnInteractive KnowledgeDiscovery andData Miningin
BiomedicalInformatics (pp. 1–18). Springer,Berlin, Heidelberg.Recuperado apartir dehttps://link.springer.com/
chapter/10.1007/978-3-662-43968-5_1
IBM.(2012,junio18).¿QuéesBigData?Recuperadoel19denoviembrede2017,apartirdehttp://www.ibm.com/
developerworks/ssa/local/im/que-es-big-data/index.html
IBM,&Martins,A.(2017,agosto23).Cómoseconstruyeunaempresacognitiva.Recuperadoel24deoctubrede
2017,apartirdehttps://www.ibm.com/blogs/transformacion/2017/08/23/se-construye-una-empresa-cognitiva/
Kerren,A., Ebert,A., &Meyer,J. (20016).Human-Centered Visualization Environments- GI-Dagstuhl |Andreas
Kerren|Springer.Recuperadoapartirde//www.springer.com/gp/book/9783540719489
381
Lam,H.,Tory,M.,&Munzner,T.(2017).Bridging FromGoalstoTaskswithDesignStudyAnalysisReports.IEEE
TransactionsonVisualizationandComputerGraphics.https://doi.org/10.1109/TVCG.2017.2744319
Logreira,C.(2011).MineríadedatosysuincidenciaenlatomadedecisionesempresarialesenelcontextodeCRM.
Ingenieríasolidaria,7(13),68–71.
Moine,J.M.,Haedo,A.S.,&Gordillo,S.E.(2011).Estudiocomparativodemetodologíasparamineríadedatos.
PresentadoenXIIIWorkshopdeInvestigadoresenCienciasdelaComputación.Recuperadoapartirdehttp://hdl.
handle.net/10915/20034
Morales, M. D. O., Aguilar, L. J., & Marín, L. M. G. (2015). Los desafíos del marketing en la era del big data.
e-CienciasdelaInformación,6(1),1–31.
Moten,C.I.,Newton,H.,&Jackson,L.(2016).TRACInnovativeVisualizationTechniques(No.TRAC-M-TR-17-003).
ARMY TRADOC ANALYSIS CENTER MONTEREY CA MONTEREY United States, ARMY TRADOC ANALYSIS
CENTER MONTEREY CA MONTEREY United States. Recuperado a partir de http://www.dtic.mil/docs/citations/
AD1025683
Munzner,T.(2014).VisualizationAnalysisandDesign.CRCPress.
Pimentel,D.,Cataldi,M.,&Muñiz,G. (2013). Dela Visualización a laSensorización de Información.En Blucher
DesignProceedings(Vol.1,pp.129–133). Recuperado apartirdehttp://www.proceedings.blucher.com.br/article-
details/de-la-visualizacin-a-la-sensorizacin-de-informacin-14109
Riquelme,J. C., Ruiz,R.,& Gilbert, K.(2006).Minería deDatos:Conceptos y Tendencias. InteligenciaArticial.
RevistaIberoamericanadeInteligenciaArticial,10(29),11–18.
Salazar-Castro,J.A.,Rosas-Narváez,Y.C.,Pantoja,A.D.,Alvarado-Pérez,J.C.,&Peluffo-Ordóñez,D.H.(2015).
Interactiveinterfaceforefcientdatavisualizationviaageometricapproach.En201520thSymposiumonSignal
Processing,ImagesandComputerVision(STSIVA)(pp.1–6).https://doi.org/10.1109/STSIVA.2015.7330397
TDWI, & Halper, F. (2016, diciembre). Best Practices Report | Data Science and Big Data: Enterprise Paths to
Success | Transforming Data with Intelligence. Recuperado a partir de https://tdwi.org/research/2016/12/best-
practices-report-data-science-and-big-data.aspx
Wei, Y., Liu, S., Sun, J., Cui, L., Pan, L., & Wu, L. (2016). Big Datasets for Research: A Survey on Flagship
Conferences. En 2016 IEEE International Congress on Big Data (BigData Congress) (pp. 394–401). https://doi.
org/10.1109/BigDataCongress.2016.62
Wong, P. C. (1999). Visual data mining. IEEE Computer Graphics and Applications, 19(5), 20–21. https://doi.
org/10.1109/MCG.1999.788794