Conference PaperPDF Available

Morfologías visuales de representación de datos como aumento de capacidades analíticas humanas: Una revisión de literatura

Authors:

Abstract

RESUMEN La representación visual de datos es una técnica de extracción de conocimiento que permite tener una percepción de toda la información disponible dentro de Big Data. Para lograr el objetivo de captación de la atención humana, es necesario representar el conjunto de datos de una manera intuitiva. De esta forma, el usuario pueda tomar decisiones adecuadas. Consecuentemente, el mejoramiento de la experiencia humano computador se basa en el uso de técnicas de análisis de datos, donde los recursos computacionales deben ser optimizados. En este trabajo, se desarrolla una metodología con una investigación de tipo descriptivo, exploratorio y documental con los diferentes enfoques de visualización de datos orientados al análisis exploratorio para el descubrimiento científico y aumento de las capacidades humanas como apoyo a las decisiones automáticas. Palabras Claves: Big data, minería de datos, morfología visual, visualización. Abstract Visual representation is an approach to extract knowledge, which enables users to perceive the information whitin a context of Big Data. To involve the human perception into the data analysis, an inuitive data representation is needed. Consequently, any user will be able to make more adequate decisions. Indeed, the enhancement of human-computer interaction is based on the use of data anaylisis techniques while computational broad is optimized. In this work, a descriptive, exploratory and documental methodology is presented aimed at highlighting the benefit of involving the human skills within the process of automatic decision making.
CAPÍTULO
CAPÍTULO
MORFOLOGÍAS VISUALES DE REPRESENTACIÓN DE DATOS COMO
AUMENTO DE CAPACIDADES ANALÍTICAS HUMANAS: UNA REVISIÓN
DE LITERATURA
Andrés Javier Anaya Isaza1,2, Ana Crisna Umaquinga Criollo3, Gabriela Narváez Olmedo3, Paúl David Rosero
Montalvo3, Diego Hernán Peluo Ordóñez4 *
1Universidad Surcolombiana – Colombia,
2Universidad Tecnológica de Pereira - Colombia,
3Universidad Técnica del Norte - Ecuador,
4Universidad Yachay Tech- Ecuador
* dpeluffo@yachaytech.edu.ec
RESUMEN
La representación visual de datos es una técnica de extracción de conocimiento que permite tener una percepción
de toda la información disponible dentro de Big Data. Para lograr el objetivo de captación de la atención humana,
es necesario representar el conjunto de datos de una manera intuitiva. De esta forma, el usuario pueda tomar
decisiones adecuadas. Consecuentemente, el mejoramiento de la experiencia humano computador se basa en el
uso de técnicas de análisis de datos, donde los recursos computacionales deben ser optimizados. En este trabajo,
se desarrolla una metodología con una investigación de tipo descriptivo, exploratorio y documental con los diferentes
enfoquesdevisualizacióndedatosorientadosalanálisisexploratorioparaeldescubrimientocientícoyaumentode
las capacidades humanas como apoyo a las decisiones automáticas.
Palabras Claves: Big data, minería de datos, morfología visual, visualización.
Abstract
Visual representation is an approach to extract knowledge, which enables users to perceive the information whitin a
context of Big Data. To involve the human perception into the data analysis, an inuitive data representation is needed.
Consequently, any user will be able to make more adequate decisions. Indeed, the enhancement of human-computer
interaction is based on the use of data anaylisis techniques while computational broad is optimized. In this work, a
descriptive,exploratoryanddocumentalmethodologyispresentedaimedathighlightingthebenetofinvolvingthe
human skills within the process of automatic decision making.
Keywords: Big data, data mining, visual morphology, visualization.
34
34
376
INTRODUCCIÓN
Las representaciones visuales de conjuntos de datos que generan los sistemas de visualización computarizados,
normalmente, estánorientados a lamejora de lausabilidad que permitedenir al ser humano, de una manera
adecuada,algunosparámetrosasociadosconlaeciencia,ecaciaysatisfacciónparaejecutartareas(Riquelme,
Ruiz,&Gilbert,2006),(Logreira,2011),(Haoetal.,2012)also called motifs, in data streams has been recognized
asanimportanttask.Tondthesemotifs,weuseanadvancedeventencodingandpatterndiscoveryalgorithm.As
a large time series can contain hundreds of motifs, there is a need to support interactive analysis and exploration.
In addition, for certain applications, such as data center resource management, service managers want to be able
to predict the next day’s power consumption from the previous months’ data. For this purpose, we introduce four
novelvisualanalyticsmethods:(i. En efecto las representaciones pueden realizarse con otras formas de interacción
humana, pero el campo de la visualización ha surgido para utilizar la visión humana en búsqueda del aumento de las
capacidades de percepción del entorno, dado que es el sentido más efectivo y con mayor ancho de banda.
Losejerciciosdevisualizaciónsonasertivoscuandosejusticalanecesidad,porpartedelserhumano,deaumentar
las capacidades sensoriales, en lugar de reemplazar al factor humano con modelos computacionales que ejercen
la toma de decisiones. El enorme espacio de búsqueda de posibles diseños de visualización es incluyente y por
tanto abarca las metodologías para la creación e interactividad de las representaciones visuales que mejoran la
experiencia de usuario frente al ecosistema lógico de los servicios del contexto.
Los problemas que enfrenta el análisis visual son diversos y pueden intersectar diversas áreas del conocimiento,
talescomo:Percepciónhumana,representacióndedatos,algoritmia,computaciónintensiva,einteligenciaarticial,
entreotras(Holzinger&Jurisica,2014).Portanto,plantearseuncaminoparadesarrollarinvestigaciónpuedeserun
temaescurridizoyrequieredeunpanoramatécnicoycientícoquepermitadeterminarunovariosenfoques.
A esto se suma el hecho de que los límites de la cognición y la memoria humana hacen necesario el aumento de las
capacidadesnaturalesdelaconguraciónhumana.Portanto,eldiseñadordeherramientasdevisualizacióndebe
considerar dentro de sus modelos las limitantes, no sólo técnicas sino también de los usuarios. Por ejemplo, debe
consideraraspectosrelacionadosconlaspantallas,elhardwareengeneralylapercepciónhumana(Crisanetal.,
2016).El uso dela visualización, seanaliza de acuerdocon la necesidaddel usuario, comúnmentellamado “el
porqué”,ademásdelosdatosaservisualizadosycómosediseñatodasaquellasestructurasdedatosomorfologías
visualesderepresentación,lasquesedenominan“Modismos”(Idioms).
Para realizar un diagnóstico del estado del arte e instituir un foco para proponer soluciones factibles a los problemas
delavisualización,enestetrabajoseproponerealizarunarevisiónactualdeliteraturacientícacorrespondientea
losenfoquesderepresentaciónvisualcomo:factorhumano,HCIHumanComputerInteraction,análisisexploratorio
paraeldescubrimientocientícoyaumentodelascapacidadeshumanascomoapoyoalasdecisionesautomáticas.
Esto permite validar hipótesis respecto a la explotación de las propiedades del espectro visible a nivel de percepción,
como una herramienta asertiva que faculta al campo visual, para caracterizar adecuadamente la transmisión de
información.
El resto de este documento está organizado así: En la Sección 2, se presenta la metodología empleada para
estructurar el documento en el sentido conceptual y de sistematización de las referencias bibliográcas. En la
Sección3,sepresentaunabrevediscusión.Yporúltimo,enlaSección4,sepresentaloscomentariosnales.
METODOLOGÍA
La presente investigación es de tipo descriptivo, exploratorio y documental, se realiza una revisión de literatura
especializada y el análisis enfocado a la representación visual de datos.
Acontinuación,sepresentalosprincipalesenfoquessereerelapresenteinvestigación:
377
Big Data
Las organizaciones de todo tipo enfrentan varios desafíos para el tratamiento y análisis de información y datos
masivos(estructurados,noestructuradosysemiestructurados),medianteusodeherramientasdedescubrimiento
de conocimiento en base de datos (DCBD o KDD )(Morales, Aguilar, & Marín, 2015), ésta diversidad de datos
generadaprincipalmenteporfuentescomo:personas,redessociales,transacciones,empresas,interconexiónentre
máquinas(M2M),biometría,señalesGPS,lecturasconRFID,datosemitidosporsensores,Internetdelascosas
(IoT)tiendeaincrementarse(Weietal.,2016)(Salazar-Castro,Rosas-Narváez,Pantoja,Alvarado-Pérez,&Peluffo-
Ordóñez,2015)(IBM,2012).Estoproduceunimpactotrascendentalenlasociedad,ciencia,tecnologíayeconomía
(IBM&Martins,2017)
IBMyGartherplanteanunmodeloparareferenciarlascaracterísticaspropiasdeBigDatade3V:Volumen, Veracidad
y Variedad,gracias al avancetecnológicoycrecimientodel volumende datosseañaden3V:Veracidad, Valor y
Visualización(Weietal.,2016).
Sinembargo, existen barrerasorganizacionales y tecnológicasa superar,entre lasquese encuentran(TDWI&
Halper,2016):
Tabla 1. Identicación de barreras organizacionales y tecnológica de Big Data
Barrerasidenticadas %
Falta de profesionales especializados en análisis de big data 40%
Propiedad de los datos y otras políticas 36%
Falta de gobierno o administración 29%
Costo 28%
Falta de profesionales capacitados en gestión de grandes volúmenes de datos 27%
Falta de patrocinio comercial 25%
Falta de soporte ejecutivo 24%
Conanza/Cultura 23%
Proyecto correcto 21%
No se puede acceder a los datos necesarios 15%
Otro 6%
Fuente (TDWI & Halper, 2016)
Big data: Pre-procesamiento y visualización
Eldescubrimientodeconocimientoenbasesdedatos(DCBDoKDD)permiterecuperarinformaciónoculta,posee
un proceso que a partir de éstos datos, combina el descubrimiento y análisis de información que conlleva a la
extraccióndepatronesenformadereglasofunciones,conelndegarantizaralusuariolarealizacióndelanálisis
respectivo,constade3etapas:Pre-procesamiento,Mineríadedatos(Datamining)yvisualizacióndeinformación
(Riquelme,Ruiz,&Gilbert,2006),(Logreira,2011),(Haoetal.,2012).
Estas formas de representación del conocimiento requieren de analistas con habilidades en la interpretación de
patronesyextraccióndeconocimiento(Wong,1999),éstaesunadelasrazonesporlasquesurgenlastécnicas
dereducción de dimensionalidad (RD)parareducirelproblemadedimensiónparadichosresultadosalpresenta
resultados visuales en objetos de 1D, 2D, 3D más legibles para los seres humanos.
Actualmente existen herramientas de visualización que permiten una mejor comprensión de información, algunas de
ellasseenfocanenlasetapasdepre-procesamientopost-procesamientoy/ovisualización,quenoseintegranen
todaslasetapasterminandoendatosabstractosoambigüedadenelanálisisvisual.(Wong,1999),(Kerren,Ebert,
&Meyer,20016).
378
Visualización de datos
Los sistemas de visualización de datos pretenden ayudar al ser humano en la ejecución de tareas efectivamente,
utilizando el sentido más efectivo y mayor ancho de banda(Lam, Tory, & Munzner, 2017) para aumentar las
capacidades de percepción del entorno.
Eldiseñadordevisualizacióndebeconsiderarparámetrosolimitantesanivelderecursoscomo:pantallas,hardware,
decomputadoras,ysereshumanos(Bendoly,2016),quedebenseranalizadosdependiendodelasnecesidadesdel
usuario,morfologías,modismos(Moten,Newton,&Jackson,2016).Lagura1.Presentaelanchodebandadel
campo visual humano
Figura.1.
a) Ejes son fundamentalmente diferentes del eje de profundidad.
(b)Alolargodelejedeprofundidadesposibleverunpuntoporcadarayo,frenteamillonesderayosparalosotros
dosejes(Munzner,2014)
Apoyo al Aumento de las Capacidades Humanas como Herramienta Analítica
La visualización permite al ser humano realizar sencillos análisis de cualquier expresión generalizada de
datos, especialmente cuando no se conoce con previamente y con exactitud que interrogantes se requiere
responder(Munzner,2014),conelincrementodedatosmasivosydediferentetipo,seprecisadelasinergiaefectiva
deáreascomolaestadística,probabilidadyaprendizajeautomático(Brehmer,Ng,Tate,&Munzner,2016),(Crisan,
Gardy,&Munzner,2016).
El 72% de problemas de análisis visual, se debe a un mal planteamiento o especicación o especicación del
mismo;porunaparte“laspersonasnosabencómoabordarelproblema”(Crisanetal.,2016),mientrasqueporotra,
no tienen una certeza para determinar cuál de estas preguntas candidatas son correctas a priori o de antemano
(Borkinetal.,2016).
Las herramientas visuales pueden ser transitorias, con el ánimo de maximizar procesos tempranos de transición
exploratorios, donde obtener una comprensión más clara de los requisitos de análisis juega un papel importante
antesdeldesarrolloformaldemodelosmatemáticos,computacionalesosolucionesautomáticas(Handler,Blodgett,
&O’Connor,2016)(Crisanetal.,2016).
379
Análisis Exploratorio para el Descubrimiento Cientíco: El caso más frecuente es el análisis exploratorio para el
descubrimientocientíco,cuyoobjetivoes”acelerarymejorarlacapacidaddeunusuarioparagenerarycomprobar
hipótesis”
La Visualización en Minería de Datos
Mineríadedatos(DataMining),Tambiénllamadaexplotacióndeinformación(Moine,Haedo,&Gordillo,2011),se
denecomoelprocesodedescubrimientodepatrones,tendenciasyrelacionessignicativasalexaminargrandes
volúmenesdedatosparadeterminarlainformaciónsumergida(informaciónoculta).
La visualización de datos se encuentra íntimamente relacionado con una correcta gestión de los datos y la información
(Holzinger&Jurisica,2014).
Reducción de dimensión
La RD tiene como objetivo extraer información de datos de alta dimensión a baja dimensión, lo que permite un
mejor rendimiento computacional del sistema de reconocimiento de patrones, una visualización de datos de manera
inteligible, entre otros
Visualización de datos desde la RD
La percepción humana va más allá de una presentación especial y geométrica. Existen otros factores importantes de
estosaspectosyotrosrelacionadosconelanálisisvisualdedatos,comolavisualización(visualizacióndeinformación
- InfoVis). Esta área se ocupa de todo lo relacionado con la comunicación entre un usuario y la computadora,
(Pimentel,Cataldi,&Muñiz,2013),lainterfazvisualeinteractivacuyoobjetivoprincipalesrepresentarconlamínima
entropíavisualunaseriededatosalusuarionalconlamínimapérdidadeinformación,intuitivo.
Ciertos estudios se han enfocado en el estudio de técnicas de visualización
DISCUSIÓN
Deacuerdoconlosenfoquesdelarepresentaciónvisualmencionados,searmaamododehipótesisnula,quela
codicaciónvisualapoyadirectamenteprocesosqueaumentanlascapacidadesanalíticashumanas,enbeneciode
establecer aquellas morfologías visuales que tengan un alto grado de correspondencia en métricas de efectividad y
expresividadencuantoaCanales(Color,Movimiento,Forma,RegiónEspacial.)yMarcas(PrimitivasGeométricas).
Valela penaresaltarque procesoscomo:Espacio deDiseño y Lenguajede Visualización, puedenser un poco
ambiguos.Estosedebealfactorcreativoysubjetivodeldiseñadordelmodismo.Talarmacióndemuestraqueno
hayunaúnicametodologíaparallegaracrearcodicacionesvisualesquerepresentenaltosíndicesdeexpresividad
y efectividad aplicada a datos con un solo modismo, el cual sigue siendo un problema abierto. Contrariamente a
estaarmación,sepuedecrearunamplioespaciodediseñoquedesarrolleunmejoríndicedeposibilidadespara
manipular, una o varias formas de un modismo, a través de la interactividad como una posible hipótesis alternativa
basadoenlasarmacionesde(Munzner).
Comoultimaconsideraciónynomenosimportante,elanálisisexploratorioparaeldescubrimientocientíco,permite
renar,depuraroampliarmodelosmatemáticosyalgoritmos,paratenerunentendimientodelfenómenodecómo
se afectan las salidas determinísticas de tales modelos a través de los eventos mediante el paso de parámetros.
380
CONCLUSIONES
Estetrabajoidenticalanecesidaddeunarevisiónprofundadelaliteraturaactual,enbeneciodelaportedelas
representaciones de morfologías visuales como apoyo al aumento de las capacidades analíticas humanas en la era
delosdatosmasivos.Talesaportesesbozantemáticasrelacionadasa:VisualizacióndeDatos,comoherramienta
deexplotacióndelcanalconelmayoranchodebandahumano“lavisión”,AnálisisExploratorio,comoherramienta
probatoriaenbúsquedadehipótesis,renamientoydepuraciónparadeterminarpatronesqueclaramenteaportana
componentes relacionados con labores de minería de datos y descubrimiento de conocimiento.
En materia de argumentos con altas complejidades de orden matemático como el campo de la reducción de la
dimensión,sepuedearmarquelarepresentacióndedatosmediantemodismos,ayudaalentendimientointuitivo
en topologías de datos de alta dimensionalidad y que los procesos de interactividad soportados en representaciones
decodicaciónvisualesayudanalentendimientodelfenómeno,paradeterminarlosprocesosintermediosasícomo
también las salidas dentro de los conceptos de representaciones de menor dimensión.
REFERENCIAS BIBLIOGRÁFICAS
Bendoly, E. (2016). Fit, Bias, and Enacted Sensemaking in Data Visualization: Frameworks for Continuous
DevelopmentinOperations and Supply Chain ManagementAnalytics.JournalofBusiness Logistics, 37(1), 6–17.
https://doi.org/10.1111/jbl.12113
Borkin, M. A., Bylinskii, Z., Kim, N. W., Bainbridge, C. M., Yeh, C. S., Borkin, D., … Oliva,A. (2016). Beyond
Memorability:Visualization Recognitionand Recall.IEEE Transactions on Visualizationand ComputerGraphics,
22(1),519–528.https://doi.org/10.1109/TVCG.2015.2467732
Brehmer,M.,Ng,J.,Tate,K.,&Munzner,T.(2016).Matches,Mismatches,andMethods:Multiple-ViewWorkowsfor
EnergyPortfolioAnalysis.IEEETransactionsonVisualizationandComputerGraphics,22(1),449–458.https://doi.
org/10.1109/TVCG.2015.2466971
Crisan,A.,Gardy,J.L.,&Munzner,T.(2016).OnRegulatoryandOrganizationalConstraintsinVisualizationDesign
and Evaluation. En Proceedings of the Sixth Workshop on Beyond Time and Errors on Novel Evaluation Methods for
Visualization(pp.1–9).NewYork,NY,USA:ACM.https://doi.org/10.1145/2993901.2993911
Handler,A., Blodgett, S. L., & O’Connor, B. (2016). Visualizing textual models with in-text and word-as-pixel
highlighting.arXiv:1606.06352[cs,stat].Recuperadoapartirdehttp://arxiv.org/abs/1606.06352
Hao,M.,Marwah,M.,Janetzko,H.,Dayal,U.,Keim,D.,Patnaik,D.,…Sharma,R.(2012).Visualexplorationoffrequent
patternsinmultivariatetimeseries.InformationVisualization,11(1),71–83.https://doi.org/10.1177/1473871611430769
Holzinger,A.,& Jurisica, I.(2014). Knowledge Discoveryand Data MininginBiomedical Informatics:TheFuture
IsinIntegrative,InteractiveMachineLearning Solutions. EnInteractive KnowledgeDiscovery andData Miningin
BiomedicalInformatics (pp. 1–18). Springer,Berlin, Heidelberg.Recuperado apartir dehttps://link.springer.com/
chapter/10.1007/978-3-662-43968-5_1
IBM.(2012,junio18).¿QuéesBigData?Recuperadoel19denoviembrede2017,apartirdehttp://www.ibm.com/
developerworks/ssa/local/im/que-es-big-data/index.html
IBM,&Martins,A.(2017,agosto23).Cómoseconstruyeunaempresacognitiva.Recuperadoel24deoctubrede
2017,apartirdehttps://www.ibm.com/blogs/transformacion/2017/08/23/se-construye-una-empresa-cognitiva/
Kerren,A., Ebert,A., &Meyer,J. (20016).Human-Centered Visualization Environments- GI-Dagstuhl |Andreas
Kerren|Springer.Recuperadoapartirde//www.springer.com/gp/book/9783540719489
381
Lam,H.,Tory,M.,&Munzner,T.(2017).Bridging FromGoalstoTaskswithDesignStudyAnalysisReports.IEEE
TransactionsonVisualizationandComputerGraphics.https://doi.org/10.1109/TVCG.2017.2744319
Logreira,C.(2011).MineríadedatosysuincidenciaenlatomadedecisionesempresarialesenelcontextodeCRM.
Ingenieríasolidaria,7(13),68–71.
Moine,J.M.,Haedo,A.S.,&Gordillo,S.E.(2011).Estudiocomparativodemetodologíasparamineríadedatos.
PresentadoenXIIIWorkshopdeInvestigadoresenCienciasdelaComputación.Recuperadoapartirdehttp://hdl.
handle.net/10915/20034
Morales, M. D. O., Aguilar, L. J., & Marín, L. M. G. (2015). Los desafíos del marketing en la era del big data.
e-CienciasdelaInformación,6(1),1–31.
Moten,C.I.,Newton,H.,&Jackson,L.(2016).TRACInnovativeVisualizationTechniques(No.TRAC-M-TR-17-003).
ARMY TRADOC ANALYSIS CENTER MONTEREY CA MONTEREY United States, ARMY TRADOC ANALYSIS
CENTER MONTEREY CA MONTEREY United States. Recuperado a partir de http://www.dtic.mil/docs/citations/
AD1025683
Munzner,T.(2014).VisualizationAnalysisandDesign.CRCPress.
Pimentel,D.,Cataldi,M.,&Muñiz,G. (2013). Dela Visualización a laSensorización de Información.En Blucher
DesignProceedings(Vol.1,pp.129–133). Recuperado apartirdehttp://www.proceedings.blucher.com.br/article-
details/de-la-visualizacin-a-la-sensorizacin-de-informacin-14109
Riquelme,J. C., Ruiz,R.,& Gilbert, K.(2006).Minería deDatos:Conceptos y Tendencias. InteligenciaArticial.
RevistaIberoamericanadeInteligenciaArticial,10(29),11–18.
Salazar-Castro,J.A.,Rosas-Narváez,Y.C.,Pantoja,A.D.,Alvarado-Pérez,J.C.,&Peluffo-Ordóñez,D.H.(2015).
Interactiveinterfaceforefcientdatavisualizationviaageometricapproach.En201520thSymposiumonSignal
Processing,ImagesandComputerVision(STSIVA)(pp.1–6).https://doi.org/10.1109/STSIVA.2015.7330397
TDWI, & Halper, F. (2016, diciembre). Best Practices Report | Data Science and Big Data: Enterprise Paths to
Success | Transforming Data with Intelligence. Recuperado a partir de https://tdwi.org/research/2016/12/best-
practices-report-data-science-and-big-data.aspx
Wei, Y., Liu, S., Sun, J., Cui, L., Pan, L., & Wu, L. (2016). Big Datasets for Research: A Survey on Flagship
Conferences. En 2016 IEEE International Congress on Big Data (BigData Congress) (pp. 394–401). https://doi.
org/10.1109/BigDataCongress.2016.62
Wong, P. C. (1999). Visual data mining. IEEE Computer Graphics and Applications, 19(5), 20–21. https://doi.
org/10.1109/MCG.1999.788794
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
Visualization researchers and practitioners engaged in generating or evaluating designs are faced with the difficult problem of transforming the questions asked and actions taken by target users from domain-specific language and context into more abstract forms. Existing abstract task classifications aim to provide support for this endeavour by providing a carefully delineated suite of actions. Our experience is that this bottom-up approach is part of the challenge: low-level actions are difficult to interpret without a higher-level context of analysis goals and the analysis process. To bridge this gap, we propose a framework based on analysis reports derived from open-coding 20 design study papers published at IEEE InfoVis 2009-2015, to build on the previous work of abstractions that collectively encompass a broad variety of domains. The framework is organized in two axes illustrated by nine analysis goals. It helps situate the analysis goals by placing each goal under axes of specificity (Explore, Describe, Explain, Confirm) and number of data populations (Single, Multiple). The single-population types are Discover Observation, Describe Observation, Identify Main Cause, and Collect Evidence. The multiple-population types are Compare Entities, Explain Differences, and Evaluate Hypothesis. Each analysis goal is scoped by an input and an output and is characterized by analysis steps reported in the design study papers. We provide examples of how we and others have used the framework in a top-down approach to abstracting domain problems: visualization designers or researchers first identify the analysis goals of each unit of analysis in an analysis stream, and then encode the individual steps using existing task classifications with the context of the goal, the level of specificity, and the number of populations involved in the analysis.
Conference Paper
Full-text available
Dimensionality reduction (DR) methods represent a suitable alternative to visualizing data. Nonetheless, most of them still lack the properties of interactivity and controllability. In this work, we propose a data visualization interface that allows for user interaction within an interactive framework. Specifically, our interface is based on a mathematic geometric model, which combines DR methods through a weighted sum. Interactivity is provided in the sense that weighting factors are given by the user via the selection of points inside a geometric surface. Then, (even non-expert) users can intuitively either select a concrete DR method or carry out a mixture of methods. Experimental results are obtained using artificial and real datasets, demonstrating the usability and applicability of our interface in DR-based data visualization.
Chapter
Full-text available
Biomedical research is drowning in data, yet starving for knowledge. Current challenges in biomedical research and clinical practice include information overload – the need to combine vast amounts of structured, semi-structured, weakly structured data and vast amounts of unstructured information – and the need to optimize workflows, processes and guidelines, to increase capacity while reducing costs and improving efficiencies. In this paper we provide a very short overview on interactive and integrative solutions for knowledge discovery and data mining. In particular, we emphasize the benefits of including the end user into the “interactive” knowledge discovery process. We describe some of the most important challenges, including the need to develop and apply novel methods, algorithms and tools for the integration, fusion, pre-processing, mapping, analysis and interpretation of complex biomedical data with the aim to identify testable hypotheses, and build realistic models. The HCI-KDD approach, which is a synergistic combination of methodologies and approaches of two areas, Human–Computer Interaction (HCI) and Knowledge Discovery & Data Mining (KDD), offer ideal conditions towards solving these challenges: with the goal of supporting human intelligence with machine intelligence. There is an urgent need for integrative and interactive machine learning solutions, because no medical doctor or biomedical researcher can keep pace today with the increasingly large and complex data sets – often called “Big Data”.
Article
Problem-based visualization research provides explicit guidance toward identifying and designing for the needs of users, but absent is more concrete guidance toward factors external to a user's needs that also have implications for visualization design and evaluation. This lack of more explicit guidance can leave visualization researchers and practitioners vulnerable to unforeseen constraints beyond the user's needs that can affect the validity of evaluations, or even lead to the premature termination of a project. Here we explore two types of external constraints in depth, regulatory and organizational constraints, and describe how these constraints impact visualization design and evaluation. By borrowing from techniques in software development, project management, and visualization research we recommend strategies for identifying, mitigating, and evaluating these external constraints through a design study methodology. Finally, we present an application of those recommendations in a healthcare case study. We argue that by explicitly incorporating external constraints into visualization design and evaluation, researchers and practitioners can improve the utility and validity of their visualization solution and improve the likelihood of successful collaborations with industries where external constraints are more present.
Conference Paper
Computer-based visualization (vis) systems provide visual representations of datasets designed to help people carry out tasks more effectively. Visualization is suitable when there is a need to augment human capabilities rather than replace people with computational decision-making methods. The design space of possible vis idioms is huge, and includes the considerations of both how to create and how to interact with visual representations. Vis design is full of trade-offs, and most possibilities in the design space are ineffective for a particular task, so validating the effectiveness of a design is both necessary and difficult. Vis designers must take into account three very different kinds of resource limitations: those of computers, of humans, and of displays. Vis usage can be analyzed in terms of why the user needs it, what data is shown, and how the idiom is designed. I will discuss this framework for analyzing the design of visualization systems.
Article
In this paper we move beyond memorability and investigate how visualizations are recognized and recalled. For this study we labeled a dataset of 393 visualizations and analyzed the eye movements of 33 participants as well as thousands of participantgenerated text descriptions of the visualizations. This allowed us to determine what components of a visualization attract people's attention, and what information is encoded into memory. Our findings quantitatively support many conventional qualitative design guidelines, including that (1) titles and supporting text should convey the message of a visualization, (2) if used appropriately, pictograms do not interfere with understanding and can improve recognition, and (3) redundancy helps effectively communicate the message. Importantly, we show that visualizations memorable "at-a-glance" are also capable of effectively conveying the message of the visualization. Thus, a memorable visualization is often also an effective one.
Article
The energy performance of large building portfolios is challenging to analyze and monitor, as current analysis tools are not scalable or they present derived and aggregated data at too coarse of a level. We conducted a visualization design study, beginning with a thorough work domain analysis and a characterization of data and task abstractions. We describe generalizable visual encoding design choices for time-oriented data framed in terms of matches and mismatches, as well as considerations for workflow design. Our designs address several research questions pertaining to scalability, view coordination, and the inappropriateness of line charts for derived and aggregated data due to a combination of data semantics and domain convention. We also present guidelines relating to familiarity and trust, as well as methodological considerations for visualization design studies. Our designs were adopted by our collaborators and incorporated into the design of an energy analysis software application that will be deployed to tens of thousands of energy workers in their client base.
Article
Data visualization has a critical role in the advancement of modern data analytics. Visualization lends assurances to data validity and completeness, as well as to the effectiveness of cleaning and aggregation tactics. It provides the means by which to explore and discover relationships otherwise hidden from default assumptions in statistical modeling. Strong visualization is also fundamental to end-result conveyance and audience interpretation. But how can one ensure that strength? How can one avoid developing representations that are marginal in value, or worse misleading? In this paper, I will discuss theory, evidence and practical approaches to managing data visualization development, viewing data visualization not simply as an outcome but as a continuous process and facet of organizational culture.