ArticlePDF Available

Abstract and Figures

El coeficiente de correlación de Pearson es una medida considerablemente utilizada en diversas áreas del quehacer científico, desde estudios técnicos, econométricos o de ingeniería; hasta investigaciones relacionadas con las ciencias sociales, del comportamiento o de la salud. Es precisamente esta extensa y profusa divulgación una de las razones que explicaría el uso indebido que se le da a esta herramienta estadística, especialmente en aquellos escenarios en los que debe ser interpretada correctamente o en los que se tienen que comprobar las suposiciones matemáticas que la sustentan. Un ejemplo de esto se halla cuando se asume que la correlación implica causalidad, confusión en la que se incurre con frecuencia y en la que se ven involucrados, tanto investigadores noveles, como algunos más experimentados. Pero tal vez el foco de mayores errores se encuentre al momento de comprobar premisas como la de la normalidad, siendo que esta se verifica únicamente a nivel univariado y se omite su revisión bivariada, quizás por desconocimiento o porque exige la utilización de técnicas más complejas. Situación similar se observa cuando se intentan detectar datos atípicos. En este caso, lo común es que se empleen diagramas de caja y bigotes para identificar valores extremos en cada variable, cuando lo apropiado sería abordar esta tarea con procedimientos que cuantifiquen la distancia que separa a dicha observación del centro de gravedad de los datos, pero de manera simultánea y tomando en cuenta todos los componentes del espacio vectorial en que se encuentra. En tal sentido, se propone la presente revisión como aporte para esclarecer estas dudas y como guía metodológica para orientar en la verificación de tales supuestos, abordando el aspecto matemático de manera general, pero enfatizando en las alternativas de que dispone el investigador para acometer debidamente este tipo de análisis. Palabras Clave: coeficiente, correlación, Pearson, supuestos, normalidad bivariada, datos atípicos multivariados.
Content may be subject to copyright.
AVFT Archivos Venezolanos de Farmacología y Terapéutica
Volumen 37, número 5, 2018
587
www.revistaavft.com
Sobre el uso adecuado del coeciente
de correlación de Pearson: denición,
propiedades y suposiciones
Juan Diego Hernández Lalinde, Mg.1*; https://orcid.org/0000-0001-6768-1873, Jhon Franklin Espinosa Castro, Mg.1; https://orcid.org/0000-0003-2186-3000, Mariana
Elena Peñaloza Tarazona, Dr.1; https://orcid.org/0000-0002-3863-0580, Johel E Rodriguez, Mg.2; https://orcid.org/0000-0002-8353-2736, José Gerardo Chacón Rangel,
Dr.2; https://orcid.org/0000-0003-3615-578, Cristian Andrés Toloza Sierra, Ing.3; https://orcid.org/0000-0002-9908-0076, Marlly Karina Arenas Torrado, Mg.4; https://orcid.
org/0000-0001-9084-2460, Sandra Milena Carrillo Sierra, Mg.5; https://orcid.org/0000-0001-9848-2367, Valmore José Bermúdez Pirela, Dr.6; https://orcid.org/0000-0003-
1880-8887
1Universidad Simón Bolívar, Departamento de Ciencias Sociales y Humanas, Cúcuta, Colombia.
2Universidad Simón Bolívar, Facultad de Ingenierías, Cúcuta, Colombia.
3Universidad Simón Bolívar, Departamento de Sistemas, Cúcuta, Colombia.
4Universidad Simón Bolívar, Facultad de Administración y Negocios, Cúcuta, Colombia.
5Universidad Simón Bolívar, Facultad de Ciencias Jurídicas y Sociales, Cúcuta, Colombia.
6Universidad Simón Bolívar, Facultad de Ciencias de la Salud, Cúcuta, Colombia.
*Autor de correspondencia: Juan Diego Hernández Lalinde. Universidad Simón Bolívar, Departamento de Ciencias Sociales y Humanas. Calle 14 entre avenidas 4 y 5,
Barrio La Playa. C. P.: 540006. Cúcuta, Colombia. Correo electrónico: hernandezjuandiego@gmail.com
On the proper use of the Pearson correlation coefcient: denitions, properties and assumptions
Resumen
El coeciente de correlación de Pearson es una medida
considerablemente utilizada en diversas áreas del quehacer
cientíco, desde estudios técnicos, econométricos o de inge-
niería; hasta investigaciones relacionadas con las ciencias
sociales, del comportamiento o de la salud. Es precisamente
esta extensa y profusa divulgación una de las razones que
explicaría el uso indebido que se le da a esta herramienta
estadística, especialmente en aquellos escenarios en los
que debe ser interpretada correctamente o en los que se
tienen que comprobar las suposiciones matemáticas que la
sustentan. Un ejemplo de esto se halla cuando se asume
que la correlación implica causalidad, confusión en la que se
incurre con frecuencia y en la que se ven involucrados, tan-
to investigadores noveles, como algunos más experimenta-
dos. Pero tal vez el foco de mayores errores se encuentre al
momento de comprobar premisas como la de la normalidad,
siendo que esta se verica únicamente a nivel univariado y
se omite su revisión bivariada, quizás por desconocimiento
o porque exige la utilización de técnicas más complejas. Si-
tuación similar se observa cuando se intentan detectar datos
atípicos. En este caso, lo común es que se empleen diagra-
mas de caja y bigotes para identicar valores extremos en
cada variable, cuando lo apropiado sería abordar esta tarea
con procedimientos que cuantiquen la distancia que sepa-
ra a dicha observación del centro de gravedad de los da-
tos, pero de manera simultánea y tomando en cuenta todos
los componentes del espacio vectorial en que se encuentra.
En tal sentido, se propone la presente revisión como aporte
para esclarecer estas dudas y como guía metodológica para
orientar en la vericación de tales supuestos, abordando el
aspecto matemático de manera general, pero enfatizando en
las alternativas de que dispone el investigador para acometer
debidamente este tipo de análisis.
Palabras Clave: coeciente, correlación, Pearson, supues-
tos, normalidad bivariada, datos atípicos multivariados.
Abstract
The Pearson correlation coefcient is a measure widely used
in several areas of scientic work, from technical, economet-
ric or engineering studies; to social, behavioral or health sci-
ences researches. It’s precisely this extensive and profuse
disclosure one of the reasons that would explain the misuse
of this statistical tool, especially in those cases in which it
must be correctly interpreted, or in those situations in which
the mathematical assumptions that support it have to be
checked. An example of this arise when it’s assumed that cor-
relation implies causation, confusion that occurs frequently
and involves both, novice and experienced researches. But
perhaps the mayor focus of errors is found when checking
assumptions such as normality, since it’s veried only at uni-
variate level omitting its bivariate verication, possibly due
to lack of knowledge or because it requires more complex
techniques. Similar situation is observed when trying to de-
tect outliers. In this case, it’s common to use box and whisker
plots to identify extreme values in each variable, when the
appropriate would be to approach this task using procedures
that calculate the distances that separates this observation
of the center of the data, taking into account all its vector
space components. In this regard, this review is proposed as
a contribution to clarify these doubts and as a methodologi-
cal guide to help in the verication of such assumptions, ad-
dressing the mathematical aspect in a general manner, but
emphasizing the alternatives available to undertake this type
of analysis.
Keywords: coefcient, correlation, Pearson, assumptions,
bivariate normality, multivariate outliers.
588
Introducción
Los términos relación o asociación son equivalentes y se
usan para designar aquella área de la estadística en la que
se evalúa la covariación entre al menos dos variables. Dentro
de este grupo, la correlación lineal es un caso particular en
el que tal correspondencia tiene características bien deni-
das y que suele medirse mediante el coeciente R de Pear-
son. Originalmente desarrollado por Karl Pearson en 1895
—quien se basó en las investigaciones de Sir Francis Gal-
ton publicadas diez años antes1,2— es ampliamente utilizado
en diversos campos del quehacer humano. En la ingeniería;
por ejemplo, se ha empleado recientemente para evaluar el
efecto de la deformación del viento en modelos de validación
aerodinámica3 o para estimar la rapidez con que este uido
pasa a través de turbinas generadoras de energía4. También
ha tenido una aplicación importante en la industria petrolera,
desde las fases de exploración, perforación y completación,
hasta aspectos relacionados con la proyección de nuevos
yacimientos en suelos marinos5.
Otra área del saber que se ha valido enormemente de esta
herramienta estadística es la de la psicología. Es común que
este coeciente se use al momento de denir las propieda-
des psicométricas de escalas, inventarios o pruebas, tal y
como reeja la validación del cuestionario de estigmatización
percibida de pacientes que han sufrido quemaduras en Bra-
sil6. Pero su alcance va más allá: investigaciones en las que
se explora la dirección de la relación entre el agotamiento
laboral y el estrés postraumático secundario7 o en las que se
indaga sobre la asociación entre la cantidad de estaciona-
mientos públicos y el bienestar ciudadano8, reejan la varie-
dad de usos de este coeciente.
La ciencia de datos, una disciplina relativamente nueva, ha
basado gran parte de sus técnicas en la correlación de Pear-
son, sobre todo cuando estas son puestas a disposición de
campos como la medicina. Tal cosa se aprecia en artículos
en los que se proponen marcos computacionales para es-
timar el riesgo de obesidad9, métodos de segmentación no
lineales para separar hematomas subdurales10 o aislamiento
de secciones epidurales mediante tomografía computariza-
da11. También la economía y nanzas se han servido de esta
herramienta. Ejemplos de esto se hallan en publicaciones en
las que se establecen las principales causas de la volatilidad
de los negocios brasileños12, así como en investigaciones
destinadas a medir el impacto y la interacción entre la inver-
sión extranjera y el mercado bursátil de la India13.
La medicina, por supuesto, no escapa a esta realidad; de
hecho, es tal vez una de las ramas que más se ha bene-
ciado de los análisis de correlación y regresión. Casos nota-
bles se encuentran al explorar tratamientos de intervención
en pacientes que han experimentado un ataque cerebral, en
los que se ha tanteado —hasta ahora sin mucho éxito— la
asociación entre la proteína C reactiva y la disminución de la
fatiga14. Un estudio interesante publicado por Tarabichi y De-
tours15 discrepa sobre los hallazgos de Tomasetti y Vogels-
tein16, quienes proponen que el riesgo de padecer distintos
tipos de cáncer está altamente correlacionado con el número
de divisiones de las células madre y que, por ende, mucha de
su aparición se debe simplemente a mala suerte. Los prime-
ros sostienen que el esquema de clasicación empleado por
Tomasetti y Vogelstein falla al basarse principalmente en la
incidencia de cáncer reportada en poblaciones norteamerica-
nas. Otros tratados se han dedicado a establecer la corres-
pondencia entre diferentes condiciones, como las vinculadas
a enfermedades renale17, a los perles de masa grasa en
el tejido adiposo18 y a la función visual cuando se presenta
macularidad precoz19.
Lo interesante es que, a pesar de que el uso del coeciente
de correlación de Pearson es extensísimo, también lo son
las incorrecciones y omisiones al momento de emplearlo, las
imprecisiones cuando de vericar sus supuestos se trata, o
incluso, la confusión y desinformación a la hora de interpretar
los resultados20. Es habitual encontrar en la literatura acadé-
mica y cientíca ausencia de claridad al esbozar las nocio-
nes de regresión y correlación, por ejemplo; siendo que se
hace más énfasis en las semejanzas que en las puntuales
e importantes diferencias21. Este desconcierto aun alcanza
connotaciones semánticas: el vocablo correlación suele apli-
carse a cualquier tipo de asociación entre variables, cuando;
en realidad, este se reere solo a un caso particular de di-
cha relación22. Tal vez el mayor problema surge cuando se
asume erróneamente que la correlación implica causalidad.
Cuando dos variables X y Y exhiben una fuerte correlación,
varias situaciones podrían explicarla: (a), que X origine Y;
(b), que Y origine X; (c), que una variable externa Z origine
tanto a X como a Y; o (d), que la relación observada se deba
meramente al azar22-24. Este hecho, si bien ha sido discutido
ampliamente, sigue reportándose en un número no despre-
ciable de textos, artículos, seminarios o ponencias22,23.
Esta revisión constituye un aporte para dar solución a esta
problemática. La intención es la de ofrecer una fuente de
consulta bibliográca que promueva el uso apropiado de esta
herramienta y sirva como guía a investigadores, profesores o
estudiantes vinculados a la medicina y áreas anes.
Covarianza y Correlación
Cada vez que se analicen al menos dos variables de forma
simultánea, surgirá una pregunta natural encaminada a co-
nocer el grado de coherencia que estas exhiben. En tales
situaciones, el interés del investigador recaerá en determinar
si los valores de una característica cambian consistentemen-
te conforme a los de la otra, o si; por el contrario, no hay nin-
gún patrón que las asocie. Estadísticamente este fenómeno
se cuantica a través de la covarianza20. En líneas generales,
la covarianza entre dos variables aleatorias X y Y se dene
mediante25-27:
(1)
donde E es el operador de la esperanza matemática,
y son las medias poblaciones de X y Y, respectiva-
mente; y las expresiones y
son equivalentes. Nótese que si se reemplaza Y por X en la
ecuación (1) se obtiene:
AVFT Archivos Venezolanos de Farmacología y Terapéutica
Volumen 37, número 5, 2018
589
www.revistaavft.com
de divisiones de las células madre y que, por ende, mucha de
su aparición se debe simplemente a mala suerte. Los prime-
ros sostienen que el esquema de clasicación empleado por
Tomasetti y Vogelstein falla al basarse principalmente en la
incidencia de cáncer reportada en poblaciones norteamerica-
nas. Otros tratados se han dedicado a establecer la corres-
pondencia entre diferentes condiciones, como las vinculadas
a enfermedades renale17, a los perles de masa grasa en
el tejido adiposo18 y a la función visual cuando se presenta
macularidad precoz19.
Lo interesante es que, a pesar de que el uso del coeciente
de correlación de Pearson es extensísimo, también lo son
las incorrecciones y omisiones al momento de emplearlo, las
imprecisiones cuando de vericar sus supuestos se trata, o
incluso, la confusión y desinformación a la hora de interpretar
los resultados20. Es habitual encontrar en la literatura acadé-
mica y cientíca ausencia de claridad al esbozar las nocio-
nes de regresión y correlación, por ejemplo; siendo que se
hace más énfasis en las semejanzas que en las puntuales
e importantes diferencias21. Este desconcierto aun alcanza
connotaciones semánticas: el vocablo correlación suele apli-
carse a cualquier tipo de asociación entre variables, cuando;
en realidad, este se reere solo a un caso particular de di-
cha relación22. Tal vez el mayor problema surge cuando se
asume erróneamente que la correlación implica causalidad.
Cuando dos variables X y Y exhiben una fuerte correlación,
varias situaciones podrían explicarla: (a), que X origine Y;
(b), que Y origine X; (c), que una variable externa Z origine
tanto a X como a Y; o (d), que la relación observada se deba
meramente al azar22-24. Este hecho, si bien ha sido discutido
ampliamente, sigue reportándose en un número no despre-
ciable de textos, artículos, seminarios o ponencias22,23.
Esta revisión constituye un aporte para dar solución a esta
problemática. La intención es la de ofrecer una fuente de
consulta bibliográca que promueva el uso apropiado de esta
herramienta y sirva como guía a investigadores, profesores o
estudiantes vinculados a la medicina y áreas anes.
Covarianza y Correlación
Cada vez que se analicen al menos dos variables de forma
simultánea, surgirá una pregunta natural encaminada a co-
nocer el grado de coherencia que estas exhiben. En tales
situaciones, el interés del investigador recaerá en determinar
si los valores de una característica cambian consistentemen-
te conforme a los de la otra, o si; por el contrario, no hay nin-
gún patrón que las asocie. Estadísticamente este fenómeno
se cuantica a través de la covarianza20. En líneas generales,
la covarianza entre dos variables aleatorias X y Y se dene
mediante25-27:
(1)
donde E es el operador de la esperanza matemática,
y son las medias poblaciones de X y Y, respectiva-
mente; y las expresiones y
son equivalentes. Nótese que si se reemplaza Y por X en la
ecuación (1) se obtiene:
(2)
De esto se deduce que la covarianza de una variable con ella
misma es, simplemente, la varianza. De manera particular, la
fórmula (1) se transforma en las siguientes ecuaciones de-
pendiendo de si X y Y son continuas o discretas; a saber28:
(3)
(4)
donde el término es la función de probabilidad con-
junta. Lo anterior es importante puesto que revela lo siguien-
te: si en el producto los valores de X y
Y tienden a ser mayores o menores que los de las medias
poblaciones, la covarianza tendrá signo positivo; por el con-
trario, si los valores de X tienden a ser mayores o menores
que los de su media, mientras que los valores de Y varían de
forma inversa, la covarianza tendrá signo negativo29,30. A su
vez, la magnitud del resultado dependerá de cuán grandes
sean las diferencias en .
Otro aspecto a resaltar tiene que ver con las medidas de las
variables. En vista de que X y Y pueden estar expresadas en
distintas unidades, el resultado de la covarianza bien podría
ser no interpretable, desventaja que condujo a desarrollar el
coeciente de correlación, el cual no es más que la estan-
darización de este término31. Defínase a como la
correlación entre dos variables aleatorias X y Y, tal que25:
(5)
donde y son las desviaciones estándares de X y
Y, respectivamente. Como puede apreciarse en la ecuación
(5), las unidades del numerador se cancelarán con las del
denominador, lo que conduce a que sea adimensio-
nal y ofrezca ventajas importantes al momento de su com-
prensión y manejo.
Coeciente De Correlación Muestral De Pearson
Pearson presentó por primera vez en 1895 esta importante
medida en términos matemáticos como31:
(6)
En la expresión (6), las barras indican las medias muestrales
de X y Y, en tanto que , y corres-
ponden a las sumas de cuadrados corregidas para X, Y y el
producto cruzado XY. Tal y como comentan Rodgers y Ni-
cewander1, existen otras formas de calcular el coeciente de
correlación, aunque la ecuación (6) es la más común. Obsér-
vese que en el numerador las puntuaciones de las variables
se centran al restarlas del promedio, para luego acumular
tales valores en el producto cruzado. Por otra parte, el de-
nominador sirve para ajustar la escala de las características
involucradas y que estas se anulen.
Para ahondar sobre lo que se planteó anteriormente acerca
del sentido de la correlación, supóngase ahora que se cons-
truye un plano cartesiano cuyo origen es . Considére-
se también que se dispone de un conjunto de n pares orde-
nados de la forma y que se
examina el comportamiento de estos en torno al centro del
diagrama. Los cuadrantes en los que se localizaría la nube
de puntos y el signo del coeciente se muestran en el cuadro
1, en tanto que en la gura 1 se presentan algunos ejemplos.
Nótese que en la medida en que los valores de y sean
mayores o menores que los de y , la correlación será po-
sitiva y el gráco se asemejará a una recta que se desplaza
de forma creciente desde el cuadrante III al I (casos 1 y 2, -
gura 1a). Por el contrario, cuando los valores de sean ma-
yores que los de y los de sean menores que los de ; o
viceversa, la correlación será negativa y el diagrama evocará
una línea decreciente que se mueve desde el cuadrante II al
IV (casos 2 y 3, gura 1b). Por último, si las desviaciones de
X y Y con relación a sus medias tienden a compensarse, la
correlación será débil o nula, podrá asumir cualquier signo y
los puntos se extenderán en todos los cuadrantes (caso 5,
guras 1c y 1d).
Además de señalar la dirección de la asociación lineal en-
tre las variables, el coeciente de correlación de Pearson es
un indicador de la fuerza con que estas se vinculan20,32. Se
ha establecido con suciencia en la teoría estadística, que
factores como el tamaño muestral, la falta de linealidad o la
variabilidad en las características de interés pueden alterar
considerablemente la magnitud de esta medida. Goodwin y
Leech hacen una revisión cuidadosa de este tema y explican
cuáles son los seis aspectos que mayor impacto tienen en el
coeciente; a saber33: (a), la variabilidad en los datos corres-
pondientes a cada variable aleatoria; (b), las diferencias en
las formas de las distribuciones marginales de X y Y; (c), la
falta de linealidad en la relación entre X y Y; (d), la presencia
importante de datos atípicos a nivel bivariado; (e), el tamaño
de la muestra; y (f), los posibles errores de medición. Aunque
este asunto escape al alcance de la presente revisión, sí se
puntualiza acá que el valor de R, r o —cualquiera sea su
notación— será un número real que oscile desde -1 hasta
1. Así pues, la fuerza de la relación entre X y Y será mayor,
conforme este valor tienda a los extremos antes citados34.
En la próxima sección se establecerá esto con mayor nivel
de detalle.
Cuadro 1. Interpretación geométrica del coeciente de corre-
lación de Pearson. Cuando la covariación de X y Y es directa,
la correlación es positiva y los puntos ocupan los cuadrantes
I y III. Cuando la covariación es inversa, la correlación es ne-
gativa y los puntos ocupan los cuadrantes II y IV. Cuando las
desviaciones se compensan entre sí, la correlación es débil
o nula y los puntos ocupan todos los cuadrantes.
590
Caso Covariación
de X y Y
Valor de la suma del
producto cruzado
Signo
corr. Cuadrantes
Caso 1 + I y III
Caso 2 + I y III
Caso 3 II y IV
Caso 4 II y IV
Caso 5 Desv.
compensadas Cualquiera Cualquiera Todos
Figura 1. (a), coeciente de correlación positivo y de mag-
nitud elevada, nube de puntos con pendiente positiva ocu-
pando los cuadrantes I y III; (b), coeciente de correlación
negativo y de magnitud elevada, nube de puntos con pen-
diente negativa ocupando los cuadrantes II y IV; (c) y (d), co-
ecientes de correlación con magnitud débil o nula, nube de
puntos esparcida en todos los cuadrantes. El eje cartesiano
se ha construido a partir de en cada caso.
Propiedades Del Coeciente De R De Pearson
Son muchas las propiedades que podrían citarse acerca de
este coeciente; sin embargo, y para efectos de practicidad,
se considerarán únicamente las más relevantes.
1. Adimensionalidad: tal y como se estableció en la ecua-
ción (6), al dividir la suma de cuadrados del producto XY en-
tre las raíces individuales de las sumas de cuadrados de X y
Y, se obtiene un índice sin dimensiones que se origina cuan-
do las unidades del numerador se cancelan con las del de-
nominador. Esta propiedad representa una ventaja esencial
que hace de este coeciente una medida versátil y fácilmente
interpretable.
2. Rango denido entre -1 y 1: la demostración formal de
esta característica es intrincada y va más allá del objetivo de
este artículo; no obstante, puede abordarse intuitivamente si
se visualiza al R de Pearson desde una perspectiva geométri-
ca. Tal y como especican Rodgers y Nicewander1, este coe-
ciente puede entenderse como el coseno del ángulo formado
por los vectores asociados a X y Y. Cuando dicho ángulo es
cercano a 0, el coseno tiende a 1, lo que implicaría que las
variables poseen una alta proximidad en el espacio. Situación
similar se presenta cuando el ángulo es aproximadamente
igual a 180, en cuyo caso, el coseno será igual a -1 e indicará
que las variables siguen exhibiendo una elevada cercanía,
pero en direcciones opuestas. Ahora bien, cuando el ángulo
entre los vectores es de 90 grados o similar, el coseno ten-
derá a 0 y esto supondrá que las variables son ortogonales,
y que, en consecuencia, no están relacionadas linealmente.
En cuanto a esta propiedad, mucho se ha escrito y discutido
acerca de cómo interpretar cualitativamente la magnitud de
esta medida. En tal sentido —y para efectos de la presente
revisión— se asumirán las sugerencias de Cohen35 por con-
siderarlas de las más extendidas y respetadas a nivel de la
comunidad cientíca; sin embargo, vale la pena mencionar
que estas referencias solo deben ser empleadas como ele-
mento de ayuda al momento de reexionar sobre la impor-
tancia de los hallazgos. El cuadro 2 ofrece esta clasicación.
Cuadro 2. Interpretación de la magnitud del coeciente de
correlación de Pearson según las sugerencias de Cohen. Se
supone en este cuadro que la relación se da entre X y Y,
pero aplica a cualquier par de variables. Se plantea el valor
absoluto del coeciente, de modo que la magnitud es inde-
pendiente del signo.
Cuadro 2
Rango de valores de Interpretación
Correlación nula
Correlación débil
Correlación moderada
Correlación fuerte
3. Relación lineal: esta propiedad es una de las más impor-
tantes y tal vez sea en la que más errores de interpretación
se comenten. Es fundamental distinguir que lo que mide el
coeciente de Pearson es la fuerza y la dirección de la rela-
ción lineal entre las variables. Así, un
indicará que hay una perfecta asociación lineal positiva o ne-
gativa —según sea el signo— entre X y Y. En este orden de
ideas, un será evidencia de que no existe
relación lineal entre las características de interés, pero no
constituye prueba alguna de independencia. En otras pala-
bras, si el coeciente de correlación es nulo, únicamente se
podría establecer que no hay asociación lineal entre las va-
riables aunque pueda existir otro tipo de vinculación34,36.
4. Simetría: la simetría en este caso establece que, sin im-
portar si se intercambian las posiciones de X y Y, el resulta-
do del coeciente será el mismo. En términos matemáticos,
esto podría expresarse a través de la igualdad
, lo que a su vez implica que al realizar un análi-
sis de correlación, ninguna de las características de interés
Figura 1
AVFT Archivos Venezolanos de Farmacología y Terapéutica
Volumen 37, número 5, 2018
591
www.revistaavft.com
debe asumirse como explicativa de la otra. Referencias que
apoyan esta armación pueden encontrarse en Wiedermann
y Hagmann37, quienes arguyen que el coeciente de correla-
ción no puede ser usado para determinar la dirección de la
relación lineal entre las variables.
5. Independencia con respecto al origen y a la escala: el
valor del R de Pearson una vez ha sido calculado, no cam-
biará a pesar de que se modique el origen o la escala de los
datos; es decir, el coeciente no se ve afectado por aquellas
transformaciones lineales que se apliquen a las variables. En
palabras simples, sumar o restar constantes uniformemente
a cada variable no alterará el resultado, lo mismo si se mul-
tiplica o divide.
Suposiciones Vinculadas
Al Uso Del Coeciente R De Pearson
El uso adecuado de este coeciente debe sustentarse en el
cumplimiento de las siguientes premisas:
1. Nivel de medición de las variables: las dos variables de-
ben ser de intervalo o de razón, aunque no es necesario que
ambas tengan el mismo nivel de medición38-41. Ejemplos de
estas características pueden ser: en ingeniería, la velocidad
de un uido (en m/s) y el factor de fricción de una tubería (adi-
mensional); en psicología, el nivel de ansiedad de un sujeto
(en puntos) y la frecuencia cardíaca (en ppm); en medicina,
la presión arterial media (en mm de Hg) y la concentración de
glicemia en la sangre (en mg/dL); en economía, el índice de
precios al consumidor (en porcentaje) y el producto interno
bruto (en dólares americanos); entre otras.
Si bien este tópico no se aborda en este artículo, sí se men-
cionará que existen algunos casos especiales de correlación
conocidos como correlación biserial-puntual y coeciente
phi. En el primero, se utiliza una derivación del R de Pearson
cuando una variable es cuantitativa y la otra es dicotómica42;
en el segundo, se emplea tal ecuación cuando ambas carac-
terísticas son binarias50,51.
2. Datos pareados: para que el cálculo de esta medida pue-
da realizarse, se necesitará que los casos en cuestión ten-
gan datos en cada variable38. Si hay valores perdidos, estos
registros se descartarán por completo del análisis.
3. Normalidad bivariada: contrario a lo que sucede en mu-
chas investigaciones en las que se comprueba únicamente la
normalidad marginal de X y Y, el uso apropiado del coecien-
te de correlación de Pearson exige que se satisfaga el su-
puesto de normalidad bivariada; esto es, que la distribución
de probabilidad conjunta de X y Y sea normal. La gura 2
muestra cuatro distribuciones normales bivariadas obtenidas
mediante simulación con R-Studio. Nótese que, a pesar de
que la curva de tales poblaciones no se ajusta de manera
perfecta a la densidad esperada, sí se asemeja de forma
importante a una campana de Gauss construida a partir de
ternas ordenadas ( , , ).
Figura 2. (a), distribución normal bivariada con medias (0, 0)
y matriz de varianzas-covarianzas (1, 0.5, 0.5, 1); (b), distri-
bución normal bivariada con medias (10, 5) y matriz de va-
rianzas-covarianzas (1, 0.2, 0.2, 1); (c), distribución normal bi-
variada con medias (5, 10) y matriz de varianzas-covarianzas
(1, 0.5, 0.5, 1); y (d), distribución normal bivariada con medias
(0, 0) y matriz de varianzas-covarianzas (1, 0.2, 0.2, 1).
Retomando el comentario inicial sobre esta premisa y con
la intención de enfatizar en la importancia de vericar apro-
piadamente esta hipótesis, se refuerza acá la idea de no
emplear la comprobación de la normalidad de cada varia-
ble de manera individualizada. Rencher, en su libro titulado
Methods of Multivariate Analysis, sostiene que cuando se tra-
baja con varias características, escrutar la normalidad univa-
riada no debe ser el único enfoque ya que existe correlación
entre las variables y debido a que la normalidad marginal no
garantiza la normalidad conjunta29. Esto signica que la nor-
malidad bivariada de los datos podría ser rechazada, aunque
haya sido corroborada en términos univariados. También po-
dría ocurrir lo contrario; a saber: autores como Timm hacen
hincapié que, si una de las variables tiene una distribución
que se aleja de la normalidad, entonces el vector multivaria-
do será no normal45.
En tal sentido, la recomendación pasa por utilizar pruebas
de bondad de ajuste que se adapten al tipo de datos que se
manejan en estas situaciones; pruebas que, en la mayoría
de los casos, son una generalización de sus similares univa-
riadas. Uno de estos métodos es el sugerido por Mardia que
se basa en analizar la asimetría y la curtósis de los datos a
nivel multivariado46,47, siendo tal vez el que mayor estabili-
dad y abilidad ofrece de entre todas las alternativas dispo-
nibles29,45,48. En la actualidad, este test puede ser fácilmente
ejecutado en programas como R, R-Studio, Stata o Matlab.
4. Ausencia de datos atípicos a nivel bivariado: tal y como
sucede con el supuesto anterior, la conjetura relacionada con
la presencia de datos atípicos a nivel multivariado suele ser
malinterpretada y vericada erróneamente. La causa de esto
Figura 2
592
puede deberse a que, en estas situaciones, una observación
no tiene que ser necesariamente grande o pequeña en rela-
ción con el resto de valores de la base de datos para que ten-
ga el efecto de un outlier49. Adicionalmente, Rencher plantea
cuatro escenarios que explican el porqué es más complejo
el análisis de datos atípicos multivariados que univariados29:
(a), cuando hay más de dos variables, los datos no pueden
ser gracados con facilidad para identicar los outliers; (b),
las bases de datos multivariadas no pueden ser ordenadas
como sí puede hacerse en el caso de una sola variable, en
el que es sencillo identicar los extremos de la distribución;
(c), el vector de una observación en particular, bien podría te-
ner un error de medición considerable en uno de sus compo-
nentes, y errores de medición insignicantes en los otros; y
(d), los outliers multivariados pueden tener diferentes efectos
sobre estadísticos como la media, varianza o la correlación.
La alternativa clásica para investigar la presencia de datos
atípicos multivariados es mediante el cálculo de las distan-
cias de Mahalanobis, las cuales usan estimadores de ubica-
ción y dispersión para detectar aquellos puntos que se alejan
signicativamente del centroide49-51. Sin embargo, es nece-
sario enfatizar en el hecho de que, para proporcionar infor-
mación able, el investigador debe cerciorarse de que no se
presenten los efectos de enmascaramiento (masking effect)
o empantanamiento (swamping effect). El enmascaramien-
to sobreviene cuando un dato aberrante no es descubierto
debido a la presencia de otros valores atípicos adyacentes.
Por otro lado, el empantanamiento ocurre cuando una obser-
vación no extrema es clasicada como outlier producto de la
existencia de otros datos normales52,53. Autores como Muñoz-
García y Amón-Uribe advierten acerca de las consecuencias
potenciales de emplear las distancias de Mahalanobis en
presencia de estos efectos: el enmascaramiento podría dis-
minuir esta medida cuando en realidad el valor es atípico;
el empantanamiento, al contrario, podría aumentarla cuando
la observación no es verdaderamente un outlier. Estos pro-
blemas pueden resolverse si se usan estimaciones robustas
para las medias y la matriz de varianzas-covarianzas, tales
como el estimador M multivariado, el S bicuadrático o el esti-
mador de covarianza de mínimo determinante54.
Así pues, la recomendación que se propone en esta publi-
cación es la de utilizar las distancias de Mahalanobis como
estrategia principal para la detección de datos atípicos multi-
variados, siempre y cuando se tenga la precaución de calcu-
lar tales medidas con base en estimaciones que no se vean
afectadas por la presencia de outliers. Esto puede abordarse
con facilidad en paquetes como SPSS, R, R-Studio o Stata.
5. Linealidad: sobre esta propiedad ya se han suministrado
sucientes elementos teóricos en esta revisión, de manera
que solo se recordará en este punto que lo único que mide el
coeciente R de Pearson es la fuerza y la dirección de la rela-
ción lineal entre dos variables. Ahora bien, sí se mencionará
que la forma más idónea y más empleada de constatar si
esta suposición se cumple o no, es a través de los diagramas
de dispersión. Para algunos investigadores, estos grácos
ofrecen incluso más información que el coeciente en sí; no
obstante, conviene adoptarlos cuidadosamente, en especial
cuando la base de datos contiene factores que sirven como
variables de agrupación. Así pues, siempre que sea posible,
el investigador deberá decidir si lo más provechoso es cons-
truir diagramas de dispersión para el conjunto de observacio-
nes como un todo, o generar grácos parciales20,31. La gura
3 exhibe estas dos situaciones.
Figura 3. (a), gráco de dispersión con línea de ajuste en
un conjunto de datos no desagregado, coeciente de corre-
lación bruto de 0.94; (b), gráco de dispersión con líneas de
ajuste desagregadas según grupos A, B y C, coecientes de
correlación individuales.
6. Independencia de observaciones: el postulado de inde-
pendencia de observaciones es crucial al momento de reali-
zar pruebas de hipótesis o construir intervalos de conanza
para el coeciente de correlación o cualquier otro parámetro.
Este supuesto básicamente supone la observancia de dos
premisas: en primer lugar, independencia entre grupos, lo
que implica que los participantes de cada lote deben estar in-
tegrados por diferentes sujetos y que cada individuo aparece
solo una vez y pertenece solo a un grupo. En segundo lugar,
independencia dentro del grupo; es decir, el valor obtenido
para un sujeto cualquiera en una de las variables, no estará
relacionado con los valores del resto de sujetos en esa mis-
ma variable.
La consecuencia de violar esta suposición es la de obtener
resultados erróneos debido al sesgo que potencialmente
se introduce en los datos, de manera que su consecución
supone una labor decisiva para el equipo de investigación.
Desafortunadamente, no hay una manera sencilla o ecaz
de comprobar este supuesto una vez que la muestra ha sido
recogida; al contrario, la recomendación pasa por velar es-
crupulosamente que la escogencia y asignación de los suje-
tos a los diferentes grupos sea al azar, mientras se toma la
muestra40. La planeación cuidadosa de las etapas del experi-
mento es la alternativa ideal para garantizar esto, aunque no
siempre se pueda desarrollar este tipo de investigación en
áreas vinculadas a las ciencias sociales.
Figura 3
AVFT Archivos Venezolanos de Farmacología y Terapéutica
Volumen 37, número 5, 2018
593
www.revistaavft.com
7. Condiciones del muestreo: las técnicas inferenciales
que se enseñan en los cursos o textos básicos de estadísti-
ca suponen que la muestra constituye un conjunto de varia-
bles aleatorias independientes e idénticamente distribuidas
(vaiid). En términos matemáticos, esto signica que cada va-
riable aleatoria tiene la misma distribución de probabilidad y
que todas son mutuamente independientes25-27. Un ejemplo
sencillo podría ilustrar esta noción: supóngase que se lan-
za una moneda equilibrada n veces. Puesto que el peso de
la moneda está distribuido equitativamente, la probabilidad
teórica de obtener cara o sello es la misma en cada repeti-
ción; esto es, . Además, el resultado
de cada ensayo no tendrá efecto en los lanzamientos subse-
cuentes, en consecuencia, este ejemplo es un caso de vaiid y
se ajusta al modelo de la distribución binomial, el cual es una
sucesión de n ensayos de Bernoulli descritos como sigue:
(a), el experimento se repite un número n nito de veces;
(b), cada repetición tiene solo dos resultados posibles; (c),
la probabilidad de éxito, denotada por , es constante en
cada ensayo; (d), la probabilidad de fracaso, denida como
, también permanece constante en cada repeti-
ción; y (e), los ensayos son independientes.
Ahora bien, el problema se origina cuando se asume erró-
neamente que cualquier tipo de muestreo aleatorio garantiza
lo anterior. Esto no es cierto y puede deducirse con facili-
dad al contemplar situaciones reales en las que los sujetos
son escogidos de una población nita y descartados para
las próximas extracciones. Considérese una población de
adultos de ambos sexos de la cual se seleccio-
nan al azar un total de personas. Suponga además
que el muestreo se realiza sin reposición; es decir, una vez
que un individuo ha sido seleccionado, se elimina su nombre
de la población correspondiente y se evitan así los registros
duplicados. Bajo estas circunstancias, la probabilidad de in-
clusión de cada sujeto no es constante y, aunque las varia-
bles aleatorias que son analizadas en los individuos tengan
la misma distribución de probabilidad, no serán mutuamente
independientes. Sin embargo, si el muestreo se realizase con
restitución y el nombre de cada persona se repusiese luego de
haber sido extraído, se cumpliría la condición de independen-
cia y la muestra sería, en efecto, un conjunto de vaiid.
En tal sentido, resulta esencial detallar las condiciones que
debe reunir el muestreo para que las ecuaciones mostradas
en esta revisión sean válidas, así como también las técnicas
de inferencia estadística obtenidas a partir de ellas. El méto-
do de muestreo que asegura la noción de vaiid es el mues-
treo aleatorio simple (MAS) con reposición. Lohr, en su libro
titulado Sampling: design and analysis, establece que esta
técnica es la más elemental y la que sirve como fundamento
para métodos más sosticados. El requisito matemático prin-
cipal de este procedimiento es la equiprobabilidad; esto es,
cada sujeto en la población tiene la misma probabilidad de
ser escogido para pertenecer a la muestra55-57. Otra caracte-
rística distintiva de esta técnica es la homogeneidad de las
unidades de información; a saber: cuando se implementa un
MAS, se asume que los sujetos que conforman la población
poseen características similares en las variables de interés
para el estudio. Lo anterior, gracias al uso de algoritmos58 y
test estadísticos entre algunos ya mencionados59.
Como puede desprenderse del párrafo anterior, la implemen-
tación del MAS en casos reales es sumamente limitada. Por
una parte, sería ilógico seleccionar a la misma persona más
de una vez para que participe en la investigación; por otra,
aquellos escenarios ideales en los que la población es homo-
génea constituyen eventos muy poco probables. Así pues,
la sugerencia que se esboza en el presente artículo es la de
diseñar las etapas iniciales del estudio de modo que garanti-
cen, no solo que se está seleccionando una muestra acorde
a las características de un MAS, sino también que asegure el
supuesto de independencia descrito en el numeral anterior.
Si no es posible lograr estos objetivos, el equipo de investi-
gación podría recurrir a técnicas como el muestreo aleatorio
estraticado, aleatorio por conglomerados o al de muestras
complejas, teniendo la previsión de incorporar las pondera-
ciones muestrales al momento de obtener las estimaciones
puntuales y sus correspondientes errores estándares. Pro-
gramas estadísticos como Stata, SAS, R o R-Studio poseen
módulos que realizan estas labores con relativa simplicidad.
Referencias
1. Rodgers JL, Nicewander WA. Thirteen Ways to Look at the Correla-
tion Coefcient. Am Stat. febrero de 1988;42(1):59.
2. J. J. Strossmayer University of Osijek, Faculty of Agriculture in
Osijek, Kralja Petra Svačića 1d, 31000 Osijek, Croatia, Rebekić A,
Lončarić Z, Petrović S, Marić S. Pearson’s or Spearman’s correla-
tion coefcient - Which one to use? Poljoprivreda. 18 de diciembre
de 2015;21(2):47-54.
3. Zhong M, Zheng S, Wang G, Hua J, Gebbink R. Correlation anal-
ysis of combined and separated effects of wing deformation and
support system in the CAE-AVM study. Chin J Aeronaut. marzo de
2018;31(3):429-38.
4. Kusiak A, Li W. Estimation of wind speed: A data-driven approach. J
Wind Eng Ind Aerodyn. octubre de 2010;98(10-11):559-67.
5. Fu X, Wang J, Tan F, Feng X, Wang D. Occurrence and enrichment
of trace elements in marine oil shale (china) and their behavior dur-
ing combustion. Oil Shale. 2015;32(1):42.
6. Freitas N de O, Forero CG, Caltran MP, Alonso J, Dantas RAS, Pic-
colo MS, et al. Validation of the Perceived Stigmatization Question-
naire for Brazilian adult burn patients. Lin C-Y, editor. PLOS ONE.
30 de enero de 2018;13(1):e0190747.
7. Shoji K, Lesnierowska M, Smoktunowicz E, Bock J, Luszczynska
A, Benight CC, et al. What Comes First, Job Burnout or Secondary
Traumatic Stress? Findings from Two Longitudinal Studies from the
U.S. and Poland. Elhai JD, editor. PLOS ONE. 25 de agosto de
2015;10(8):e0136730.
8. Larson LR, Jennings V, Cloutier SA. Public Parks and Wellbeing in
Urban Areas of the United States. Lepczyk CA, editor. PLOS ONE.
7 de abril de 2016;11(4):e0153211.
9. Joseph PV, Wang Y, Fourie NH, Henderson WA. A computational
framework for predicting obesity risk based on optimizing and inte-
grating genetic risk score and gene expression proles. Devaney J,
editor. PLOS ONE. 24 de mayo de 2018;13(5):e0197843.
594
10. Vera M, Huérfano Y, Contreras J, Vera M, Salazar W, Vargas S,
et al. Desarrollo de una técnica computacional no lineal para la
segmentación de hematomas subdurales, presentes en imágenes
de tomografía computarizada cerebral. Arch Venez Farmacol Ter.
2017;36(6):168-73.
11. Vera M, Huérfano Y, Contreras J, Vera M, Salazar W, Vargas S,
et al. Técnica computacional no lineal para la detección de hemov-
entrículo, en imágenes de tomografía computarizada cerebral. Lati-
noam Hipertens [Internet]. 29 de enero de 2018 [citado 11 de enero
de 2019];12(5). Disponible en: http://saber.ucv.ve/ojs/index.php/
rev_lh/article/view/14695
12. Bernardo SM, Anholon R, Novaski O, Silva D, Quelhas OLG. Main
causes that lead strategies to decline at execution phase: an analy-
sis of Brazilian companies. Int J Product Perform Manag. 6 de mar-
zo de 2017;66(3):424-40.
13. Rani K. Analysis of Dynamic Interaction between Foreign Invest-
ments and Indian Stock Market. J Int Econ. 2015;6(2):10.
14. Wu S, Duncan F, Anderson NH, Kuppuswamy A, Macloed MR,
Mead GE. Exploratory Cohort Study of Associations between Se-
rum C - Reactive Protein and Fatigue after Stroke. Hashimoto K,
editor. PLOS ONE. 24 de noviembre de 2015;10(11):e0143784.
15. Tarabichi M, Detours V. A research note regarding «Variation in can-
cer risk among tissues can be explained by the number of stem cell
divisions». F1000Research. 22 de agosto de 2016;5:2044.
16. Tomasetti C, Vogelstein B. Variation in cancer risk among tissues
can be explained by the number of stem cell divisions. Science. 2
de enero de 2015;347(6217):78-81.
17. Fenton A, Jesky MD, Webster R, Stringer SJ, Yadav P, Chapple I,
et al. Association between urinary free light chains and progression
to end stage renal disease in chronic kidney disease. Bjornstad P,
editor. PLOS ONE. 9 de mayo de 2018;13(5):e0197043.
18. Dinas PC, Nintou E, Psychou D, Granzotto M, Rossato M, Vettor R,
et al. Association of fat mass prole with natriuretic peptide recep-
tor alpha in subcutaneous adipose tissue of medication-free healthy
men: A cross-sectional study. F1000Research. 15 de marzo de
2018;7:327.
19. Akuffo KO, Nolan JM, Peto T, Stack J, Leung I, Corcoran L, et al.
Relationship between macular pigment and visual function in sub-
jects with early age-related macular degeneration. Br J Ophthalmol.
febrero de 2017;101(2):190-7.
20. Kozak M, Krzanowski W, Tartanus M. Use of the correlation coef-
cient in agricultural sciences: problems, pitfalls and how to deal with
them. An Acad Bras Ciênc. diciembre de 2012;84(4):1147-56.
21. Warren WG. Correlation or Regression: Bias or Precision. Appl Stat.
1971;20(2):148.
22. Mukaka M. A guide to appropriate use of Correlation coefcient in
medical research. Malawi Med J J Med Assoc Malawi. septiembre
de 2012;24(3):69-71.
23. Porter AM. Misuse of correlation and regression in three medical
journals. J R Soc Med. marzo de 1999;92(3):123-8.
24. Use and Misuse of Correlation Coefcients [Internet]. STAT 509.
[citado 15 de enero de 2019]. Disponible en: https://newonline-
courses.science.psu.edu/stat509/node/160/
25. Montgomery DC, Runger GC. Applied statistics and probability for
engineers. 3rd ed. New York: Wiley; 2003. 706 p.
26. Walpole RE, Myers RH, Myers SL, Ye K. Probability & statis-
tics for engineers & scientists: MyStatLab update [Internet]. 2017
[citado 24 de junio de 2018]. Disponible en: http://www.myilibrary.
com?id=947904
27. Daniel WW. Biostatistics: A Foundation for Analysis in the
Health Sciences, 5th Edition. [Internet]. Vol. 47. 1991 [cita-
do 24 de junio de 2018]. Disponible en: https://www.jstor.org/
stable/2532686?origin=crossref
28. Weisberg S. Applied linear regression. 3rd ed. Hoboken, N.J: Wiley-
Interscience; 2005. 310 p. (Wiley series in probability and statistics).
29. Rencher AC. Methods of multivariate analysis. 2nd ed. New York:
J. Wiley; 2002. 708 p. (Wiley series in probability and mathematical
statistics).
30. Covariance and Correlation. En: Hedge Funds [Internet]. Oxford, UK:
John Wiley & Sons Ltd; 2013 [citado 26 de junio de 2018]. p. 121-
46. Disponible en: http://doi.wiley.com/10.1002/9781118673546.ch6
31. Asuero AG, Sayago A, González AG. The Correlation Coefcient:
An Overview. Crit Rev Anal Chem. enero de 2006;36(1):41-59.
32. Rigby AS. Statistical methods in epidemiology. VI. Correlation
and regression: the same or different? Disabil Rehabil. enero de
2000;22(18):813-9.
33. Goodwin LD, Leech NL. Understanding Correlation: Factors That
Affect the Size of r. J Exp Educ. abril de 2006;74(3):249-66.
34. Ratner B. The correlation coefcient: Its values range between +1/−1,
or do they? J Target Meas Anal Mark. junio de 2009;17(2):139-42.
35. Cohen J. Statistical power analysis for the behavioral sciences. 2nd
ed. Hillsdale, N.J: L. Erlbaum Associates; 1988. 567 p.
36. Sedgwick P. Pearson’s correlation coefcient. BMJ. 4 de julio de
2012;345(jul04 1):e4483-e4483.
37. Wiedermann W, Hagmann M. Asymmetric properties of the Pearson
correlation coefcient: Correlation as the negative association be-
tween linear regression residuals. Commun Stat - Theory Methods.
noviembre de 2016;45(21):6263-83.
38. Yeager K. LibGuides: SPSS Tutorials: Pearson Correlation [Inter-
net]. [citado 18 de diciembre de 2018]. Disponible en: https://lib-
guides.library.kent.edu/SPSS/PearsonCorr
39. Measure of association | statistics [Internet]. Encyclopedia Britan-
nica. [citado 17 de diciembre de 2018]. Disponible en: https://www.
britannica.com/topic/measure-of-association
40. Pearson Product-Moment Correlation - When you should run this
test, the range of values the coefcient can take and how to mea-
sure strength of association. [Internet]. [citado 18 de diciembre de
2018]. Disponible en: https://statistics.laerd.com/statistical-guides/
pearson-correlation-coefcient-statistical-guide.php
41. Pearson’s Product-Moment Correlation in SPSS Statistics - Proce-
dure, assumptions, and output using a relevant example. [Internet].
[citado 18 de diciembre de 2018]. Disponible en: https://statistics.
laerd.com/spss-tutorials/pearsons-product-moment-correlation-us-
ing-spss-statistics.php
42. Point-Biserial Correlation in SPSS Statistics - Procedure, assump-
tions, and output using a relevant example. [Internet]. [citado 18 de
diciembre de 2018]. Disponible en: https://statistics.laerd.com/spss-
tutorials/point-biserial-correlation-using-spss-statistics.php
43. Chi-Square Test for Association using SPSS Statistics - Proce-
dure, assumptions and reporting the output [Internet]. [citado 18 de
diciembre de 2018]. Disponible en: https://statistics.laerd.com/spss-
tutorials/chi-square-test-for-association-using-spss-statistics.php
AVFT Archivos Venezolanos de Farmacología y Terapéutica
Volumen 37, número 5, 2018
595
www.revistaavft.com
44. Cui Y, Wang S, Yan S. Evaluating the Applicability of Phi Coefcient
in Indicating Habitat Preferences of Forest Soil Fauna Based on a
Single Field Study in Subtropical China. PLoS ONE [Internet]. 1 de
marzo de 2016 [citado 18 de diciembre de 2018];11(3). Disponible
en: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4773244/
45. Timm NH. Applied multivariate analysis. New York: Springer; 2002.
693 p. (Springer texts in statistics).
46. Mardia KV. Measures of Multivariate Skewness and Kurtosis with
Applications. Biometrika. diciembre de 1970;57(3):519.
47. Kankainen A, Taskinen S, Oja H. On Mardia’s Tests of Multinormal-
ity. En: Hubert M, Pison G, Struyf A, Van Aelst S, editores. The-
ory and Applications of Recent Robust Methods [Internet]. Basel:
Birkhäuser Basel; 2004 [citado 30 de diciembre de 2018]. p. 153-64.
Disponible en: http://link.springer.com/10.1007/978-3-0348-7958-
3_14
48. Romeu JL, Ozturk A. A Comparative Study of Goodness-of-Fit Tests
for Multivariate Normality. J Multivar Anal. agosto de 1993;46(2):309-
34.
49. Cabana E, Laniado H, Lillo RE. Multivariate outlier detection based
on a robust Mahalanobis distance with shrinkage estimators. :80.
50. De Maesschalck R, Jouan-Rimbaud D, Massart DL. The Mahalano-
bis distance. Chemom Intell Lab Syst. enero de 2000;50(1):1-18.
51. Franklin S, Thomas S, Franklin S. Robust multivariate outlier detec-
tion using Mahalanobis’ distance and modied Stahel-Donoho esti-
mators. Semantic Sch. 2001;35.
52. Bendre SM. Masking and swamping effects on tests for multiple out-
liers in normal sample. Commun Stat - Theory Methods. enero de
1989;18(2):697-710.
53. Chiang J-T. The masking and swamping effects using the planted
mean-shift outliers models. Int J Contemp Math Sci. 2007;2:297-
307.
54. García JAM, Uribe IA. Técnicas para detección de outliers multivari-
antes. Rev En Telecomunicaciones E Informática. 2013;3(5):11-25.
55. Lohr SL. Sampling: Design and Analysis. 3.a ed. Brooks/Cole Cen-
gage Learning; 2010. 596 p.
56. Alf C, Lohr S. Sampling Assumptions in Introductory Statistics
Classes. Am Stat. febrero de 2007;61(1):71-7.
57. Pineda-Roa C, Navarro-Segura M. Validación de una prueba para
medir eventos vitales estresantes en adultos gay, lesbianas y bi-
sexuales colombianos. Psicogente [Internet]. 1ene.2019 [citado
1mar.2019];22(41):1-9. Available from: http://revistas.unisimon.edu.
co/index.php/psicogente/article/view/3305
58. Londoño González B. & Sánchez, P. Algoritmo Novedoso Para
la Detección de Tareas Repetitivas en el Teclado, Investigacion
e Innovación en Ingenierias, vol. 3, no. 2, 2015. DOI: https://doi.
org/10.17081/invinno.3.2.2031
59. Insignares Movilla, J. & Orozco E. The t Distribution: A Transforma-
tion of the Employee of the Brewery, Investigación e Innovación en
Ingenierías, vol. 2, no. 2, 2014. DOI: https://doi.org/10.17081/invin-
no.2.2.2049
... After assessing the normality of data by the Kolmogorov-Smirnov test, we performed the Mann-Whitney U and t-test to compare data between UC patients and healthy controls. We performed bivariate associations by the Pearson correlation coefficient (r) for body composition variables with PhA in UC patients, defining null correlation values as ranging from 0.00 to 0.09, weak correlations from 0.10 to 0.29, moderate correlations from 0.30 to 0.49, and strong correlations from 0.50 to 1.0, according to the guidelines of Hernández Lalinde J.D. et al. [16]. We used the statistical package IBM-SPSS version 23 (IBM, Armonk, NY, USA) for the analysis, considering a p-value < 0.05 as significant. ...
... PhA is considered a marker of cellular integrity and is directly related to prognosis and mortality in numerous diseases [16]. Furthermore, it serves as a predictor of malnutrition, which is defined by The World Health Organization (WHO) as a deficiency, excess, or imbalance in a person's intake of energy and/or nutrients [17]. ...
Article
Full-text available
Background: Accumulating evidence has proposed phase angle (PhA) as a marker for assessing cellular integrity and nutritional status in ulcerative colitis (UC) patients; the aim of the study was to evaluate the efficacy of PhA in assessing nutritional status in patients with UC, investigating its potential as a biomarker of disease activity. Methods: We conducted a cross-sectional study in patients with UC and healthy controls. We determined PhA by electrical bioimpedance and categorized participants through bioelectrical impedance analysis. They were classified as normal PhA > 6.1° and low PhA < 6.1° in men and normal PhA > 5.6° and low PhA < 5.6° in women. Results: PhA was significantly lower in UC patients than in controls (5.8 ± 0.8 vs. 6.6 ± 0.7°; p < 0.001). Among UC patients, participants with low PhA showed a decrease in lean, dry mass (LDM) (p < 0.001), total body water (p = 0.008), and intracellular water (p = 0.005), accompanied by an increase in extracellular water (p = 0.001) compared to UC patients with normal PhA. Conclusions: PhA significantly decreases in UC patients compared to healthy controls and is even more reduced when UC is active. A cut-off point of <6.1 for men and <5.6 for women could be suitable for nutritional diagnosis in patients with UC, but it still needs to be validated.
... 46 The correlation of each item with the overall scale score was evaluated using the Spearman correlation coefficient and was categorized as null (<0.10), weak (0.10−0.29), moderate (0.30−0.50), and strong correlation (>0.50). 47 The internal consistency of the FRAIL-Es was calculated using all evaluations conducted by the 5 professionals. ...
... Todas las correlaciones fueron significativas para p < .01. La mayoría de las correlaciones entre variables no pertenecientes al mismo instrumento fueron débiles o moderadas en conformidad con los rangos del coeficiente de correlación de Pearson presentados por Lalinde et al. (2018). El modelo de ecuaciones estructurales (MEE) indicó la existencia de cuatro efectos estadísticamente significativos. ...
Article
Full-text available
Resumen La emergencia sanitaria originada por el COVID 19 ocasionó ajustar los programas académicos a una educación en línea a partir de eventos sincrónicos. En este sentido, el objetivo del estudio fue analizar por medio de un modelo con ecuaciones estructurales (MEE), el efecto de la autoeficacia en el aprendizaje del inglés sobre la autoconfianza al hablar, y el efecto de la autoconfianza sobre el empleo de las herramientas web 2.0 en el aprendizaje en línea de la L2. El estudio se realizó con un diseño no experimental de tipo cuantitativo ex post facto, nivel explicativo y corte transversal con una muestra de 861 estudiantes universitarios. Se administró el Cuestionario sobre la Autoeficacia en el Aprendizaje del Inglés, el Cuestionario sobre Confianza al Hablar Inglés como Lengua Extranjera y el Cuestionario sobre Actitudes para el Uso de las Herramientas web 2.0. El modelo reveló que la autoeficacia en la habilidad de la expresión oral ejerce una influencia positiva fuerte sobre la autoconfianza. La autoeficacia en la habilidad de comprensión auditiva indicó una incidencia positiva moderada sobre la autoconfianza. Esta último, incide de manera positiva moderada sobre el empleo de las herramientas web 2.0 para el desarrollo de las habilidades comunicativas. Se concluyó que aquellos estudiantes que creen en sus capacidades (autoeficacia), y que confían en las habilidades que han adquirido (autoconfianza), podrán tener mejores resultados académicos y desarrollar las habilidades lingüísticas en la L2 por medio de los recursos web 2.0.
... For this purpose, Pearson's correlation coefficient indicated by Lalinde et al. [12] and the method proposed by Lvovitch in 1959 [11], for the calculation of the water balance, will serve as a basis for evaluating water storage in mountainous basins and relating it to morphometry and hydrometeorology across various basins. By employing this approach, we aim to improve our understanding of the influence of these hydrometeorological and morphometric characteristics on the dynamics of the water balance within a basin, emphasizing water storage. ...
Article
Full-text available
The Topo River basin, located in the tropical region of Ecuador, is considered a little-known and well-preserved basin, with limited access conditions and scarce data that hinder its hydrological understanding. However, this gap can be addressed through this study, which evaluates morphometric and hydrometeorological factors, relating them to water storage in the Topo River basin and comparing these results with other watersheds. The aim is to identify the morphometric and hydrometeorological factors that control the variability in water storage. Firstly, a morphometric characterization was conducted. Then, a hydrometeorological characterization was carried out based on climatic data from a single station with less than two years of data, along with the calculation of the water balance. Finally, water storage in the Topo basin was compared with the main morphometric and hydrometeorological characteristics of other basins. The results showed that the Topo River basin stores 9.1 mm annually (0.20% of its precipitation), and this storage is the result of its high runoff coefficient. It was concluded that basins with lower precipitation, higher evapotranspiration ranges, larger areas, gentler slopes, smaller altitude ranges, longer rivers, and basins that are narrow and oval-shaped may have higher water storage capacity.
... 24 The local independence of the items was evaluated by analysis of the correlation matrix and the Q3 Yen statistic, for which the value of ±0.30 should not be exceeded. 25 The fit values of the items to the Rasch model were established in an optimal range between 0.8-1.2 for the infit and outfit values and as acceptable values between 0.5-1.5, not exceeding the critical value of 0.2-2 points. 26 The value of infit allows us to evaluate the behavior of the items on the participants and the value of the outfit, determine the atypical or unusual cases. ...
Article
Full-text available
The 60 % of cardiac arrests happen in the out-of-hospital setting. In 2023, the International Liaison Committee on Resuscitation issued a statement entitled “Children save lives”, recommending the teaching of basic life support to children from the age of 12. However, we have not identified validated instruments that assess the level of knowledge of schoolchildren about BLS and AED. Objective: Construction and psychometric validation of a questionnaire to assess knowledge on Basic Life Support (BLS) and Automated External Defibrillator (AED) in primary to secondary school children. Method: Cross-sectional descriptive study of validation of the questionnaire consisting of several phases: construction of the questionnaire on knowledge on BLS and AED (ConocES-BLS/AED), content validation, pilot test and psychometric validation. Results: The ConocES-SVB/AED questionnaire was constructed, content validation was carried out by 14 experts, the pilot test carried out on 105 students reported good reliability (0.84), and finally with the psychometric validation a questionnaire composed of 12 items was obtained and psychometrically validated using the Item Response Theory in a final sample of 182 participants. Adequate fit values and acceptable reliability (0.65) were obtained, demonstrating its usefulness to accurately measure the level of knowledge about SVB/AED maneuvers in schoolchildren. Conclusions: The created and validated questionnaire provides educators with a fundamental resource to identify areas of lack of knowledge, improve and design effective educational interventions for schoolchildren on SVB/AED maneuvers.
Article
Full-text available
La validez y la confiabilidad de los instrumentos para la recolección de los datos son conceptos esenciales en la investigación, especialmente en el ámbito de la investigación cuantitativa, ya que son fundamentales para evaluar la calidad y precisión de los estudios. En este sentido, el objetivo de la investigación fue evaluar la validez y confiabilidad de la Escala de Actitud Ambiental hacia los Residuos Sólidos. Se aplicó un cuestionario de 30 ítems en una escala Likert de cinco puntos, cuyos resultados fueron analizados por cuatro expertos. Los hallazgos indicaron que todos los ítems son válidos, con medias superiores al 60%, y una confiabilidad alta, evidenciada por un alfa de Cronbach de 0.946 y un Omega de McDonald de 0.947. La correlación ítem-resto también fue significativa, destacando que la mayoría de los ítems contribuyen efectivamente al constructo medido. Estos resultados subrayan la utilidad del instrumento para medir actitudes ambientales, garantizando su validez y confiabilidad, lo que es esencial para futuras investigaciones en el área de gestión de residuos sólidos.
Article
Full-text available
El clima organizacional se refiere al conjunto de impresiones o propiedades medibles que tiene de manera directa o indirecta el trabajador sobre su espacio laboral, y que puede limitar hacer frente a las dificultades que se dan en las actividades laborales, lo que se conoce como estrés; en tal sentido, analizar la incidencia del clima organizacional en el estrés laboral de los empleados de la Dirección Distrital de Salud 13D11 Manabí, fue el objetivo de esta investigación, para la cual, se utilizó una metodología centrada en el enfoque mixto mediante dos instrumentos de medición, el cuestionario de la Organización Mundial de la Salud y la Organización Internacional del Trabajo para medir el nivel de estrés en los empleados, y el cuestionario validado por experto para determinar el clima organizacional, los cuales se aplicaron a una muestra intencional de 35 funcionarios de la Institución. Como resultados se obtuvo un clima laboral aceptable y un bajo nivel de estrés en los funcionarios, evidenciando que la influencia positiva del clima organizacional mantiene bajos los niveles de estrés en el personal, cuya correlación entre ambas variables está dada en la medida en que ambas suben al mismo tiempo. Concluyendo que el clima laboral detectado no impide la colaboración y cooperación de los empleados para entregar los servicios al público; aunque se requiere fortalecer un nivel de liderazgo que tienda a fortalecer acciones conjuntas.
Article
Full-text available
Ecological Reserves are the primary basis for the subsistence of biodiversity, they play crucial roles in the maintenance of ecosystems, especially in the preservation of ecosystem services of climate regulation and water supply. The objective of the research was to determine the accumulation capacity of COS in three ecosystems of the Arenillas Ecological Reserve (REAR) and the influence of depth factors and soil type. It was hypothesized that these factors exert an effect on the physical-chemical properties of the soil, causing carbon variability. Fourteen sampling units were established for the three ecosystems; 1) Intervened, 2) Deciduous Forest and 3) Deciduous shrub forest, two soil samples were extracted from each unit at depths of (0-10 and 10-30 cm), giving a total of 28 samples. The results revealed significant differences between the three types of ecosystems, allowing us to affirm that, in the REAR, the COS content is higher in the deciduous forest ecosystem than in the deciduous shrub forest and the Intermediate zone. Likewise, Alfisol and Entisol soils in the deciduous forest had the highest COS storage capacity, being the surface layer the one with the highest accumulation in the three ecosystems. It was concluded that low precipitation, increased temperature and sporadic vegetation produced by anthropic activities affect COS storage, limiting the provision of ecosystem services related to soil carbon sequestration.
Research
Chilean Patagonia has a complex geological history dominated recently by Quaternary glaciers and rivers that have carried sediments from the mountains to depositional environments within marine fjords and channels. Although much is known about onshore placer deposits, little is known about these deposits and depositional systems in the offshore realm. This study analyzes the chemistry and mineralogy of marine sediments collected in the Strait of Magellan and around the region. This study aims to comprehend the distribution, concentration and provenance of critical/strategic elements and precious metals. In collaboration with the Cabo de Hornos research vessel of the Chilean Navy, 63 sediment samples were collected using a box core sampler, complemented with coastal beach samples. These samples underwent petrographic and geochemical analysis. The predominant opaque minerals identified in these samples are mainly iron oxides (magnetite–hematite-ilmenite)and sulfides (pyrite, exceptional greigite). A comparison of the average element concentration for all samples for different baseline values revealed the following findings. As, Bi, Li, Re, Sb, Se, Te, and Pd exhibit positive anomalies for the Upper Continental Crust (UCC); Re, Se, and Sr. exhibit positive anomalies for Marine Sediments (MS), and Bi, Cs, Li, Re, Se, Sn, and Te show positive anomalies relative to the Folded Belt (FB). The main contrast anomalies occur in the following locations. Almirantazgo Sound (Sn, Ba, Sb, and Tm); Concepcion Channel (Re, Sr., and Te); Smyth Channel (Mn, Re, Sb, Sr., Te, and Se); Almirante Montt Gulf (Mn, Re, and Sb); Nelson Strait (Re, Sr., and Te); Ancho Pass (Ti and Sr); Europa Fjord (Bi and Sn); Del Hambre Pass (Sr); Magdalena Channel and Sound (Sr); Froward Pass (Se), and Whiteside Channel (Mn). Regarding precious metals, silver exhibits contrasting anomalies relative to the UCC in seafloor sediments in the Almirante Montt Gulf (0.161 ppm)and Concepcion Channel (0.101 ppm). Palladium contrast anomaly is observed in the Peel Estuary (8 ppb) and Platinum contrast anomalies occur in the Concepcion (3 and 5 ppb) and Smyth Channels (4 ppb). Finally, gold, in comparison to the South Patagonian Batholith, reveals contrasting anomalies that occur in the Concepcion Channel (8 ppb), Peel Estuary (6.7 and 8 ppb), Nelson Strait (7 ppb), Almirante Montt Gulf (6 ppb), Forward Pass (8 ppb), and Ancho Pass (7 ppb). In summary, the presented results provide valuable insights into the geological and geochemical baseline of the region, offering a better under-standing of the relationship with depositional basins and source zones onshore during the late-Quaternary.
Article
Full-text available
There exists a scarcity of neurocognitive research that has successfully used electrophysiology as an objective tool to assess different learning modalitiesthat are commonly used in anatomy. The objective of this study was to explore the trend in the expression of brain waves in medical students when using different didactic strategies in learning anatomy. An exploratory, observational, cross-sectional study was conducted on 22 first- semester medical students in anatomy. Using didactic strategies with different pedagogical tools such as biological models (human skulls and pig hearts) and/or digital application (Visible Body software), and different evaluation methods, students were grouped into three groups: "EOR1" students who learned using a skull and were evaluated with it; "EOV1" students who learned using a pig heart and were evaluated with the Visible Body software; and "EOV2" for students who learned through the Visible Body software and were evaluated with it. During the evaluation, each student was monitored in real-time using an electroencephalogram and the Emotiv EPOC brain-computer interface system to record the electro-physiological activity of beta (B), theta (T), and gamma (G) waves. The data obtained (the trend of the electrical activity of each wave and its relationship with students' performance in each didactic strategy) were analyzed using Pearson's correlation coefficient. Groups EOR1 and EOV1 had satisfactory results in their evaluations and showed a predominance of B waves (x=67.33) and T waves (x=57.67). Additionally, a strongly positive correlation (r=0.82) was found between the presence of B waves and the duration of T waves. Students who used three-dimensional biological models as a pedagogical tool showed a predominance of B and T waves, which are associated with sensorimotor and exploratory learning necessary for studying anatomy.
Article
Full-text available
A collection of robust Mahalanobis distances for multivariate outlier detection is proposed, based on the notion of shrinkage. Robust intensity and scaling factors are optimally estimated to define the shrinkage. Some properties are investigated, such as affine equivariance and breakdown value. The performance of the proposal is illustrated through the comparison to other techniques from the literature, in a simulation study and with a real dataset. The behavior when the underlying distribution is heavy-tailed or skewed, shows the appropriateness of the method when we deviate from the common assumption of normality. The resulting high true positive rates and low false positive rates in the vast majority of cases, as well as the significantly smaller computation time show the advantages of our proposal.
Article
Full-text available
Objetivo: Evaluar las características psicométricas de una prueba para valorar eventos vitales estresantes (PEVE), así como comparar el constructo según sexo, edad y orientaciones sexuales no heterosexuales residentes en tres ciudades de Colombia, Barranquilla, Bogotá y Tunja. Método: Se implementó un muestreo no probabilístico tipo bola de nieve mediante el cual 208 participantes con edades entre 18 y 67 años (ME= 26,16; DE=8,56) diligenciaron la PEVE, que medía diversos eventos estresantes (EE). Resultados: La consistencia interna obtenida a través de alfa de Cronbach fue 0,79 y el Omega de McDonald fue de 0,89. El 34,62% no experimentó EE durante el pasado año, el 56,25% experimentó bajos niveles y solo un 9,13% tuvo EE en alto grado. Análisis Paralelo y Test MAP sugieren un único factor que explicó el 54% de la varianza. Los EE en mujeres se asocian con mayor proporción de discusiones con la familia debido a su homosexualidad (p<0,05), mientras que EE en hombres se asocian con problemas con la policía y ser agredidos físicamente (p<0,05). Con relación a orientación sexual, EE se asocian con mayor proporción de homosexuales que reportan problemas con familiares en comparación de la proporción de bisexuales (p<.05). Con respecto a la edad, adultos jóvenes tienden a experimentar mayores niveles promedio de EE que adultos (p<.05). Conclusión: En población LGB colombiana, PEVE muestra adecuada validez de constructo y consistencia interna. La mayoría de participantes perciben un nivel bajo de EE y estos niveles cambian teniendo en cuenta variables como el sexo, orientación sexual y edad. Se requieren más investigaciones en contextos latinoamericanos.
Article
Full-text available
Recent large-scale genome-wide association studies have identified tens of genetic loci robustly associated with Body Mass Index (BMI). Gene expression profiles were also found to be associated with BMI. However, accurate prediction of obesity risk utilizing genetic data remains challenging. In a cohort of 75 individuals, we integrated 27 BMI-associated SNPs and obesity-associated gene expression profiles. Genetic risk score was computed by adding BMI-increasing alleles. The genetic risk score was significantly correlated with BMI when an optimization algorithm was used that excluded some SNPs. Linear regression and support vector machine models were built to predict obesity risk using gene expression profiles and the genetic risk score. An adjusted R² of 0.556 and accuracy of 76% was achieved for the linear regression and support vector machine models, respectively. In this paper, we report a new mathematical method to predict obesity genetic risk. We constructed obesity prediction models based on genetic information for a small cohort. Our computational framework serves as an example for using genetic information to predict obesity risk for specific cohorts.
Article
Full-text available
Background Patients with chronic kidney disease (CKD) are at an increased risk of developing end-stage renal disease (ESRD). We assessed for the first time whether urinary free light chains (FLC) are independently associated with risk of ESRD in patients with CKD, and whether they offer incremental value in risk stratification. Materials and methods We measured urinary FLCs in 556 patients with CKD from a prospective cohort study. The association between urinary kappa/creatinine (KCR) and lambda/creatinine (LCR) ratios and development of ESRD was assessed by competing-risks regression (to account for the competing risk of death). The change in C-statistic and integrated discrimination improvement were used to assess the incremental value of adding KCR or LCR to the Kidney Failure Risk Equation (KFRE). Results 136 participants developed ESRD during a median follow-up time of 51 months. Significant associations between KCR and LCR and risk of ESRD became non-significant after adjustment for estimated glomerular filtration rate (eGFR) and albumin/creatinine ratio (ACR), although having a KCR or LCR >75th centile remained independently associated with risk of ESRD. Neither KCR nor LCR as continuous or categorical variables provided incremental value when added to the KFRE for estimating risk of ESRD at two years. Conclusions Urinary FLCs have an association with progression to ESRD in patients with CKD which appears to be explained to a degree by their correlation with eGFR and ACR. Levels above the 75th centile do have an independent association with ESRD, but do not improve upon a current model for risk stratification.
Article
Full-text available
Background: Atrial natriuretic peptide increases lipolysis in human adipocytes by binding to natriuretic peptide receptor-A (NPRA). The aim of the current study was to examine the associations of NPRA mRNA of subcutaneous adipose tissue with fat mass, fat-free mass, body mass index (BMI) and arterial blood pressure in medication-free healthy men. Method: Thirty-two volunteers [age (years): 36.06±7.36, BMI: 27.60±4.63 (kg/m ² )] underwent assessments of body height/weight, % fat mass, fat-free mass (kg), blood pressure, and a subcutaneous adipose tissue biopsy via a surgical technique. Results: We found that NPRA mRNA was negatively associated with % fat mass (r=-0.40, R ² =0.16, p=0.03) and BMI (r=-0.45, R ² =0.20, p=0.01). Cohen’s f ² effect size analyses showed a small effect size between NPRA mRNA and BMI ( f ² =0.25). One-way analysis of variance with Bonferroni post-hoc tests showed a tendency for mean differences of NPRA mRNA across BMI categories (p=0.06). This was confirmed by Cohen’s d effect size analyses revealing a large effect size of NPRA mRNA between obese individuals (BMI≥30 kg/m ² ) and either normal weight (BMI=19-25 kg/m ² ; d =0.94) or overweight (BMI=25-30 kg/m ² ; d =1.12) individuals. Conclusions: NPRA mRNA is negatively associated with % fat mass and BMI in medication-free healthy men, suggesting a possible role of NPRA in the control of fat mass accumulation.
Article
Full-text available
The Chinese Aeronautical Establishment (CAE) Aerodynamic Validation Model (AVM) is a dual-purpose test geometry dedicated to verify the aerodynamic performance of a conceptual intercontinental jet aircraft and to provide a dataset for CFD software validation. To this end, a scaled model of the AVM was tested in the High-Speed Tunnel (HST) of the German-Dutch Wind-tunnels (DNW) with special test consideration and instrumentation. For complementary analysis of experimental results, specific CAE-AVM geometries are analyzed using a CAE in-house CFD code. The specific geometries consist of a baseline aircraft, an aircraft with a deformed wing shape, and an aircraft with both a deformed wing shape and a representation of the model support system used in the wind tunnel. Detailed analysis of numerical and experimental results is presented; both the combined and individual attributions of wing deformation and support system interference on wing pressure distributions and longitudinal aerodynamic characteristics are summarized.
Article
Full-text available
Currently, there is no questionnaire to assess perceived stigmatization among people with visible differences in Brazil. The Perceived Stigmatization Questionnaire (PSQ), developed in the United States, is a valid instrument to assess the perception of stigmatizing behaviours among burn survivors. The objective of this cross-sectional and multicentre study was to assess the factor structure, reliability and validity of the Brazilian Portuguese version of the PSQ in burn patients. A Brazilian version of the 21-item PSQ was answered by 240 adult burn patients, undergoing rehabilitation in two burns units in Brazil. We tested its construct validity by correlating PSQ scores with depression (Beck Depression Index-BDI) and self-esteem (Rosenberg Self-Esteem Scale-RSE), as well as with two domains of the Revised Burn Specific Health Scale—BSHS-R: affect and body image, and interpersonal relationships. We used Confirmatory Item Factor Analysis (CIFA) to test whether the data fit a measurement model involving a three-factor structure (absence of friendly behaviour; confusing/staring behaviour; and hostile behaviour). We conducted Exploratory Factor Analyses (EFA) of the subscale in a 50% random sample of individuals (training split), treating items as ordinal categorical using unweighted least squares estimation. To assess discriminant validity of the Brazilian version of the PSQ we correlated PSQ scores with known groups (sex, total body surface area burned, and visibility of the scars) and assessed its reliability by means of Cronbach's alpha and using test-retest. Goodness-of-fit indices for confirmatory factor analysis were satisfactory for the PSQ, but not for the hostile behaviour subscale, which was modified to improve fit by eliminating 3 items. Cronbach’s alphas for the PSQ refined version (PSQ-R) ranged from 0.65 to 0.88, with test-retest reliability 0.87 for the total score. The PSQ-R scores correlated strongly with depression (0.63; p < 0.001), self-esteem (-0.57; p < 0.001), body image (-0.63; p < 0.001), and interpersonal relationships (-0.55; p < 0.001). PSQ-R total scores were significantly lower for patients with visible scars (effect size = 0.51, p = 0.029). The PSQ-R showed reliability and validity comparable to the original version. However, the cross-cultural structure of the subscale “hostile behaviour” and sensitivity to change of the PSQ should be further evaluated.
Article
Full-text available
En este artículo una herramienta para la detección de tareas repetitivas con secuencias lógicas realizadas a través de comandos del teclado, mediante el diseño e implementación de un algoritmo basado en el uso de autómatas finitos determinísticos y agentes de búsqueda de patrones. La novedad del algoritmo desarrollado radica en que está orientado a la detección de tareas repetitivas cuyas actividades tienen una secuencia lógica y que actualmente no se encuentran automatizadas por lo complejo que es esta labor Abstract This paper propose a tool for the detection of repetitive tasks with logical sequences realized across command of the keyboard is proposed, by means of the design and implementation of an algorithm based on the use of finite automata deterministic and agents of bosses' search. The innovation of the developed algorithm takes root in that it is orientated to the detection of repetitive tasks which activities have a logical sequence and that nowadays are not automated by the complex thing that is this labor.