ArticlePDF Available

Abstract and Figures

The Cerrejon coal mine in the north of Colombia is one of the largest open pits in South America. The Cerrejon has an air quality monitoring network with over 30 years of records of the levels of particulate material. Between January 2012 and November 2013, the mean daily concentrations of PM10 were registered in eight stations of the air quality monitoring network using high volume samplers. Similarly, measurements of wind speed and direction were studied during this period. The average concentrations of PM10 in the eight stations varied in the range 17,49-42,01μg·m-3. These levels do not exceed the maxi-mum permissible daily values as laid down in the guide of the World Health Organization. The techniques of factor analysis (FA) and cluster analysis (CA) as well as the wind direction and speed were used to infer the main sources of pollution and to determine the special patterns of PM10 concentrations. The FA identified two groups with the same concentration behavior; these two groups have extraction pits located upwind. The results of the CA showed three differential clusters with the same stations identified in the FA. These techniques identified the coal pits located upwind of the stations as potential sources of PM10.
Content may be subject to copyright.
44 JANUARY 2017, VOL. 42 Nº 10378-1844/14/07/468-08 $ 3.00/0
Introducción
Colombia es el primer pro-
ductor de carbón de América
Latina y el décimo en el
mundo, con más de 74×106
toneladas métricas de produc-
ción anual. La mina de car-
bón del Cerrejón, ubicada en
el departamento de La
Guajira, al norte de Colombia,
representa una de las minas
más grandes a cielo abierto
del mundo, con aporte del
38% en la producción y más
del 50% en la exportación,
convirtiéndose en la principal
compañía de obtención de
carbón térmico en el país
(UPME, 2006). Esta capaci-
dad de producción hace que
las operaciones mineras reali-
zadas a cielo abierto generen
material particulado en canti-
dades significativas. El mate-
rial particulado con diámetro
aerodinámico <10μm (PM10)
es uno de los parámetros más
importantes que se utilizan
para evaluar la calidad del
aire. Es sabido que la conta-
minación atmosférica en áreas
mineras con estas característi-
cas está ampliamente relacio-
nada a la presencia significa-
tiva de material particulado
en el ambiente (Huertas et al.,
2012, Hinwood et al., 2014).
El aumento de las concentra-
ciones de PM10 en cercanías a
zonas mineras está asociado
con el aumento de síntomas
respiratorios, agravamiento
del asma, ingresos hospitala-
rios y muerte prematura; el
riesgo es más alto para los
ancianos, niños y personas
con asma o enfermedades del
corazón (Qu et al., 2007;
Hendryx, 2008; Hendryx y
Zullig, 2009).
Con el fin de proteger la
salud humana, el Estado co-
lombiano establece los niveles
de inmisión mediante la
Resolución 610 de 2010
(MAVDT, 2010) para todo el
territorio nacional en condi-
ciones de referencia. El nivel
máximo permisible para un
tiempo de exposición de 24h
es 10g·m-3. Por ende, el
monitoreo de la calidad de
aire en la zona minera del
Cerrejón debe ser gestionado
adecuadamente. La ubicación
de los puntos óptimos de
muestreo, así como determi-
nar el comportamiento y las
tendencias de los niveles de
concentraciones, permite au-
mentar la eficacia para alcan-
zar tales objetivos respecto a
la calidad del aire.
Esta eficacia se alcanza con
un análisis sistemático de los
datos disponibles. Hay varia-
das técnicas de análisis de
datos de contaminación at-
mosférica; entre ellas, la téc-
nica de estadísticas de factor
analysis (FA) y el cluster
analysis (CA) han sido utili-
zado en diversas áreas de in-
vestigación. El objetivo de
cualquier técnica de agrupa-
ción es maximizar la homoge-
neidad de elementos dentro de
los grupos y maximizar la
heterogeneidad entre el clúster
(Makra et al., 2011). En el
área ambiental, FA se ha
ción Mundial de la Salud. Las técnicas de factor analysis (FA),
cluster analysis (CA) y dirección y velocidad del viento fueron
utilizados para inferir sobre las principales fuentes de contami-
nación y para determinar los patrones especiales de las concen-
traciones de PM10. El FA identico dos grupos con tres estacio-
nes cada uno con el mismo comportamiento de concentraciones.
Estos dos grupos tienen tajos (o canteras) de extracción viento
arriba de su ubicación. Los resultados de CA mostraron tres
clúster diferenciables con las mismas estaciones obtenidas en el
FA. Los resultados de FA, CA y dirección y velocidad identica-
ron como fuentes potenciales de emisión los tajos o canteras de
carbón ubicados viento arriba de las estaciones.
RESUMEN
La mina de carbón a cielo abierto del Cerrejón, ubicada al
norte de Colombia, es una de las más grandes de Suramérica.
Tiene una red de calidad de aire con más de 30 años de re-
gistro de niveles de material particulado. Entre enero 2012 y
noviembre 2013 se registraron las concentraciones medias dia-
rias de PM10 cada tres días en 8 estaciones de la red de cali-
dad de aire, utilizando muestreadores de alto volumen. De igual
manera, se estudiaron las mediciones de dirección y velocidad
del viento en ese periodo de tiempo. El promedio de las concen-
traciones de PM10 en todas las estaciones variaron entre 17,49
y 42, 01µm-3. Estos niveles no excedieron el nivel máximo dia-
rio permisible según lo establecido en la guía de la Organiza-
FACTOR ANALYSIS Y CLUSTER ANALYSIS PARA CONCENTRACIONES DE
PM10 EN MINAS DE CARBÓN A CIELO ABIERTO: CERREJÓN, COLOMBIA
Roberto Rojano, Heli Arregoces, Luis C. Angulo, Gloria Restrepo y Juan M. Marín
PALABRAS CLAVE / Análisis Multivariado / Cluster Analysis / Factor Analysis / Minas de Carbón / PM10 /
Recibido: 06/11/2014. Modicado: 20/12/2016. Aceptado: 21/12/2016.
Roberto Rojano. Ingeniero Indus-
trial, Universidad de la Guajira
(Uniguajira), Colombia. Maestría
en Ingeniería Ambiental, Uni-
versidad del Zulia, Venezuela.
Candidato a Doctor en Ingenie-
ría Ambiental, Universidad de
Antioquia (UdeA), Colombia.
Profesor, Uniguajira, Colombia.
Dirección: Grupo de Investi-
gación GISA, Facultad de Inge-
niería, Uniguajira. Km 5 Vía a
Maicao, Riohacha, Colombia.
E-mail: rrojano@uniguajira.
edu.co
Heli Arregoces. Ingeniero Am-
biental, Uniguajira, Colombia.
Maestría en Ingeniería, UdeA,
Colombia. Profesor, Unigua-
jira, Colombia.
Luis C. Angulo. Ingeniero de
Minas, Universidad Pedagógica
y Tecnológica de Colombia.
Maestría en Ciencias Ambien-
tales, Sistema Universitario
Estatal del Caribe Colombiano.
Doctor en Ingeniería Ambien-
tal, UdeA, Colombia. Profesor,
Uniguajira y Universidad
Popular del César, Colombia.
Gloria Restrepo. Ingeniera Quí-
mica, Universidad Pontificia
Bolivariana, Colombia. Doctora
en Ciencias Químicas, Uni-
versidad de Sevilla, España.
Profesora, UdeA, Colombia.
Juan M. Marín. Ingeniero Quí-
mico, Maestría en Ingeniería
Ambiental y Doctor en Cien-
cias Químicas, UdeA, Colom-
bia. Profesor, UdeA, Colombia.
45
JANUARY 2017, VOL. 42 Nº 1
FACTOR AND CLUSTER ANALYSIS FOR PM10 CONCENTRATIONS IN AN OPEN PIT COAL MINE:
CERREJÓN, COLOMBIA
Roberto Rojano, Heli Arregoces, Luis C. Angulo, Gloria Restrepo and Juan M. Marín
imum permissible daily level as laid down in the guide of the
World Health Organization. The techniques of factor analysis
(FA) and cluster analysis (CA) as well as the wind direction and
speed were used to infer the main sources of pollution and to
determine the special patterns of PM10 concentrations. The FA
identied two groups with the same concentration behavior;
these two groups have extraction pits located upwind. The re-
sults of the CA showed three differential clusters with the same
stations identied in the FA. These techniques identied the coal
pits located upwind of the stations as potential sources of PM10.
SUMMARY
The Cerrejon coal mine in the north of Colombia is one of
the largest open pits in South America. The Cerrejon has an air
quality monitoring net work with over 30 years of records of the
levels of particulate material. Between January 2012 and No-
vember 2013, the mean daily concentrations of PM10 were reg-
istered in eight stations of the air quality monitoring network
using high volume samplers. Similarly, measurements of wind
speed and direction were studied during this period. The av-
erage concentrations of PM10 in the eight stations varied in the
range 17,49-42,01µg·m-3. These levels do not exceed the max-
FACTOR ANALYSIS E CLUSTER ANALYSIS PARA CONCENTRAÇÕES DE PM10 EM MINAS DE CARVÃO
A CÉU ABERTO: CERREJON, COLÔMBIA
Roberto Rojano, Heli Arregoces, Luis C. Angulo, Gloria Restrepo e Juan M. Marín
Mundial da Saúde. As técnicas de fator analysis (FA), cluster
analysis (CA) e de direção e velocidade do vento foram utili-
zados para inferir sobre as principais fontes de contaminação
e para determinar os padrões especiais das concentrações de
PM10. O FA identicou dois grupos com três estações cada
um com o mesmo comportamento de concentrações. Estes dois
grupos têm minas (ou pedreiras) de extração vento acima de
sua localização. Os resultados de CA mostraram três clusters
diferenciáveis com as mesmas estações obtidas no FA. Os re-
sultados de FA, CA, e de direção e velocidade identicaram,
como fontes potenciais de emissão, as minas ou pedreiras de
carvão situadas vento acima das estações.
RESUMO
A mina de carvão a céu aberto do Cerrejon, localizada ao
norte da Colômbia, é uma das maiores da América do Sul.
Têm uma rede de qualidade de ar com mais de 30 anos de re-
gistro de níveis de material particulado. Entre janeiro de 2012
e novembro de 2013 se registraram as concentrações médias
diárias de PM10 cada três dias em 8 estões da rede de quali-
dade de ar, utilizando mostradores de alto volume. De mesma
forma, se estudaram as medições de direção e velocidade do
vento nesse período de tempo. A média das concentrações de
PM10 em todas as estações variaram entre 17,49 e 42,01µg·m
-
3. Estes níveis não excederam os máximos valores diários
permissíveis segundo o estabelecido na guía da Organização
utilizado para identificar fuen-
tes de contaminación de recur-
sos ambientales (Yaouti et al.,
2009; Masoud, 2014), para
identificar perfiles típicos en
concentración de material par-
ticulado PM10 durante el perío-
do de un año (Zibert y
Praznikar, 2012), y para identi-
ficar y caracterizar las fuentes
principales en un área costera
afectada por las emisiones na-
turales y antropogénicas
(Masiol et al., 2010). Por otra
parte, el CA ha sido utilizado
como estrategia en la identifi-
cación y evaluación de los me-
canismos de contaminación de
cuerpos de agua (Güler et al.,
2002; Güler y Thyne, 2004;
Cloutier et al., 2008; Monjerezi
et al., 2011; Hynds et al.,
2014). En el estudio de la cali-
dad del aire, estas técnicas han
permitido determinar tenden-
cias temporales, distribución
espacial de contaminantesy
comportamientos disímiles de
contaminación del aire (Gramsch
et al., 2006; Pires et al., 2008,
2009; Dominick et al., 2012).
Sus aplicaciones han sido efi-
caces para la toma de decisio-
nes en zonas con grandes gru-
pos de poblaciones y proble-
mas de contaminación atmosfé-
rica (Lu et al., 2011).
El objetivo de esta investiga-
ción es evaluar la utilización
de FA y CA para la gestión de
calidad de aire a partir del mo-
nitoreo de PM10 en el área del
Cerrejón, buscando identificar
áreas en la zona con comparti-
mientos de concentraciones si-
milares, factores comunes de
emisión y los mecanismo de
contaminación.
Metodología
Área de estudio
La región de explotación de
carbón a cielo abierto más
grande de Sur América se
encuentra al norte de Colom-
bia, cerca de la frontera con
Venezuela. En el departamento
de La Guajira, península co-
lombiana, está ubicada la mina
el Cerrejón, cerca al municipio
de Barrancas (Figura 1). Es
una de las minas a cielo abier-
to más grandes del mundo.
Está ubicada en las coordena-
das 11º5’2’’N y 72º40’31’’O, y
limita con los municipios de
Maicao, Albania, Hato nuevo,
Barrancas y Fonseca.
Los depósitos de carbón se
encuentran en una extensión
de 69 000ha, dentro de la
cual, hay cinco áreas de ex-
plotación (canteras) denomina-
das: tajo patilla, tajo 100, tajo
Oreganal, tajo Tabaco y tajo
La Puente.
Figura 1. Localización del área de estudio. Toamado de Rojano et al. (2013).
46 JANUARY 2017, VOL. 42 Nº 1
Muestreo
Las concentraciones de PM10
fueron registradas en la Red de
Vigilancia de calidad de aire
del Cerrejón desde enero 2012
hasta noviembre 2013. La Red
de Vigilancia de calidad de
aire es administrada por la
misma empresa, con reporte
periódico a la corporación au-
tónoma ambiental de la región.
Esta red cuenta con informa-
ción de 18 estaciones, regis-
trando mediciones de partículas
sedimentables, TSP, PM10 y
PM2,5. Para este estudio se to-
maron las estaciones con equi-
pos PM10 y que estuvieran cer-
cas a centros urbanos. Según
estos criterios, se estudiaron
las concentraciones de PM10 de
ocho sitios: Barrancas, Casitas
3, Patilla, Provincial, Roche,
Sol y Sombra, Vivienda y
Nuevo Roche. La Tabla I
muestra las coordenadas y alti-
tudes de estas estaciones,
mientras que la Figura 2 mues-
tra su localización geográfica
en la zona.
La concentración de PM10
fue determinada gravimétrica-
mente según lo establecido en
el método de referencia del
Código de Regulaciones
Federales de los EEUU (CFR,
por sus siglas en inglés) por el
cual se determina material par-
ticulado en la atmosfera <10µm
(Appendix J to Part 50, 1997).
Se empleó un muestreador de
alto volumen con cabezal PM10.
El equipo Hi-Vol se operó du-
rante las 24h, desde las 00:00
hasta las 24:00. Se utilizó fil-
tros de fibra de cuarzo. El
muestreo se desarrolló con un
flujo constante de 1,13m3·min-1.
Los filtros se colocaron antes y
después del muestreo en un
desecador por un periodo de
24h y de igual manera, se pe-
saban antes y después del
muestreo en una balanza analí-
tica con cámara de pesaje con
precisión de 1µg. Los filtros
fueron codificados con el nom-
bre de la estación, la numera-
ción del equipo y la fecha. El
equipo se calibró siguiendo el
estándar de calibración reco-
mendado por el fabricante. En
cada punto se tomaron 120
muestras en el periodo com-
prendido desde el 01/01/2012
hasta el 30/11/2013.
Meteorología
Debido a que la característi-
ca topográfica de la zona don-
de están ubicadas las ocho es-
taciones es plana, la meteorolo-
gía de los región fue caracteri-
za por los datos recogidos de
una estación representativa del
complejo carbonífero del Ce-
rrejón. La estación meteoroló-
gica del Centro de Desarrollo
Ambiental (CDA), está ubicada
en las coordenadas 11º7’59,
39”N y 72º37’49,88”O. Datos
horarios de los años 2012 y
2013 fueron procesados para
los parámetros velocidad y di-
rección del viento, temperatura,
y precipitaciones. La rosa de
viento se calculó utilizando el
programa WindRose para los
períodos de tiempo efectivo de
muestreo.
Análisis estadístico
El factor analysis (FA) se
utiliza para condensar un con-
junto de variables medibles en
un número menor de variables
transformadas llamadas factores
subyacentes o factores comunes;
adicionalmente se identifica una
estructura subyacente o patrón
de un conjunto de datos multi-
variados (Yang y Trewn, 2004).
En algunas áreas, el FA se uti-
liza para comprobar si las me-
didas de los factores son consis-
tentes con el entendimiento y la
naturaleza de las cargas y es-
tructuras factoriales, lo que im-
plica en el desarrollo de los
modelos restricciones a priori
dadas por hipótesis (Costa
et al., 2014). El modelo está
dado por la Ec. 1:
x= m + ωf + ε (1)
donde f: vector de mx1 que
contiene las variables latentes o
factores comunes, ω: matriz de
pmx que contiene las cargas
de los factores, y ε: vector de
px1 que contiene las perturba-
ciones no observadas con dis-
tribución Np(0, φ), donde φ:
matriz diagonal que no es
correlacionada con los factores.
En el modelo de FA x~(µ, S)
cada observación está dada por
la Ec. 2:
x
ij =
j
+ωjl
f
li +ω
j
2f
f
2i +
+ ωj2m fmi +εiji=1,2,,
N; j
=
1,2,
,N
(2)
La aplicación de FA a la
contaminación atmosférica es
idónea porque las variables
originales son expresadas y
están determinadas por combi-
naciones lineales de los facto-
res, a diferencia de los compo-
nentes principales, que están
definidos como combinaciones
lineales de las variables origi-
nales (Rencher y Christensen,
2012). El FA busca explicar las
covarianzas o correlaciones
entre las variables presuponien-
do un modelo estadístico for-
mal de generación de las mues-
tras dadas, donde los factores
generan las variables observa-
das (Kim y Mueller, 1978;
Basilevsky, 2009). Estas varia-
bles observadas y cuantificadas
pueden ser interpretadas con
base en los razonamientos am-
bientales de actividades propias
de la zona. El número de va-
riables se reduce a un número
mínimo de variables indepen-
dientes que describe adecuada-
mente los datos.
Por otro lado, en la técnica
de cluster analysis (CA), el
número de conglomerado pue-
de ser elegido de acuerdo al
conocimiento del usuario de la
serie de datos; sin embargo,
muchos investigadores lo deter-
minan gráficamente a través de
un dendograma o a través de
la regla
# CA
n,
donde n:
número de datos (Romesburg,
2004; Pires et al., 2009;
Masoud, 2014). Desde el análi-
sis de conglomerados se intenta
determinar los vectores de ob-
servación que son similares y
agruparlos en grupos, y mu-
chas técnicas utilizan un índice
TABLA I
COORDENADAS Y ALTITUD DE LAS ESTACIONES
Estaciones Coordenada
NCoordenada
EElevación
(msnm)
Barrancas (BAR) 170 4078 11418 38 149,6
Casitas 3 (CAS) 17030 93 1146071 162
Pa t i l la (PAT) 1713775 1152 240 115,1
Provincial (PRO) 1711039 11459 9 7 156
Roche (ROC) 1717243 1157 236 119,3
Sol y Sombra (SOL) 1724465 1170756 117,6
Vivienda (VIV) 1725454 1160 780 96,4
Nuevo Roche (NRO) 1700690 1138702 150
Est. Meteorológica (MET) 1723728 1160903 110
Figura 2. Localización de las estaciones de monitoreo en el área del
Cerrejón.
47
JANUARY 2017, VOL. 42 Nº 1
de similitud o proximidad en-
tre cada par de observaciones
(Rencher y Christensen, 2012).
Una medida conveniente de la
proximidad es la distancia en-
tre dos observaciones. Una
función de distancia común es
la distancia euclidiana entre
dos vectores x= (x1, x2, …, xp)
e y= (y1, y2, …, yp), definidas
por la Ec. 3:
d w,y
( )
=wy
( )
wy
( )
=
xjyj
( )
j=1
p
2 (3)
Para el ajuste de diferentes
varianzas y covarianzas entre
las variables p, se podría utili-
zar la distancia estadística
dada por la Ec. 4:
d x,y
( )
=xy
( )
S1xy
( )
(4)
donde S es la matriz de cova-
rianza de muestra.
Se han sugerido otras medidas
de distancia para comparar nivel,
variación y forma entre las va-
riables, por ejemplo la distancia
euclidiana al cuadrado, la cual
es d2x,y
( )
=xjyj
( )
2
j=1
p
y se
expresa por la Ec. 5:
d
2
x,y
( )
=
v
x
v
y
( )
2
+
p xy
( )
2+2vxvy1rxy
( )
(5)
donde vx
2=xjx
( )
2
j=1
p
y x =
xj
j=1
p
/ p, y, con similar expre-
sión para
v
y
2 y para y.
La co-
rrelación rxy está dada por la
Ec. 6:
rxy =
xjx
( )
yjy
( )
j=1
p
xjx
( )
2yjy
( )
2
j=1
p
j=1
p
(6)
Todo el análisis estadístico
fue desarrollado con los pro-
gramas STATGRAPHICS Cen-
turión XVI.I y R Project (i386
3.1.0). FA y CA fueron aplica-
dos para el análisis de las con-
centraciones de PM10 registra-
das en los ocho sitios seleccio-
nados. Los registros de las
concentraciones fueron estan-
darizados para tener media= 0
y desviación estándar= 1. Se
minimizó el número de varia-
bles en cada factor, con coefi-
cientes elevados en valor abso-
luto a través de rotaciones va-
rimax. El tratamiento de valo-
res faltantes se realizó por el
método de listwise. De igual
modo, para la aplicación CA se
estandarizaron los valores de
las variables. Las similitudes
para la conformación de gru-
pos fue determinada por el
método de Ward y la métrica
de distancias aplicada fue la
euclidiana al cuadrado.
Resultados y Discusión
La Figura 3 muestra la va-
riabilidad de las concentracio-
nes de PM10 medida en cada
estación en el de 2012 a 2013,
incluyendo una comparación
con la norma de calidad del
aire local. Se muestra un gran
porcentaje de variabilidad entre
los valores mínimos y máxi-
mos registrados. La estación
Casitas 3 presentó el mayor
promedio de concentraciones
entre las estaciones durante el
periodo de estudio, con valor
de 41,42µg·m-3, el segundo va-
lor máximo de concentración
diaria con un 86,34µg·m3 y es
la única estación en la que se
presentó un valor superior de
la mediana con respecto a la
media, con una desviación es-
tándar de 16,68µg·m-3, lo que
sugiere una posibilidad rela-
tivamente alta de proyecciones
superiores anuales a los
50µg·m-3. El promedio de las
concentraciones en todas las
estaciones registraron valores
superiores a 29µg·m-3, a excep-
ción de la estación Sol y
Sombra, que presentó una me-
dia de 20,37µg·m-3. La estación
Provincial registro el valor
máximo de concentración dia-
ria con 87,3m-3. Los nive-
les de PM10 registrados en las
ocho estaciones fueron inferio-
res a los obtenidos en minas
de carbón ubicadas al norte de
Colombia pero más al sur del
Cerrejón (Angulo et al., 2011;
Huertas et al., 2012). Estos ni-
veles son mayores si se compa-
ran con concentraciones repor-
tadas en zonas urbanas de ciu-
dades a menos de 180km de la
zona minera (Amaya, 2008;
Rojano et al., 2011, 2013;
Álvarez y Salazar, 2013;
Candanoza et al., 2013). Estos
niveles de concentración no
exceden el nivel máximo per-
misibles diario para PM10 del
estado colombiano, que es de
100µg·m-3 (M AVDT, 2010).
FA se aplicó como un méto-
do no paramétrico de clasifica-
ción para catalogar los sitios de
monitoreo en clases que tienen
el mismo comportamiento de
contaminación y que difieren
de otras clases. La Tabla II
muestra los resultados al apli-
car FA a las concentraciones
de PM10 en las estaciones estu-
diadas. El uso de cuatro facto-
res para los datos de concen-
traciones considera una varian-
za acumulativa cercana al
100%. Las cargas factoriales
rotadas, resaltadas en negritas,
indican las variables que in-
fluyen sobre todo el FA
correspondiente.
Para FA1 tiene significativas
contribuciones de las estacio-
nes Barrancas, Provincial y
Nuevo Roche; mientras que
FA2 fue muy cargado con los
aportes de los sitios Patilla, Sol
y Sombra, y Vivienda. FA3
tuvo importante contribución
de la estación Casitas 3, mien-
tras que FA4 fue asociado con
la estación Roche. El FA1 geo-
gráficamente representa las
estaciones ubicadas en la zona
sur, a excepción de la estación
Casitas 3, inf luenciada por 3
pits y por comunidades asenta-
das en el área. Aunque la esta-
ción Casita 3 se encuentra en
esta área, su similitud y com-
portamientos de contaminación
la ubicaron dentro de FA3, fac-
tor que probablemente está
determinado por su cercanía al
pit (llamado tajo 100) y la di-
rección predominante del
viento.
CA también fue utilizado
para agrupar los sitios de mo-
nitoreo basado en la similitud
de las concentraciones de PM10
estandarizadas. Se utilizó la
Figura 3. Boxplot de las concentraciones de PM10 en las estaciones de monitoreo.
48 JANUARY 2017, VOL. 42 Nº 1
distancia euclidiana cuadrada
para calcular la métrica de las
distancias y el método de con-
glomeración fue el método de
Ward para maximizar la homo-
geneidad dentro de los grupos.
Para ello, el método plantea
todas las posibles fusiones en
cada etapa concreta y elige la
que maximiza la homogeneidad
a través de cálculo de los cen-
troides de los grupos resultan-
tes de las posibles fusiones;
posteriormente, calcula la dis-
tancia al centroide de todas
las observaciones del grupo
(Basilevsky, 2009). La solución
con menor suma de cuadrados
total es la elegida. La Figura 4
muestra el dendograma resultan-
te de la aplicación de CA a la
concentración de masa de PM10.
Los resultados obtenidos
muestran tres grupos diferen-
ciables. El grupo CA1 está
compuesto por las estaciones
de monitoreo que integran al
FA1; los factores predominan-
tes están determinados por
asentamientos significativamen-
te poblados e influencia de los
tajos de producción de la zona
sur. El CA2 reúne como facto-
res comunes aproximaciones
cercanas a fuentes de emisio-
nes altas en el proceso minero
como vías de acarreos y remo-
ción de estéril. El grado de
impacto está relacionado con la
velocidad y dirección de vien-
tos. Igualmente, CA3 lo inte-
gran estaciones donde debido a
la dirección de los vientos sus
registros se ven poco inf luen-
ciados por las actividades mi-
neras; podrían considerarse
estaciones de fondo. La
Figura 5 muestra el comporta-
miento de la concentración de
PM10 por los grupos del CA.
Se interpretó los resultados
analizando el efecto de la
dirección del viento sobre las
concentraciones de PM10, con
el fin de inferir posibles fuen-
tes de emisiones que pueden
impactar directamente sobre
los sitios agrupados por CA y
FA. La rosa de los vientos para
el año 2012 (Figura 6a) mues-
tra una dirección predominante
de NE, pero baja velocidad
media del viento (2,82m·s-1) y
bajo porcentaje de viento en
calma (2,20%). El año 2013
(Figura 6b) registró mayor pro-
medio de velocidad de viento
(2,92m·s-1) y mayor porcentaje
de viento en calma (7,57%) que
el año 2012. El año 2013 regis-
tró diferencia del 10% en la
velocidad del viento en el in-
tervalo 3,6-8,8m·s-1 en relación
con el 2012. Este intervalo de
velocidad permite mayor dis-
persión de los contaminantes y
aumenta la dilución de los mis-
mos, haciendo que se presenten
menores concentraciones en los
receptores.
En los dos años se presentó
una frecuencia predominante
de NE y un 70% de velocidad
del viento en el rango 2,1-
5,7m·s-1. El vector de dirección
resultante de 61º (NNE) se
presentó en el 68% de los re-
sultados, lo que indica un
transporte de contaminante en
el 68% en la dirección 241º
(SOO). Estudios en zonas mi-
neras cercanas al área de estu-
dio mostraron resultados donde
los parámetros meteorológicos
de estaciones ubicadas en mi-
nería a cielo abierto al norte de
Colombia (departamento del
César) mostraron un alto nivel
de correlación (R2>0,95) con
las concentraciones de PST
TABLA II
PRINCIPALES RESULTADOS DE LA APLICACIÓN DE
FA PARA PM10 EN LAS ESTACIONES DE MONITOREO
Estaciones FA1 FA2 FA3 FA4
Barrancas 0,739 0,409 0,226 0,260
Casitas 3 0,444 0,146 0,592 0,232
Patilla 0,4 01 0,588 0,243 0, 319
Provincial 0,805 0,337 0,183 0,149
Roche 0,363 0,428 0,367 0,629
Sol y Sombra 0,134 0,656 0,165 0,162
Vivienda 0,300 0,674 0,014 0,079
Nuevo Roche 0,789 0,237 0,360 0,190
Varia nza (%) 82,08 10,43 5,69 1,49
Varianza acumulada (%) 82,08 92,50 98,19 99,68
*: Significativas contribuciones de las estaciones.
Figura 4. Dendograma estaciones de PM10.
Figura 5. Identificación de grupos de concentraciones de PM10 agrupados
por CA. CA1: grupo 1; CA2: grupo 2 y CA3: grupo 3.
Figura 6. Rosa de viento para los años 2012 (izquierda) y 2013 (derecha)
en la mina el Cerrejón.
49
JANUARY 2017, VOL. 42 Nº 1
(Huertas et al., 2014), por lo
que se puede inferir que todo
el aporte de PM10 originados
en los tajos u otras actividades
mineras, tiene alta probabilidad
de impactar a los receptores en
la dirección predominante.
En este estudio, el análisis
de velocidad y dirección del
viento muestra que el grupo
CA1, comprendido por las es-
taciones de Barrancas, Pro-
vincial y Nuevo Roche, está
directamente influenciado por
el tajo Patilla (el tajo de ma-
yor dimensión y actividad en
la mina) y el botadero Patilla
(zona de almacenaje de mate-
rial estéril). La estación
Provincial es la más cercana
al tajo Patilla (<5km) y está
ubicada directamente en la
dirección predomínate del
viento, coincidiendo con los
mayores registros y promedio
en el periodo de estudio en
esta estación. El análisis esta-
dístico de CA y FA no descri-
be un fenómeno físico de cau-
sa y efecto; por lo tanto, no se
puede utilizar para identificar
las fuentes de contaminación
influyentes en las estaciones
Barrancas, Provincial y Nuevo
Roche. Sin embargo, las prin-
cipales fuentes de emisión son
las fuentes del área, que están
asociados con las actividades
de extracción de carbón, y se
puede inferir una influencia
del tajo y el botadero Patilla
en el aporte de PM10.
El grupo CA2, conformado
por las estaciones Las Casitas
3, Patilla y Roche, están in-
fluenciado por los tajos: Ore-
TABLA III
FRECUENCIAS DE DIRECCIÓN DE VIENTO EN LAS CONCENTRACIONES
DE PM10 REGISTRADAS EN EL 2012 Y 2013, EN %
Dirección
del viento
Barrancas Casitas 3 Patilla Provincial
0-20 21-40 >40 0-20 21- 40 >40 0-20 21-40 >40 0-20 21-40 >40
N-NE 0,0 6,6 0,0 0,0 3,3 3,3 0,0 6,6 0,0 0,0 3,3 3,3
NE-E 6,6 39,3 9,8 6,6 16,4 32,8 8,2 39,3 8,2 0,0 34,4 21,3
E-SE 11,5 13,1 1,6 6,6 9,8 9,8 4,9 16 ,4 4,9 6,6 16,4 3,3
SE-S 1,6 4,9 3,3 1,6 3,3 4,9 0,0 4,9 4,9 1,6 4,9 3,3
Otros 1,6 0,0 0,0 0,0 1,6 0,0 0,0 1,6 0,0 1,6 0,0 0,0
Roche Sol y Sombra Vivienda Nuevo Roche
0-20 21-40 >40 0-20 21- 40 >40 0-20 21-40 >40 0-20 21-40 >40
N-NE 1,8 3,6 0,0 44,3 0,0 0,0 0,0 6,6 0,0 1,6 3,3 1,6
NE-E 5,5 43,6 3,6 6,6 9,8 1,6 1,6 8,2 14,8 3,3 39,3 13,1
E-SE 9,1 16,4 3,6 16,4 8,2 1,6 4,9 11,5 9,8 11, 5 9,8 1,6
SE-S 1,8 9,1 0,0 3,3 6,6 0,0 1,6 39,3 0,0 3,3 6,6 0,0
Otros 0,0 1,8 0,0 0,0 1,6 0,0 0,0 1,6 0,0 1,6 0,0 0,0
ganal, 100, Comunero, Patilla
y Caypa. La estación Las
Casitas 3 está a menos de
3km de los tajos Comunero y
100, y está directamente en el
vector de dirección resultante
del viento de 241º (SOO). Esta
estación es la que presenta las
mayores concentraciones en
este estudio. Entre esta esta-
ción y los tajos mencionados
no hay fuentes significativas
de emisión de PM10, por lo
que se concluye que el aporte
potencial de material particu-
lado en esta esta estación es
producido por las actividades
de extracción de los tajos
Comunero y 100.
Por último, el grupo CA3
está integrado por las estacio-
nes Sol y Sombra, y Vivienda.
Estas estaciones están ubicadas
viento arriba del área de ex-
tracción. Solo son afectadas
cuando se presentan vientos en
la dirección NNO y, según el
análisis meteorológico, esta
dirección registró una frecuen-
cia de 2% en el periodo 2012 y
2013. Se puede inferir que es-
tas dos estaciones captan apor-
te de PM10 de actividades nor-
males en centros urbanos, sea
transporte, resuspensión de
material, manipulación mecáni-
ca de suelos y otros. Los resul-
tados de estas dos estaciones
son parecidos a los reportados
por Mendoza y Rojano (2010)
en zonas rurales sin interven-
ción minera a 20km al oeste
de la mina el Cerrejón.
La Tabla III presenta el por-
centaje de frecuencia en las
concentraciones, registradas en
2012, con referencia a las di-
recciones del viento. La
Figura 6 muestra la rosa de
viento para los años 2012 y
2013. Los resultados revelan
que las fuentes ubicadas
NE–E ejercen mayores in-
fluencias significativas sobre
las estaciones ubicadas en la
zona sur. Las concentraciones
pertenecientes a las estaciones
que integran a CA1 se vieron
influenciadas en gran manera
por la dirección del viento. La
dirección NE-E fue la predo-
minante, con valores de fre-
cuencias >34% entre los inter-
valos de concentraciones de
21-40µg·m-3, direcciones que
sugieren fuentes de emisiones
debido a los pits. La estación
Casita 3 muestra que en ma-
yores frecuencia del viento
proveniente de NE–E se al-
canzan valores >40µg·m-3. El
CA3 infiere que alcanza con-
centraciones relativas prove-
nientes de los pits de la zona
norte.
La existencia de diferentes
comportamientos de contami-
nación del aire en la red de
monitoreo puede ser explicada
por la ubicación geográfica de
las fuentes de emisiones com-
puestas por los diferentes ta-
jos, por la variabilidad de las
direcciones del viento, y el
tipo de actividad en la zona.
El número de grupos de cen-
tros con similares comporta-
miento de la contaminación
fue influenciado por las carac-
terísticas geográficas de la
ubicación de las fuentes y las
tasas de emisiones de la zona;
esto significa que los sitios
pueden ser agrupados de
acuerdo a este comportamien-
to específico. Se muestra que
FA y CA tienen un gran po-
tencial para la gestión de aire
en sistemas de monitoreo de
la calidad de aire.
Conclusiones
El factor analysis (FA) mos-
tró que la agrupación de las
estaciones de PM10 en la zona
está definida por cuatro facto-
res que contiene el 99,68% de
la varianza acumulada de los
datos originales, indicando
una fuente principal de conta-
minación de PM10 (operaciones
mineras en los tajos). El FA3
mostró solamente el sitio de
monitoreo de las Casitas 3,
estación donde se presentaron
los mayores niveles de PM10.
El cluster analysis (CA) indicó
que las estaciones de Barran-
cas, Provincial y Nuevo Roche
presentan comportamientos
similares. Su explicación está
sustentada por encontrarse en
un área influenciada por las
mismas actividades de minería
en la zona y el asentamiento
de zonas residenciales cerca-
nas. Este método agrupó tres
grupos, donde el CA1 pertene-
ce a FA1 y donde CA3 repre-
senta los sitios de monitoreo
con menor inf luencia de las
actividades mineras por las
direcciones predominantes de
los vientos (dirección NE–E).
En resumen, la contribución
significativa de polvo mineral
se debe a las fuentes locales
de operación mineras.
AGRADECIMIENTOS
Los autores agradecen a
Colciencias-Cerrejón, proyecto
código 1115-524-30465, a la
Universidad de Antioquia y a
la Universidad de la Guajira
por el apoyo para el desarrollo
de este trabajo.
REFERENCIAS
Amaya M. (2008). Estudio de Emi-
siones Atmosféricas para el
Municipio Riohacha en los
Contaminantes Partículas Sus-
pendidas Totales (PST) y Meno-
res de 10 micras PM10. K 2
Ingeniería-Corporación Autó-
50 JANUARY 2017, VOL. 42 Nº 1
noma regional de La Guajira.
Riohacha, Colombia. 116 pp.
Angulo LC, Huertas JI, Restrepo
GM (2011) Caracterización de
Partículas Suspendidas (PST) y
Partículas Respirables (PM10)
producidas en Áreas de Explo-
tación Carbonífera a Cielo Abier-
to. Inf. Tecnol. 22(4): 23-34.
Álvarez ML, Salazar A (2013)
Síntomas respiratorios y función
pulmonar en niños de 6 a 14
años de edad y su relación con
la contaminación por material
particulado PM10 en Santa marta
Colombia. Rev. Esp. Salud Públ.
87: 239-246.
Basilevsky AT (2009) Statistical
Factor Analysis and Related
Methods: Theory and Applica-
tions. Wiley. Winnipeg, Canadá.
768 pp.
Candanoza S, Goribar LL, García
F (2013) Relación particulas
respirables (PM10 )/particulas
suspendidas totales (PST) en
Santa Marta (Colombia). Dyna
179: 157-164.
Cloutier V, Lefebvre R, Therrien R,
Savard MM (2008) Multivariate
statistical analysis of geochemi-
cal data as indicative of the hy-
drogeochemical evolution of
groundwater in a sedimentary
rock aquifer system. J. Hydrol.
353: 294-313.
Costa DR, Lachosa VH, Bazanb JL,
Azevedoa CL (2014) Estimation
methods for multivariate tobit
confirmatory factor analysis.
Comput. Stat. Data Anal.
79: 248-260.
Dominick D, Juahir H, Latif MT,
Zain SM, Aris AZ (2012)
Spatial assessment of air quali-
ty patterns in Malaysia using
multivariate analysis. At mos.
Environ. 60: 172-181.
Gramsch E, Cereceda-Balic F, Oyola
P, Von Baer D (2006) Exami-
nation of pollution trends in
Santiago de Chile with cluster
analysis of PM10 and Ozone data.
Atmos. Environ. 40: 5464-5475.
Güler C, Thyne GD (2004) Hy-
drologic and geologic factors
controlling surface and ground-
water chemistry in Indian
Wells-Owens Valley area,
southeastern California, USA. J.
Hydrol. 285: 177-198.
Güler C, Thyne GD, McCray JE,
Turner KA (2002) Evaluation of
graphical and multivariate sta-
tistical methods for classifica-
tion of water chemistry data.
Hydrogeol. J. 10: 455-474.
Hendryx M (2008) Mortality rates in
Appalachian coal mining coun-
ties: 24 years behind the nation.
Environ. Justice 1: 5-11.
Hendryx M, Zullig KJ (2009)
Higher coronary heart disease
and heart attack morbidity in
Appalachian coal mining re-
gions. Prev. Med. 49: 355-359.
Hinwood A, Callan AC, Heywor th J,
McCafferty P, Sly PD (2014)
Children’s personal exposure
to PM10 and associated metals
in urban, rural and mining acti-
vity areas. Chemosphere 108:
125-133.
Huertas J, Huertas M, Solís D (2012)
Characterization of airborne
particles in an open pit mining
region. Sci. Total Environ.
423: 39- 46.
Huertas JI, Huertas ME, Cervantes
G, Díaz J (2014) Assessment of
the natural sources of particula-
te matter on the opencast mines
air quality. Sci. Total Environ.
493: 1047-1055.
Hynds P, Misstear BD, Gill LW,
Murphy HM (2014) Groundwater
source contamination mecha-
nisms: Physicochemical profile
ing, risk factor analysis and mul-
tivariate modelling. J. Contam.
Hydrol. 159: 47-56.
Kim JO, Mueller CW (1978) Factor
Analysis: Statistical Methods
and Practical. Sage. Thousand
Oaks, CA, EEUU. 88 pp.
Lu WZ, He HD, Dong LY (2011)
Performance assessment of air
quality monitoring networks
using principal component
analysis and cluster analysis.
Build. Environ. 6: 577-583.
Makra L, Matyasovszky I, Guba Z,
Karatzas K, Anttila P (2011)
Monitoring the long-range
transport effects on urban PM10
levels using 3D clusters of bac-
kward trajectories. At mos .
Environ. 45: 2630-2641.
Masiol M, Rampazzo G, Ceccato D,
Squizzato S, Pavoni B (2010)
Characterization of PM10 sour-
ces in a coastal area near
Venice (Italy): An application of
factor-cluster analysis. Chemos-
phere 80: 771-778.
Masoud AA (2014) Groundwater
quality assessment of the sha-
llow aquifers west of the Nile
Delta (Egypt) using multivariate
statistical and geostatistical te-
chniques. J. Afr. Earth Sci.
95: 123 -137.
Mendoza YI, Rojano R (2010)
Monitoreo de la Calidad de Aire
(Partículas Menores de 10 micras
(PM10), Polvo Sediméntales y
Gases SO2 y NO2); en la Po-
blación de Angostura-Municipio
de Hatonuevo. Departamento de
La Guajira. Instituto de Estudios
Ambientales. Universidad de La
Guajira. Colombia. 180 pp.
MAVDT (2010) Resolución 0610 de
2010. Por la cual se Establece
la Norma de Calidad del Aire o
Nivel de Inmisión, para todo el
Territorio Nacional en Condi-
ciones de Referencia. Ministerio
de Ambiente, Vivienda y Desa-
rrollo Territorial Diario Oficial
47.672 de abril 6 de 2010,
17 pp. Bogotá, Colombia.
Monjerezi M, Vogt RD, Aagaard
P, Saka JD (2011) Hydro-
geochemical processes in an
area with saline groundwater in
lower Shire River valley,
Malawi: an integrated applica-
tion of hierarchical cluster and
principal component analyses.
Appl. Geochem. 26: 1399-1413.
Pires JCM, Sousa SIV, Pereira MC,
Alvim-Ferraz MC, Martins FG
(2008) Management of air qua-
lity monitoring using principal
component and cluster analysis -
Part I: SO2 and PM10. Atmos .
Environ. 42: 1249-1260.
Pires JCM, Pereira MC, Alvim-
Ferraz MC, Martins FG (2009)
Identification of redundant air
quality measurements through
the use of principal component
analysis. Atmos. Environ.
43: 3837-3842.
Qu Y, Tang Y, Cao D, Wu F, Liu J,
Lu G, Zhang Z, Xia Z (2007)
Genetic polymorphisms in al-
veolar macrophage response-
related genes, and risk of sili-
cosis and pulmonary tuberculo-
sis in Chinese iron miners. Int.
J. Hygiene Environ. Health
210: 679 -689.
Rencher AC, Christensen WF (2012)
Methods of Multivariate Ana-
lysis. 3a ed. Wiley. Hoboken,
NJ, EEUU. 800 pp.
Rojano R, Angulo LC, Restrepo G
(2013) Niveles de Partículas
Suspendidas Totales (PST), PM10
y PM2.5 y su Relación en
Lugares Públicos de la Ciudad
Riohacha, Caribe Colombiano.
Inf. Tecnol. 24: 37-46.
Rojano R, Pérez J, Deluque J (2011)
Análisis comparativo de las me-
diciones de material particulado
PM10. Rev. Fac. Ing. Univ.
Antioquia 58: 27-35.
Romesburg C (2004) Cluster
Analysis for Researchers (Vol.
12), Lulu Press. Morrisville,
NC, EEUU. 334 pp.
UPME (2006) Plan Nacional para el
Desarrollo Minero. Visión Año
2019. Unidad de Planeación
Minero Energética. Ministerio
de Minas y Energías. Bogotá,
Colombia. 125 pp.
Yang K, Trewn J (2004) Multi-
variate Statistical Methods in
Quality Management. McGraw
Hill. Nueva York, NY, EEUU.
229 pp.
Yaouti FE, Mandour EA, Khattach
D, Benavente J, Kaufmann O
(2009) Salinization processes in
the unconfined aquifer of Bou-
Areg (NE Morocco): A geosta-
tistical, geochemical, and tomo-
graphic study. Appl. Geochem.
24: 16 -31.
Zibert J, Praznikar J (2012) Cluster
analysis of particulate matter
(PM10) and black carbon (BC)
concentrations. Atmos. Environ.
5: 1-12.
... Coal is mainly extracted in the Caribbean region (MAVDT, 2004), and El Cerrejón coal mine in La Guajira is one of the largest open-pit mines in the world, contributing 38% of national production and more than 50% of coal exports (Rojano, Arregoces, Angulo, Restrepo, & Marín, 2017). ...
Article
Open coal mining eliminates vegetation, alters physical and chemical characteristics of soils, and therefore limit the establishment of native vegetation by lack of sufficient moisture, increase bulk density and low organic matter content. Restoration of extremely degraded areas through plantation of fast growing species is expected to accelerate the recovers of soil organic matter and nutrient cycles. The purposes of this study were to compare intra‐system cycling of C, N, P and base cations in native and restored forests at an open‐cast coal mine in a dry region of Colombia. Leaf‐fall, standing leaf litter, and their N, P, Ca, Mg and K contents were measured for one year in native forests and restored forests of various ages (7, 10, 21 years). The exploitation of coal in La Guajira degraded soil fertility, and, although tree planting was sufficient to achieve the partial recovery of soil chemistry and N cycling relative to reference conditions (i.e., native forest), a P deficiency in forest function remained unresolved even 21 years after restoration. The restoration of biogeochemical processes, particularly of critical processes of the P cycle, requires additional human interventions (such as the application of nutrient‐rich litterfall from native forests of the region) that favor nutrient dynamics and lead to the recovery of a self‐sustaining ecosystem. Thus, multiple efforts are needed for the restoration of these dryland forests to recover ecosystem services (such as soil fertility) that improve C sequestration and help mitigate climate change.
Article
Full-text available
Extensive urban, agricultural and industrial expansions on the western fringe of the Nile Delta of Egypt have exerted much load on the water needs and lead to groundwater quality deterioration. Documenting the spatial variation of the groundwater quality and their controlling factors is vital to ensure sustainable water management and safe use. A comprehensive dataset of 451 shallow groundwater samples were collected in 2011 and 2012. On-site field measurements of the total dissolved solids (TDS), electric conductivity (EC), pH, temperature, as well as lab-based ionic composition of the major and trace components were performed. Groundwater types were derived and the suitability for irrigation use was evaluated. Multivariate statistical techniques of factor analysis and K-means clustering were integrated with the geostatistical semi-variogram modeling for evaluating the spatial hydrochemical variations and the driving factors as well as for hydrochemical pattern recognition.
Article
Full-text available
An integrated domestic well sampling and “susceptibility assessment” programme was undertaken in the Republic of Ireland from April 2008 to November 2010. Overall, 211 domestic wells were sampled, assessed and collated with local climate data. Based upon groundwater physicochemical profile, three clusters have been identified and characterized by source type (borehole or hand-dug well) and local geological setting. Statistical analysis indicates that cluster membership is significantly associated with the prevalence of bacteria (p = 0.001), with mean E. coli presence within clusters ranging from 15.4% (Cluster-1) to 47.6% (Cluster-3). Bivariate risk factor analysis shows that on-site septic tank presence was the only risk factor significantly associated (p < 0.05) with bacterial presence within all clusters. Point agriculture adjacency was significantly associated with both borehole-related clusters. Well design criteria were associated with hand-dug wells and boreholes in areas characterized by high permeability subsoils, while local geological setting was significant for hand-dug wells and boreholes in areas dominated by low/moderate permeability subsoils. Multivariate susceptibility models were developed for all clusters, with predictive accuracies of 84% (Cluster-1) to 91% (Cluster-2) achieved. Septic tank setback was a common variable within all multivariate models, while agricultural sources were also significant, albeit to a lesser degree. Furthermore, well liner clearance was a significant factor in all models, indicating that direct surface ingress is a significant well contamination mechanism. Identification and elucidation of cluster-specific contamination mechanisms may be used to develop improved overall risk management and wellhead protection strategies, while also informing future remediation and maintenance efforts.
Article
Praise for the Second Edition. "This book is a systematic, well-written, well-organized text on multivariate analysis packed with intuition and insight . . . There is much practical wisdom in this book that is hard to find elsewhere." -IIE Transactions. Filled with new and timely content, Methods of Multivariate Analysis, Third Edition provides examples and exercises based on more than sixty real data sets from a wide variety of scientific fields. It takes a "methods" approach to the subject, placing an emphasis on how students and practitioners can employ multivariate analysis in real-life situations. This Third Edition continues to explore the key descriptive and inferential procedures that result from multivariate analysis. Following a brief overview of the topic, the book goes on to review the fundamentals of matrix algebra, sampling from multivariate populations, and the extension of common univariate statistical procedures (including t-tests, analysis of variance, and multiple regression) to analogous multivariate techniques that involve several dependent variables. The latter half of the book describes statistical tools that are uniquely multivariate in nature, including procedures for discriminating among groups, characterizing low-dimensional latent structure in high-dimensional data, identifying clusters in data, and graphically illustrating relationships in low-dimensional space. In addition, the authors explore a wealth of newly added topics, including: Confirmatory Factor Analysis, Classification Trees, Dynamic Graphics, Transformations to Normality, Prediction for Multivariate Multiple Regression, Kronecker Products and Vec Notation. New exercises have been added throughout the book, allowing readers to test their comprehension of the presented material. Detailed appendices provide partial solutions as well as supplemental tables, and an accompanying FTP site features the book's data sets and related SAS® code. Requiring only a basic background in statistics, Methods of Multivariate Analysis, Third Edition is an excellent book for courses on multivariate analysis and applied statistics at the upper-undergraduate and graduate levels. The book also serves as a valuable reference for both statisticians and researchers across a wide variety of disciplines.
Article
Particulate matter is the main air pollutant in open pit mining areas. Preferred models that simulate the dispersion of the particles have been used to assess the environmental impact of the mining activities. Results obtained through simulation have been compared with the particle concentration measured in several sites and a coefficient of determination R(2)<0.78 has been reported. This result indicates that in the open pit mining areas there may be additional sources of particulate matter that have not been considered in the modeling process. This work proposes that the unconsidered sources of emissions are of regional scope such as the re-suspension particulate matter due to the wind action over uncovered surfaces. Furthermore, this work proposes to estimate the impact of such emissions on air quality as a function of the present and past meteorological conditions. A statistical multiple regression model was implemented in one of the world's largest open pit coal mining regions which is located in northern Colombia. Data from 9 particle-concentration monitoring stations and 3 meteorological stations obtained from 2009 to 2012 were statistically compared. Results confirmed the existence of a high linear relation (R(2)>0.95) between meteorological variables and particulate matter concentration being humidity, humidity of the previous day and temperature, the meteorological variables that contributed most significantly in the variance of the particulate matter concentration measured in the mining area while the contribution of the AERMOD estimations to the short term TSP (Total Suspended Particles) measured concentrations was negligible (<5%). The multiple regression model was used to identify the meteorological condition that leads to pollution episodes. It was found that conditions drier than 54% lead to pollution episodes while humidities greater than 70% maintain safe air quality conditions in the mining region in northern Colombia.
Article
Tobit confirmatory factor analysis is particularly useful in analysis of multivariate data with censored information. Two methods for estimating multivariate Tobit confirmatory factor analysis models with covariates from a Bayesian and likelihood-based perspectives are proposed. In contrast with previous likelihood-based developments that consider Monte Carlo simulations for maximum likelihood estimation, an exact EM-type algorithm is proposed. Also, the estimation of the parameters via MCMC techniques by considering a hierarchical formulation of the model is explored. Bayesian case deletion influence diagnostics based on the qq-divergence measure and model selection criteria is also developed and considered in the analysis of a real dataset related to the education assessment field. In addition, a simulation study is conducted to compare the performance of the proposed method with the traditional confirmatory factor analysis. The results show that both methods offer more precise inferences than the traditional confirmatory factor analysis, which ignores the information about the censoring threshold.
Article
There has been limited study of children’s personal exposure to PM10 and associated metals in rural and iron ore mining activity areas where PM10 concentrations can be very high. We undertook a small study of 70 children where 13 children were recruited in an area of iron ore mining processing and shipping, 15 children from an area in the same region with no mining activities, and 42 children in an urban area. Each child provided a 24 h personal exposure PM10 sample, a first morning void urine sample, a hair sample, time activity diary, and self administered questionnaire. Children’s 24 h personal PM10 concentrations were low (median of 28 μg m−3 in the mining area; 48 μg m−3 in the rural area and 45 μg m−3 in the urban area) with corresponding outdoor PM10 concentrations also low. Some very high personal PM10 concentrations were recorded for individuals (>300 μg m−3) with the highest concentrations recorded in the mining and rural areas in the dry season. PM10 concentrations were highly variable. Hair aluminium, cadmium and manganese concentrations were higher in the iron ore activity area, while hair mercury, copper and nickel concentrations were higher in the urban area. Factors such as season and ventilation appear to be important but this study lacked power to confirm this. These results need to be confirmed by a larger study and the potential for absorption of the metals needs to be established along with the factors that increase exposures and the potential for health risks arising from exposure.
Article
The number of sites that constitute the air quality monitoring network (AQMN) of Oporto Metropolitan Area (Oporto-MA) should be optimised, aiming to reduce significant associated expenses. Ideally, only one monitoring site should operate in an area characterized by specific air pollution behaviour. The global aim of this study was to evaluate the performance of statistical methods for the more efficient management of AQMNs. The specific objectives were: (i) to identify city areas with similar air pollution behaviours; and (ii) to locate emission sources. Two statistical techniques, principal components analysis (PCA) and cluster analysis (CA), were applied to the mass concentrations of sulphur dioxide (SO2) and particulate matter with an aerodynamic diameter less than 10 μm (PM10), collected in the AQMN of Oporto-MA from January 2003 to December 2005.
Article
Because of the high levels of pollution that Santiago de Chile experiences every year in winter, the government has set up an air quality monitoring network. Information from this network is employed to alert people about the quality of air and to enforce several control strategies in order to limit pollution levels. The monitoring network has 8 stations that measure PM10, carbon monoxide (CO), sulphur dioxide (SO2), ozone (O3) and meteorological parameters. Some stations also measure nitrogen mono- and dioxide (NOx), fine particles (PM2.5) and carbon. In this study we have examined the PM10 and O3 data generated by this network in the year 2000 in order to determine the seasonal trends and spatial distribution of these pollutants over a year's period. The results show that concentration levels vary with the season, with PM10 being higher in winter and O3 in summer. All but one station, show a peak in PM10 at 8:00 indicating that during the rush hour there is a strong influence from traffic, however, this influence is not seen during the rest of the day. In winter, the PM10 maximum occurs at 24:00 h in all stations but Las Condes. This maximum is related to decreased wind speed and lower altitude of the inversion layer. The fact that Las Condes station is at a higher altitude than the others and it does not show the PM10 increase at night, suggest that the height of the inversion layer occurs at lower altitude. Cluster analysis was applied to the PM10 and O3 data, and the results indicate that the city has four large sectors with similar pollution behavior. The fact that both pollutants have similar distribution is a strong indication that the concentration levels are primarily determined by the topographical and meteorological characteristics of the area and that pollution generated over the city is redistributed in four large areas that have similar meteorological and topographical conditions.