Content uploaded by Yanina Noemí Bellini Saibene
Author content
All content in this area was uploaded by Yanina Noemí Bellini Saibene on Oct 22, 2016
Content may be subject to copyright.
Catálogo de datos Geoespaciales del Instituto Nacional de
Tecnología Agropecuaria
Ramos, L.; Mercuri, P.; Bellini Saibene, Y.; Pizarro, M. J.
Instituto Nacional de Tecnología Agropecuaria – EEA Anguil, Anguil, Argentina
Resumen
El Instituto Nacional de Tecnología Agropecuaria (INTA) es un importante productor de información
georreferenciada. Para lograr un inventario de dichos productos se ha desarrollado el Catálogo de Datos
Geoespaciales del INTA utilizando tecnología .NET, JavaScript y AJAX como herramientas de desarrollo y
SQL Server 2000 como gestor de base de datos. Esta aplicación permite cargar y consultar a través de una
interfaz web cliente/servidor la información georreferenciada disponible. Con esto se busca dar a conocer los
productos generados por la institución y evitar también la duplicación de esfuerzos.
Palabras Clave: Información georreferenciada, Catálogo, inventario, mapas, metadatos
Introducción
El Instituto Nacional de Tecnología Agropecuaria (INTA) produce gran cantidad de
información georreferenciada tales como mapas, imágenes satelitales, aerofotografías,
bases de datos y productos integrados, en diversas áreas temáticas como Uso de suelos,
Hidrología, Ecología, Agrometeorología, Geomorfología, entre otros. Esta información es
generada por proyectos locales o regionales, por lo que en reiteradas oportunidades se
produce duplicación de trabajos (y por ende de esfuerzos) al ignorar los productos
realizados por otros proyectos o unidades de la institución. Para resolver esta problemática,
el proyecto Sistema de Datos Geoespaciales del INTA desarrolló un Catálogo único de
información georreferenciada del INTA en el que se puede cargar y consultar de manera
eficiente, a través de una interfaz web cliente/servidor, qué productos geoespaciales han
sido generados en la institución y dónde están. Asimismo, provee datos propios de la
información georreferenciada (metadatos) tales como Autores, Área de cobertura, Sistemas
de coordenadas y referencias, entre otros. El Catálogo incluye más de 30 atributos Norma
ISO 19115 [1], TC/211 [2], FGDC [3]. Esto permitió que la Institución cuente con una
herramienta, inexistente hasta entonces, que le posibilite encontrar de manera sencilla todos
los productos georreferenciados disponibles y sus características, y, tal vez, lo más
importante, proveer a quienes lo requieran, los datos de contacto de quienes poseen los
productos georreferenciados, a los efectos de poder comunicarse para conseguir esa
información evitando la duplicación de esfuerzos en la producción de un trabajo.
Elementos del Trabajo y Metodología
Una vez definidos los datos a relevar se realizó el desarrollo del sistema utilizando
la metodología de Análisis Estructurado de Sistemas. Las fases del ciclo de vida del
proyecto de desarrollo de software son: Análisis (requisitos), Diseño, Codificación,
Pruebas, Integración y Operación – Mantenimiento [4]. Estas fases se ejecutaron utilizando
el ciclo de vida incremental (figura 1), porque permite descomponer el sistema en
diferentes sub-sistemas, para cada uno de los cuales se aplica un ciclo de desarrollo, en este
caso de cascada. Este ciclo de vida permitió disponer de los sub-sistemas operativos en
tiempos mucho menores a los que implica tener todo el sistema funcionando y desarrollar
más de un sub-sistema al mismo tiempo, incorporando nuevos requisitos no disponibles al
iniciar el proyecto.
Requisitos: el relevamiento de requisitos de software fue realizado en sucesivas reuniones
con el coordinador del proyecto y otros referentes del área (estos últimos usuarios del
sistema de carga). Allí se evaluaron y definieron los principales objetivos del sistema.
Dentro del relevamiento de requisitos se evaluaron también cuáles serían las variables a
almacenar. Para esto se tuvieron en cuenta diferentes modelos de metadatos que están
actualmente en uso. Dada la cantidad de variables posibles de relevar y su diversificación,
la tarea de selección de las mismas fue bastante discutida. El conjunto de variables
seleccionado esta conformado por más de 30 atributos correspondientes a la Norma ISO
19115, TC/211, FGDC. Estas variables fueron agrupadas en cuatro capítulos (Identificación
de datos geoespaciales, Características de los datos, Área de cobertura y Otras
consideraciones a la capa temática) y se diagramó una planilla en formato pdf (figura 2).
Otro requisito definido en las reuniones fue el de la arquitectura del sistema. Debido a la
cantidad de nodos participantes y su distribución, la utilización de una arquitectura con base
de datos centralizada fue la opción elegida, aunque se propuso la carga de bases de datos
locales en cada nodo y una posterior consolidación en una base de datos única. El
argumento era que la conectividad de la institución no soportaría una carga masiva de
información por parte de todos los nodos. Este diseño fue rechazado, ya que la carga en
distintas bases y consolidación posterior es una tarea siempre propensa a errores y que lleva
mucho tiempo de realización, que impactaría negativamente en la consulta del catálogo.
Diseño: con estos elementos se realizó el diseño de la solución, modelando la misma por
medio de casos de usos. También se diseñaron las bases de datos utilizando el modelo de
entidad – relación y se generaron los correspondientes diccionarios de datos. El diseño
proporcionó una base sólida para realizar la planificación del ciclo de desarrollo de cada
sub-sistema.
Codificación: el ambiente de desarrollo (figura 7) esta compuesto por un desarrollador con
su PC, su IDE y una copia local de la base de datos utilizando la versión MSDE del SQL
Server 2000. Los sistemas se programaron utilizando tecnología .NET con el Framework
2.0. El lenguaje de programación principal es Visual Basic .NET. La tecnología de acceso a
datos utilizada es ADO.NET. La interfaz de usuario son aplicaciones web ASP.NET con
Java Script y AJAX. El gestor de base de datos utilizado es SQL Server 2000 (se utilizan
procedimientos almacenados) y el IDE de desarrollo utilizado es Visual Studio 2003 y
Visual Web Developer 2008 Express. Se utilizan controles del paquete Component One
Studio para realizar gráficos y reportes.
Pruebas: el objetivo de las pruebas es verificar que el desarrollo fue correcto. En esta tarea
se involucró a:
1. Responsable del desarrollo: Es el encargado de realizar el desarrollo del sistema.
Utiliza el ambiente de pruebas (figura 7) que está compuesto por una computadora
configurada de forma idéntica a los servidores de producción (Windows 2003 Server,
Internet Information Server 6.0, SQL Server 2000, Microsoft Framework 1.0 a 2.0). Solo se
puede acceder al mismo por medio del escritorio remoto.
2. Personal de sistemas que no participó del desarrollo: Dado que es importante contar
con una “visión externa” a la del desarrollador es que se realizaron las pruebas con
profesionales de sistemas que no lo han desarrollado. El objetivo es encontrar errores de
funcionamiento, en la interfaz de usuario y en la usabilidad del sistema.
3. Una muestra de los futuros usuarios del sistema: tiene el mismo objetivo que el
anterior, pero los problemas que se pueden detectar están más orientados a la funcionalidad
de la interfaz de usuario, a los términos utilizados en la misma, usabilidad, velocidad de
respuesta, etc. Utilizan una versión que ya pasó por los grupos 1 y 2. El grupo estuvo
compuesto por referentes del área, pertenecientes a otras unidades, y el mismo coordinador
del proyecto. Esta prueba determinó que el problema de conectividad de la Institución iba a
ser un obstáculo a afrontar durante la carga de datos. Más allá de este factor, las pruebas de
funcionalidad y usabilidad del sistema fueron satisfactorias.
Las pruebas de testeo que se realizaron abarcan:
1. Testeo de datos erróneos: se ingresan una serie de datos erróneos en el sistema para
chequear las validaciones del mismo y ver como reacciona a estos datos en la ejecución.
2. Testeo de datos correctos: se ingresan una serie de datos correctos y verdaderos en el
sistema para chequear las validaciones del mismo, cálculos, informes y ejecución del
sistema.
3. Testeo de performance: se corre el sistema en diferentes horarios, con diferentes
plataformas y desde diferentes localizaciones para chequear el rendimiento del mismo y
detectar posibles inconvenientes.
Finalmente, una vez incorporadas las sugerencias realizadas por los equipos 2 y 3 se instala
una versión en el ambiente de prueba para testear la integración con el resto de las partes
del sistema. Si las pruebas funcionan correctamente el sistema se publica en el ambiente de
producción. Todas las pruebas realizadas quedan documentadas.
Integración: el ambiente de producción (figura 3) se encuentra en el datacenter de la firma
GigaRed, sito en la ciudad de Buenos Aires. El servidor solo puede ser accedido por medio
del escritorio remoto. Se seleccionó esta localización debido a que, por el momento,
ninguna unidad INTA participante del proyecto puede garantizar una velocidad de
conexión ideal para realizar la carga de datos sin inconvenientes. Allí se cuenta con una
conexión de 8 Mb simétricos, con una conexión de fibra óptica, que satisface las demandas
del sistema.
El Catálogo de datos geoespaciales del INTA se integra con dos sistemas desarrollados para
la RIAN. Estos proveen una serie de funcionalidades fundamentales que todo buen sistema
debe tener:
1. Sistema de permisos, grupos y sistemas: esta aplicación realiza la validación del
usuario y su contraseña, le asigna permisos según el grupo al que pertenece y mantiene
actualizado los usuarios, grupos, instituciones, permisos, módulos, etc. La contraseña del
usuario se guarda encriptada en la base de datos y es imposible recuperarla a texto plano.
2. Sistema de auditoria: registra todo lo que hace ese usuario con los sistemas que utiliza
y permite la consulta de dichas transacciones. En el caso de acciones de manipulación de
datos, se captura la imagen de la pantalla al momento de realizar la acción y se almacena en
formato html, en uno de los discos del servidor. Esta captura puede ser visualizada a la hora
de consultar las transacciones de los usuarios, facilitando la tarea de la auditoria. También
discrimina si la transacción ha producido un error o si ha concluido satisfactoriamente. Esto
es muy importante para el desarrollador, ya que cuenta con una herramienta de seguimiento
del comportamiento del sistema.
El uso de estos sistemas complementarios responde a una política del grupo de
desarrollo de realizar componentes o módulos que se puedan reutilizar y permitan disminuir
los tiempos de desarrollo.. Por otra parte, al haberlos implementado en sistemas anteriores
son menos propensos a fallos, ya que han sido utilizados y depurados en numerosas
ocasiones. Otra ventaja es que, a la hora de realizar modificaciones en los sistemas base, los
cambios se verán reflejados en todos los sistemas consumidores, de manera transparente.
Operación y Mantenimiento:
Antes de realizar la publicación del sistema se realizó una reunión con todos los
usuarios. El objetivo de la misma era presentar el sistema (más específicamente la sección
de carga) para poder introducirlos a la metodología de carga que se llevaría a cabo, a modo
de capacitación. Allí se resolvieron dudas y surgieron propuestas para mejorar el sistema.
Como orientación para realizar la carga, no solo se organizó esta reunión sino que se puso a
disposición de todos los usuarios el manual del sistema, tanto versión pdf como on-line,
con capturas de pantallas y guía de carga paso a paso para evitar todo tipo de errores
posibles.
Si en la operación del sistema los usuarios encuentran inconvenientes, existe una
dirección de correo (lramos@anguil.inta.gov.ar) donde se pueden contactar con el
responsable del sistema para solucionar el problema. Esto permite detectar errores
recurrentes y nuevas posibilidades de mejora del sistema. Los cambios solicitados por los
usuarios se intentan plasmar en menos de 48 horas. Si los cambios son muy sustanciales,
directamente se comienza una nueva versión del sistema, se comunica a los usuarios y se
reinicia el ciclo de desarrollo. También, en caso de tener una duda o que haya un error de
tipo conceptual y no del sistema, se puede enviar un correo a otra dirección
(pmercuri@cnia.inta.gov.ar) perteneciente al coordinador del proyecto.
El plan de acción de backups de la base de datos se lleva a cabo de manera
automática cada 25 días con una copia completa de la base de datos, semanalmente, los días
domingo, se realiza una copia diferencial y los días martes y jueves se realiza una copia del
registro de transacciones.
Resultados
El resultado de este proyecto de desarrollo es una aplicación que soluciona uno de
los inconvenientes dentro del área de los datos geoespaciales: contar un sistema que
permita generar un inventario de información georreferenciada. Además, el hecho de
fomentar la actividad de compartir los datos es un valor agregado para la aplicación, sin
dejar de lado que, por más que se aporte a conformar un único catálogo para toda la
institución, siempre se respetará la autoría de cada producto registrado.
Esta aplicación esta conformada por cuatro subsistemas bien marcados:
1. Carga del Catálogo de datos: este módulo es utilizado por las personas que
producen los datos geoespaciales para agregar sus productos al catálogo.
Para esto cuentan con un usuario y contraseña, y a través de la interfaz
cliente/servidor ingresan el registro a la base de datos. Para una mayor
seguridad se ha establecido que cada usuario pueda ver solo los registros que
éste ha cargado y no la totalidad de los mismos. De ahí la necesidad de la
autenticación. Las pantallas presentan agrupados por categorías los mas de
30 atributos definidos. (Figuras 4 y 5)
2. Consulta del Catálogo: a través de esta página web, el usuario puede realizar
una búsqueda textual en el catálogo y consultar la información de los
registros cargados en el subsistema anterior. Dado que es una aplicación
pública, este módulo no posee autenticación. (Figura 6 y 7)
3. Encuesta de necesidades del área geoespacial: esta sección esta integrada al
módulo de carga, y permite al usuario que carga los datos completar una
pequeña encuesta en la que define sus principales necesidades para producir
información georreferenciada. (Figura 8)
4. Estado de carga: el módulo de Estado de carga permite consultar una serie
de estadísticas con respecto a la carga de información en el Catálogo.
Actualmente se pueden observar tres gráficos de barras: Cantidad de
registros por tipos de datos (Mapas, Bases de datos, Aerofotografías,
Imágenes satelitales e Integrados), Cantidad de registros por Unidad INTA y
Cantidad de registros por usuario. Al igual que las consultas textuales, esta
aplicación es pública y no tiene autenticación.
A julio de 2008 hay registrados 528 mapas, 28 bases de datos, 14 aerofotografías,
39 imágenes satelitales y 60 productos integrados [5], cada uno de ellos con sus propias
características. Las áreas temáticas de estos datos son diversas. Existe información
geoespacial de Uso de suelos, Hidrología, Ecología, Agrometeorología, Geomorfología,
entre otras. Algunas de las unidades que alimentan esta base de datos son la EEA Anguil,
EEA San Carlos de Bariloche, EEA Salta, EEA Manfredi, EEA Corrientes y AER Rio
Gallegos. También se han registrado productos del Instituto de Clima y Agua e Instituto de
Suelos de Castelar. Dentro de la información provista por el Catálogo se encuentra, como
dato por demás relevante, la información de contacto del poseedor del producto
georreferenciado, a los efectos de que el usuario pueda comunicarse con esta persona en
caso de querer adquirir el producto. Esta información es fundamental ya que solo conocer
lo que hay no es suficiente, se necesita saber también donde localizar ese dato. Con esto se
busca fomentar la actividad de compartir la información geográfica, además de evitar la
duplicación de esfuerzos por la elaboración de un producto que ya ha sido generado en otro
lugar de la institución. La centralización de los datos georreferenciados permite conocer
con que característica fue generada la información cargada. Estos detalles son
imprescindibles para determinar la calidad del acervo de datos georeferenciados de INTA y
sirve de base para determinar que tanto se ajusta a los estándares adoptados y elaborados
por la institución. Finalmente, permitirá la planificación de tareas para complementar y/o
mejorar la información existente.
Discusión
Al inicio del proyecto el INTA no disponía de un catalogo de datos espaciales
producido, actualizado y público de la información georeferenciada. Tampoco una
herramienta para poder generar ese catálogo ni la rutina para la generación de metadatos
geoespaciales (escala de producción de los datos, año, tecnología usada para su generación,
unidad productora, fecha de última actualización, etc.). A su vez un creciente número de
programas y proyectos del INTA requieren datos georeferenciados o estructuras de
geomática, tanto para diversas líneas de acción, así como para la difusión y publicación de
sus productos o indicadores que en muchos casos es deseable o deben ser visualizados
como bases de datos geoespaciales. Finalmente, los datos cartográficos acerca de los
recursos naturales son necesarios para el planteo productivo, los estudios de
sustentabilidad, potencial productivo y riesgos para el sector agropecuario.
El desarrollo del catálogo de datos geoespaciales es un primer paso para poner a
disposición del INTA y de todos los actores del sector agropecuario el inventario de
producción de información geoespacial de la institución, con el objetivo de ayudar a evitar
superposición de trabajo, favorecer el uso compartido y materializar un sitio de filosofía
"clearinghouse".
Teniendo en cuenta que Internet se consolida como medio común de acceso,
consulta, búsqueda, diseminación e intercambio de la información tecnológica, que existe
una notoria mejora en la conectividad y accesos a Internet, además de la toma de conciencia
de este requerimiento en todo el país [7] y que el INTA ha tomado acciones tendientes a
mejorar la conectividad de sus unidades a nivel nacional, la elección de una plataforma on-
line se considera que ha sido acertada para asegurar el acceso y difusión de los datos
georeferenciados, no solo dentro del INTA, si no hacia la sociedad toda.
Dentro de las líneas de acción a futuro se encuentra la integración del catálogo a la
geodatabase de la red de geoservidores generada por el proyecto “Sistema de Datos
Geoespaciales de INTA”. Esta integración permitirá aprovechar los archivos ESRI Shape
File almacenados en el catálogo para realizar una consulta geográfica por área de cobertura
y complementar la actual búsqueda textual. También se pretende contar con las coberturas
completas en el catálogo e integradas a la geodatabase institucional.
Imágenes
Figura 1. Ciclo de vida de software Incremental [6].
Figura 2: Páginas Características de los datos, planilla en PDF
Figura 3. Esquema de hardware y de red de los ambientes de desarrollo, prueba y producción.
Figura 4: Menú principal del módulo de carga de datos
Figura 5: Pantalla de carga
Figura 6: Búsqueda en el Catálogo de datos
Figura 7: Datos de un registro
Figura 8: Carga de la encuesta sobre necesidades del área Geoespacial
Figura 9: Estado de la carga
Referencias
[1] http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=26020
[2] http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=39983
[3] http://www.fgdc.gov/
[4] Gane C., Sarson T. Análisis Estructurado de Sistemas. Ateneo. 1993.
[5] Consulta on-line del estado de carga (http://rian.inta.gov.ar/cargacatalogo/estadocarga.aspx)
[6] Bañeres, Juan Palacios. Compendio de Ingeniería del Software I. 2005.
[7] Tedesco, P&C. 2005.