ERDDAP y su uso en el Proyecto CIGOM

Soluciones para la distribución de datos cientificos

10 Apr 2021
Favio

Como parte del megaproyecto para establecer los efectos en el ecosistema del Golfo de México a los derrames de petróleo en aguas profundas, el consorcio CIGOM construye una base de datos que incluye observaciones físicas, biogeoquímicas y ecológicas del Golfo.

Para mantener una base de datos de este calibre se desarrollo una metodología para la adquisición, curado, almacenamiento y distribución usando estándares y principios para el manejo de datos científicos tipo FAIR (Findable, Accesible, Interoperable, Reusable) una iniciativa que busca el facilitar a las computadoras las tareas de descubrimiento, acceder, interoperar y reutilizar los datos cientificos. todo un tema en si.

El equipo de trabajo decidió, después de una evaluación de tecnologías, adoptar al sistema ERDDAP como el servidor para la distribución de los productos generados por la red de observación.

Con ERDDAP se publicaron observaciones con datos procesados, resultados de modelos numéricos oceánicos, y también productos actualizados en tiempo cercano al real, como el de estaciones meteorológicas y oceánicas.

ERDDAP a demostrado para nosotros ser un sistema bastante robusto, útil y sobre todo que nos permite generar aplicaciones de mas valor, como son tableros de datos, visualización, conexión a aplicaciones de escritorio para análisis y visualización de datos. El trabajo duro que es la homogeneización de las consultas y distribución de datos en distintos formatos, se lo queda ERDDAP para que la organización se enfoque en lo importante que es el hacer ciencia y ofertar los productos de observación de forma mas digerida a los tomadores de decisiones.

¿Qué es ERDDAP?

El objetivo del servidor ERDDAP (del inglés Environmental Research Division´s Data Access Program) es ofrecer la descarga de subconjuntos de datos científicos de una forma sencilla y en formatos comunes para la generación de gráficas y mapas.

ERDDAP intenta unificar los diferentes tipos de servidores de datos científicos (OPeNDAP, WCS, Sensor Observation Service (SOS) y Ocean Biogeographic Observation System (OBIS)), de forma que exista un método consistente para descargar los datos que el usuario requiere, y en el formato que lo requiere.

Entre las principales ventajas de utilizar ERDDAP son:

  • Actúa como un intermediario entre el usuario y varios servidores remotos. Cuando el usuario hace una solicitud de información a ERDDAP, éste la convierte al formato requerido por el servidor remoto, envía la petición, obtiene los datos, los convierte al formato en que fueron solicitados y los envía al usuario.

  • Cuenta con un servidor integrado OGC-WMS y OPeNDAP que son servicios estándar para solicitar imágenes de mapas y subconjuntos de datos.

Interface web para consulta WMS

Fig.1 Interface web para consulta servidor WMS interno.
  • Puede enviar datos al usuario en distintos formatos, tales como tablas HTML, ESRI (archivos con extensiones .asc y .csv), Google Earth (.kml), binario de OPeNDAP, Matlab (.mat), NetCDF, ODV, texto, json, e incluso imágenes tipo PNG (del inglés Portable Network Graphics) o PDF (id., Portable Document Format), entre muchos otros.

Listado de algunos formatos de descarga

Fig.2 Múltiples formatos de descarga.

  • Convierte fechas y valores temporales de resultados al formato estándar ISO 8601:2004. Esto facilita la comparación de conjuntos de datos de fuentes distintas ya que, comúnmente, el tiempo y las fechas están expresados en formatos diferentes (por ejemplo: “Jan 2, 1985”, o “2 Jan 85”, o “02-JAN-1985”, etc.). Por ello ERDDAP usa el formato estándar “aaaa-mm-ddTHH:MM:SSZ” para todos los subcojuntos que hospeda. Para indicar los valores de tiempo emplea como unidad “seconds since 1970-01-01T00:00:00Z” y utiliza la zona horaria Zulu o Tiempo Universal Coordinado (UTC).

Estandar de uso para el tiempo

Fig.3 Formato estándar para el tiempo.
  • Tiene una interfaz Web para acceder a los conjuntos de datos, pero también cuenta con servicios web RESTful (que siguen el estilo arquitectónico Representational state transfer) para hacerlo desde algún otro programa.

Utilizamos ERDDAP en CIGOM para la distribución de las observaciones en tiempo real y las recopiladas por estaciones meteorológicas, boyas oceánicas, estaciones costeras con radares HF, boyas oceánicas de deriva, de planeadores submarinos (gliders), entre otros productos.

En nuestra experiencia el primer acercamiento a ERDDAP puede ser un reto, te requiere que realmente conozcas la estructura de datos de los productos que se publicaran, y se armen archivos de configuración que definen cada uno de los conjuntos de datos. Un proceso lento al principio, pero una inversión al mediano plazo, pues realmente son muchos los beneficios.

La experiencia adquirida con esta herramienta me ah permitido recomendarla y desplegarla para otros proyectos como el de OORCO y CEMIEOCEANO.

Favio


Blog Comments powered by Disqus.

Siguiente   Anterior