Estructuración de transectos en Darwin Core
Objetivo
Estructurar las coordenadas asociadas a transectos provenientes de archivos shapefile (.shp) al formato adecuado para representarlos en el estándar Darwin Core, utilizado para la publicación de datos sobre biodiversidad.
Introducción
Los transectos suelen ser recorridos organizados metodológicamente en los cuáles se realizan observaciones o recolección de especímenes. Estos recorridos suelen ser guardados en el GPS como Tracks y posteriormente se cargan a bases de datos geográficas en formato shapefile (.shp).
Los datos de fauna que se cargan en las bases de datos geográficas, las cuales están basadas en el diccionario geográfico de la ANLA. Normalmente, estas bases de datos contienen transectos asociados que requieren un tratamiento especial, ya que las coordenadas tienen una geometría diferente de tipo línea o polilínea, usada para representar los transectos, y no la convencional geometría de punto. Esto implica cambios en la forma como se extraen las coordenadas decimales de la base de datos y en su documentación en el estándar Darwin Core (DwC) para lograr una correcta estructuración de los mismos.
Sobre la herramienta:
QGIS es un software de gestión de información geográfica que se ejecuta en múltiples sistemas operativos como Linux, Unix, Mac OSX, Windows y Android. También soporta numerosos formatos y funcionalidades de datos vector, datos ráster y bases de datos. Esta herramienta proporciona una creciente gama de servicios, a través de sus funciones básicas y complementos, para visualizar, gestionar, editar, analizar datos y diseñar mapas imprimibles. QGIS es un software libre y de código abierto, licenciado bajo una GNU (General Public License) y soportado como un proyecto de la Open Source Geospatial Foundation (OSGeo). Por lo tanto, no requiere el pago de licencias. Adicionalmente, es impulsado por un grupo de voluntarios que mantienen el software actualizado y las versiones estables, lo cual sostiene a QGIS como uno de los software geográficos más conocidos.
Convenciones
- Los elementos del estándar Darwin Core aparecen en color verde y cursiva. Por ejemplo: measurementUnit.
- Los archivos a utilizar en los ejercicios se muestran entre comillas angulares, negrita, y tienen una tipografía diferente. Por ejemplo: «archivo_Ejemplo.xls».
- Las secciones, ventanas y componentes de las herramientas utilizadas se muestran entre comillas inglesas y en negrita. Por ejemplo: “Create Project”.
- Las opciones de las herramientas que se asocian a instrucciones (dar clic, seleccionar, etc.) aparecen en color amarillo y cursiva. Por ejemplo: New project.
- Las secuencias de instrucciones y pasos se muestran en color amarillo, cursiva y negrita. Por ejemplo: Paso 1 > Paso 2.
- Las líneas que se escriben directamente en las herramientas, para programar o realizar algún proceso en específico, aparecen en formato de código, con una tipografía distinta de color negro. Por ejemplo: value.replace(“ sp.”,””).
Requerimientos
- QGIS (Revisar el proceso de instalación en el primer paso de la guía de Validación geográfica con QGIS).
- Procesador de archivos de texto (Ejemplo: Excel, Openrefine, etc.).
- Contar con un mínimo de 4GB de memoria RAM para el desarrollo de esta guía. Para procesos con más de 20 000 registros biológicos, se recomienda tener como mínimo 8GB.
Archivos de trabajo
- Descargar el «Archivo comprimido» con el shapefile del transecto.
Paso 1 - Carga de los archivos en QGIS
Paso 1.1 Configuración del SRC en QGIS
Abrir el software QGIS y seleccionar la opción Proyecto > Nuevo. Luego, configurar el SRC del proyecto para que coincida con el de los archivos a cargar. En este ejercicio, los datos tienen el SRC MAGNA-SIRGAS origen CTM-12. Para implementar esta configuración, seleccionar Proyecto > Propiedades…. En la nueva ventana, ir a la pestaña SRC, elegir el sistema de referencia MAGNA SIRGAS / CTM-12 y dar clic en OK (Fig 1.)
Figura 1. Selección del Sistema de referencia CTM-12 en QGIS.
Paso 1.2 Carga de los archivos en QGIS
Para cargar los archivos shapeFile, seguir la ruta Capa > Añadir capa > Añadir capa vectorial… (Fig. 2).
Figura 2. Adición de una capa de tipo vectorial.
En la ventana emergente, hacer clic en el botón con los tres puntos (Fig. 3.1). Después, en la sección “Fuente”, seleccionar el archivo con la terminación .shp que contiene los transectos y dar clic en Abrir (Fig. 3.2).
Figura 3.1. Ventana emergente con la opción de selección del archivo shapefile con los puntos de muestreo.
Figura 3.2. Selección de los archivos de transectos y polígonos.
Para finalizar, dar clic en Añadir. Con esto ya se podrán visualizar los transectos del archivo shapefile espacializados en QGIS. (Fig. 3.3)
Figura 3.3. Visualización del archivo shapefile en QGIS.
Paso 2 - Exportar las capas de transectos
Para extraer la información de los transectos, primero es necesario exportarlos con el datum WGS84. Para ello, dar clic derecho sobre la capa recién cargada y elegir la opción Exportar>Guardar objetos como… (Fig 4).
Figura 4. Menú para la exportación del archivo.
En la ventana emergente se podrán seleccionar las opciones para realizar la transformación de coordenadas al datum WGS84:
- Formato: Dar clic en el desplegable y seleccionar GeoJSON (Fig. 5A).
- Nombre de archivo: Dar clic en el botón con los tres puntos y seleccionar la ubicación y el nombre que se le va a dar al archivo: Transecto WGS84 (Fig. 5B).
- SRC: Hacer clic en el desplegable y seleccionar EPSG:4326 - WGS 84 (Fig. 5C).
Por último, dejar las otras opciones por defecto y dar clic en OK (Fig. 5).
Figura 5. Opciones para exportar el archivo con datum WGS84: A. Selección del formato utilizado para exportar los datos, B. Selección del nombre y la ubicación del archivo, C. Selección del sistema de referencia.
Luego de hacer clic en OK, QGIS comenzará a realizar el proceso de exportación y el progreso se podrá ver en una barra en la parte inferior. Al finalizar el proceso, aparecerá una nueva capa con el nombre asignado en el paso anterior.
Paso 3 - Extraer la información de las coordenadas decimales y la representación Well-Known Text (WKT)
Paso 3.1 Agregar la representación WKT
Para documentar la información completa de los transectos, se usa el elemento Darwin Core footprintWKT, que permite guardar el tipo de geografía y los puntos que la componen.
Para obtener esta información en QGIS, lo ideal es sacar provecho de la calculadora de campos: Dar clic derecho en la nueva capa (TransectoWGS84) y seleccionar la opción Abrir la tabla de atributos.
Al interior de la tabla de atributos, buscar el icono del ábaco en la barra de herramientas de la parte superior (Fig. 6).
Figura 6. Apertura de la calculadora de campos.
En la ventana emergente, seleccionar las opciones para crear un nuevo campo con la representación WKT y luego dar clic en OK.
Utilice las siguientes opciones:
- Nombre del campo de salida: footprintWKT (Fig. 7A).
- Tipo del campo de salida: Texto (cadena)(Fig. 7B).
- Longitud del campo de salida: 60000 (Fig. 7C).
- Expresión: geomToWKT( $geometry ) (Fig. 7D).
Figura 7. Selección de opciones para crear la nueva columna con la representación WKT: A. Selección del nombre del nuevo campo, B. Selección del tipo de dato, C. Selección de la longitud del campo, D. Fórmula utilizada para crear el campo.
Al finalizar, aparecerá un nuevo atributo denominado footprintWKT en la tabla de atributos, donde se encuentran todas las coordenadas que componen cada parte del transecto. En este sentido, se debe revisar que este campo haya sido creado en la capa “TransectoWGS84”.
Paso 3.2 Agregar la información para los elementos decimalLatitude y decimalLongitude
En el estándar Darwin Core, hay dos elementos para guardar la información de la ubicación a partir de la latitud y longitud decimal (decimalLatitude y decimalLongitude). Estos campos permiten, entre otras cosas, espacializar los datos en los portales de datos del SiB Colombia y GBIF. Por consiguiente, para el caso de los transectos, se requiere de un par de coordenadas que representen todo el transecto.
Para documentar las coordenadas decimales de un transecto hay dos opciones: colocar las coordenadas del inicio del transecto o poner las coordenadas de un punto medio del transecto. Desde el EC-SiB Colombia, recomendamos el uso de la última opción, ya que se puede acompañar de un valor de distancia que cubre la incertidumbre de la ubicación de forma más precisa. A continuación, se muestra el proceso con las dos opciones por medio de la herramienta QGIS.
Paso 3.2.1 Cálculo del punto medio del transecto
Para obtener el punto medio del transecto, se usará una opción que ubica el centro corregido del transecto y lo ajusta siguiendo las buenas prácticas de georreferenciación.
Para esto, seguir la ruta Vectorial > Herramientas de geometría > Centroides…. Luego, elegir la capa con el transecto en WGS84 (TransectoWGS84) como capa de entrada y seleccionar Ejecutar (Fig. 8).
Figura 8. Herramienta para calcular el centroide de los transectos.
Para obtener el centro corregido, ubicar el menú superior y dar clic en Procesos > Caja de herramientas. En la opción del buscador, buscar la herramienta Ajustar geometrías a capa y dar clic en ella.
Como “Capa de entrada”, seleccionar la capa creada en el paso anterior, que se denomina Centroides (Fig. 9A). En la sección “Capa de referencia”, elegir el transecto de muestreo en WGS84 (Fig. 9B) y dar clic en Ejecutar. Esto creará una nueva capa llamada “Geometría ajustada”.
Figura 9. Herramienta para ajustar el centroide al transecto: A. Selección de la capa que se va a ajustar, B. Selección de la capa que se va a utilizar como referencia del ajuste.
Finalmente, se debe calcular la longitud y latitud de los centros corregidos. Para eso, es necesario abrir la tabla de atributos de la capa “Geometría ajustada” y utilizar la calculadora para crear los elementos decimalLongitude y decimalLatitude con estas opciones:
Para el elemento decimalLongitude, se deben usar estas opciones:
- Nombre del campo de salida: decimalLongitude.
- Tipo del campo de salida: Número decimal (real).
- Longitud del campo de salida: 10.
- Precisión: 6.
- Expresión: x ( $geometry).
Para el elemento decimalLatitude, se recomienda utilizar estas opciones:
- Nombre del campo de salida: decimalLatitude.
- Tipo del campo de salida: Número decimal (real).
- Longitud del campo de salida: 10.
- Precisión: 6.
- Expresión: y ( $geometry).
Paso 3.2.2 Cálculo de las coordenadas iniciales del transecto
En algunos casos con transectos muy extensos o en límites municipales, el punto medio del transecto puede caer en una localidad diferente a la documentada. En tal caso, se recomienda utilizar el método del punto inicial para que coincida con la localidad.
Para extraer las coordenadas iniciales de los transectos, también se usa la calculadora de campos. Por consiguiente, se debe abrir la tabla de atributos de la capa “TransectoWGS84” y configurar las siguientes opciones para la longitud inicial:
- Nombre del campo de salida: decimalLongitude_inicial.
- Tipo del campo de salida: Número decimal (real).
- Longitud del campo de salida: 10.
- Precisión: 6.
- Expresión: xat(0).
Luego de haber creado exitosamente este elemento, abrir de nuevo la calculadora de campos y configurar las siguientes opciones para la latitud inicial:
- Nombre del campo de salida: decimalLatitude_inicial.
- Tipo del campo de salida: Número decimal (real).
- Longitud del campo de salida: 10.
- Precisión: 6.
- Expresión: yat(0).
Paso 4 - Exportar los transectos a archivos de texto
Para realizar la exportación de los resultados obtenidos hasta ahora, es necesario hacer clic derecho sobre la capa “Geometría ajustada” y seguir la ruta Exportar>Guardar objetos como….
En la ventana emergente, seleccionar las siguientes opciones:
- Formato: Dar clic en el desplegable y elegir XLSX (Fig. 10A).
- Nombre de archivo: Dar clic en el botón con los tres puntos y seleccionar la ubicación. Luego, nombrar el archivo como TransectoDwC.xlsx (Fig. 10B).
Dejar las otras opciones por defecto y dar clic en OK (Fig. 10).
Figura 10. Opciones para exportar el archivo de transectos como un archivo de Excel: A. Selección del formato utilizado para exportar los datos, B. Selección del nombre y la ubicación del archivo.
Paso 5 - Calcular la incertidumbre de las coordenadas en metros
Para finalizar, se debe calcular la incertidumbre de la coordenada documentada en los elementos decimalLatitude y decimalLongitude con respecto al total del transecto. Esta incertidumbre es una distancia que permite asociar un área que cubre la totalidad del recorrido del transecto. Para ello, es necesario abrir el documento «TransectoDwC.xlsx» y crear una nueva columna al final del archivo que se llame “coordinateUncertaintyInMeters”.
En la parte superior de QGIS, seleccionar la herramienta Medir línea, que tiene forma de regla (Fig. 11). Posteriormente, hacer clic en el centro corregido al interior del transecto (Fig. 11A) y llevar el puntero hasta el extremo más lejano del transecto (Fig. 11B). La distancia entre ambos puntos se muestra en el recuadro de la sección “Medir”, junto a la unidad de medida (Fig. 11).
Figura 11. Pasos para calcular la incertidumbre en metros: A. Centroide corregido como primer punto de la medición, B. Punto externo del transecto utilizado como segundo punto de la medición.
Esa distancia se debe documentar en el archivo de Excel para cada uno de los transectos, revisando el código del transecto “ID_MUES_TR” para asegurarse de que sea el transecto adecuado.
Paso 6 - Verificación del resultado
Descarga y compara el siguiente archivo, que contiene los transectos representados en Darwin Core, con el archivo que se trabajó en el laboratorio para identificar aciertos y posibilidades de mejora. ¿Los transectos quedaron correctamente estructurados?
¡Felicitaciones!
Se han extraído las coordenadas y la información para representar transectos en el estándar Darwin Core.
Citación
Marentes E., Ortíz R., Lozano J., Plata C. (2023). Laboratorio de datos, Ciclo de formación. Consultado a través del SiB Colombia. Disponible en https://biodiversidad.co/formacion/laboratorios.