Laboratorio de validación y limpieza
Metas de aprendizaje
Las metas de aprendizaje de este laboratorio son:
- Utilizar la herramienta OpenRefine para la validación y limpieza de datos sobre biodiversidad.
- Usar la herramienta Species Matching de GBIF para validar y completar la taxonomía de un conjunto de datos.
- Estandarizar las fechas en el formato ISO 8601 con la herramienta Date Parsing de Canadensys.
- Convertir de forma masiva las coordenadas documentadas en formato grados, minutos y segundos a grados decimales.
- Validar la coherencia de la ubicación de las coordenadas con respecto a la geografía superior usando las herramientas OBIS ploter y QGIS.
Guías
- Open Refine
- Species Matching
- Conversión Fechas
- Conversión Coordenadas
- Visualización Coordenadas
- Validación geográfica con QGIS
Glosario
-
Calidad de datos: es la capacidad que tienen los datos para satisfacer las necesidades de quien los usa.
-
API: funciona como un mensajero que hace solicitudes a un programa o base de datos, generando una respuesta apropiada a dichas solicitudes. Técnicamente, son un conjunto de comandos, funciones y protocolos informáticos que las aplicaciones siguen para comunicarse entre ellas, asegurando la conectividad entre distintas páginas y portales. De esta manera, las APIs permiten hacer uso de funciones preexistentes en otras plataformas sin necesidad de crearlas desde cero.
Para más información, consulte los siguientes videos:
- Video en inglés
- GBIF: corresponde a la sigla de Infraestructura Mundial de Información en Biodiversidad, una organización internacional y red de investigación financiada por gobiernos de todo el mundo, la cual se encarga de proporcionar acceso abierto y gratuito a datos sobre todas las formas de vida que hay en la Tierra. Esta información puede ser consultada por cualquier persona en cualquier lugar. Por consiguiente, el SiB Colombia es el nodo nacional de GBIF.
Lecturas y recursos externos
Recursos
- El bueno, el malo y el no tan lindo: ¿Cómo lidiar con datos de Biodiversidad?
- OpenRefine - GREL functions
Lecturas