En el seminario 'New challenges in Data Science: Big Data and Deep Learning on Data Clouds', que se desarrolla esta semana en la Universidad Internacional Menéndez Pelayo (UIMP), ha intervenido el investigador Francisco Pando, del Consejo Nacional de Investigación del CSIC y del Real Jardín Botánico.
En su ponencia 'Extreme Data Cloud Challenges in Ecosystems and Biodiversity', Pando ha detallado las distintas técnicas de recolección y medición de datos en el medio ambiente, y ha expuesto las deficiencias de estos métodos y sus problemas derivados, los que ha planteado como retos que están en vías de solución.
"Los datos relativos a la biodiversidad son raramente puros y nunca complejos", ha destacado el investigador, que ha señalado como principal problema en la recolección de datos, la complejidad inherente a este campo de estudio, dado que las muestras se ven influidas por el ecosistema de manera constante.
Además de la complejidad del campo de estudio, ha señalado como ineficiente el actual archivo de información recogida. Para mostrarlo de manera práctica, ha puesto en contraste dos de las páginas web más reseñables donde encontrar datos sobre biodiversidad: GBIF y NEON.
Pando ha descrito GBIF como una infraestructura que da información sobre las especies en un plano internacional. Esta web da acceso global y gratuito a gran cantidad de datos. Sin embargo, "las fuentes de esa información son, en gran medida, estudios realizados en base a observación ciudadana como método principal", ha recordado, por lo que la calidad de la información es "pobre".
Pando ha contrapuesto la web NEON, una base de datos muy amplia y fiable, dado que "la información que ofrece se recoge por vías estandarizadas de recolección", ha asegurado. La desventaja de esta web es que se centra exclusivamente en Estados Unidos.
El científico ha recalcado también la falta de precisión y veracidad de algunos estudios publicados, ya que la falta de coordinación entre países y organizaciones provoca errores y confusiones en el resultado final de un análisis. El investigador lo ha ejemplificado con un estudio que no especifica cómo y dónde se recogieron las muestras para el análisis final, y en el que se concluye que en Europa hay una cantidad elevada de leones. "El estudio no distingue entre especies que se encuentren en zoos", ha añadido.
Pando ha concluido con los avances que están en desarrollo para combatir las deficiencias actuales y ha propuesto la creación de una red que identifique mediante códigos las muestras recogidas, además de considerar imprescindible que el acceso a esa red sea libre y que dicha la clasificación de los datos siga criterios de globalidad, persistencia y unicidad.