Gestionar los datos de la investigación. 

Realizar una gestión sistemática de los datos de la investigación se está convirtiendo en un aspecto más del trabajo científico. Las agencias de financiación de la investigación y las propias revistas científicas promueven que se aborde una planificación del ciclo de creación y uso de los datos y que éstos se difundan de forma abierta para su validación y reutilización. En cierto modo, supone un cambio en la forma en que se practica la ciencia.

En esta página ofrecemos algunas orientaciones y enlaces sobre el tema y en la Biblioteca podemos ayudarle a redactar y presentar planes de gestión de datos, a depositar sus archivos de datos en repositorios abiertos o asesorarle en cualquier otro aspecto. Cuente con nosotros. También puede inscribirse en este curso sobre Open Science del Plan de Formación del PDI. 

Pide una cita con nuestros especialistas o escríbenos al buzón ucrea@unican.es

 

Qué son los datos de la investigación. 

 

Es toda información reunida, utilizada o generada en la experimentación, observación, medición, simulación, cálculo, análisis, interpretación, estudio o cualquier otro proceso de indagación que sustente y justifique las aportaciones científicas que se difunden en las publicaciones de investigación.  

Se presentan en cualquier rama del conocimiento, como resultado de muy diferentes técnicas o metodologías, configurando conjuntos o colecciones heterogéneas de datos, o datasets, en cualquier formato y soporte, por ejemplo: 

  • Archivos numéricos, hojas de cálculo, tablas, etc. 
  • Documentos de texto en distintas versiones. 
  • Imágenes, gráficos, archivos de audio, vídeo, etc. 
  • Código o registros de software, bases de datos, etc. 
  • Datos geoespaciales, información georreferenciada. 
 
 

Qué son los datos abiertos de la investigación. 

Open Access

                               

Los datos abiertos de la investigación (Research Open Data) son datos que, tanto legal como técnicamente, se pueden consultar, analizar, revisar, reutilizar, redistribuir y redirigir a otros fines.  

Con dos objetivos principales:  

 

  1. Aportar transparencia a los procesos de investigación al facilitar la reproducción y validación de los experimentos e indagaciones realizadas. 
  2. Permitir a cualquier otro investigador que use los datos en nuevos estudios y trabajos, y por tanto también a empresas, profesionales o personas interesadas.  

Se trata de una tendencia encuadrada en los movimientos hacia la ciencia abierta (Open Science) y a favor de los Datos Abiertos y la transparencia del sector público.  

Otras ventajas asociadas a los datos abiertos de la investigación son: 

  • Aumentan la visibilidad, repercusión y prestigio de los investigadores. 
  • Mejoran la gestión y conservación de los datos, minimizando el riesgo de pérdida.
  • Incrementan la eficiencia y la colaboración en la investigación, optimizando esfuerzos.
  • Estimulan la innovación y la productividad científica e industrial. 

Horizon Europe, Ley de la Ciencia y datos de la investigación. 

 Desde enero de 2017 todos los proyectos financiados en particular por el Programa Marco de Investigación e Innovación Horizonte 2020 (H2020, art. 29.3) y en el futuro por Horizon Europe (art. 3 y art. 35), deben cumplir una serie de requisitos:

  • Elaborar y mantener un Plan de Gestión de Datos. 
  • Depositar al final del proyecto los datos en un repositorio público. 
  • Permitir el acceso y explotación de los datos, preferiblemente mediante licencias CC.  
  • Documentar y describir los datos mediante metadatos, etc. 

El Programa Marco Horizonte Europa establece en su Programme Guide orientaciones y obligaciones sobre Open Science y en particular en cuanto a gestión de datos de investigación para la ciencia europea acogida a sus planes de financiación. En el capítulo 16 se explican las prácticas recomendadas sobre datos, principios FAIR, reproducibilidad, acceso abierto, etc. 

La Unión Europea impulsa EOSC, European Open Science Cloud como infraestructura federada de soporte a la investigación abierta y colaborativa. Su Catalogue and Marketplace incluye varios servicios de apoyo a la gestión de datos. 
 
La Ley 14/2011 de la Ciencia, la Tecnología y la Innovación, en su reforma de 2022, establece en su art. 37.2 que: "El personal de investigación del sector público o cuya actividad investigadora esté financiada mayoritariamente con fondos públicos y que opte por diseminar sus resultados de investigación en publicaciones científicas, deberá depositar una copia de la versión final aceptada para publicación y los datos asociados a las mismas en repositorios institucionales o temáticos de acceso abierto, de forma simultánea a la fecha de publicación".  

Planes de gestión de datos. 

 Una gestión sistemática y rigurosa de los datos de la investigación requiere elaborar y mantener un plan de gestión de datos desde la propuesta de financiación o proyecto de investigación, que prevea los retos y soluciones al manejo de los datos. También es conveniente seguir algunas buenas prácticas recomendadas, sobre arquitectura, denominación y formatos de archivos, almacenamiento, acceso y seguridad durante el proyecto, descripción y metadatos, licencias de reutilización, etc.: 

Buenas prácticas en datos de la investigación.

Un plan de gestión de datos (Data Management Plan, DMP) es un documento formal que se debe redactar al comienzo de la investigación y en el que se describe qué haremos con los datos durante y después de finalizada la investigación. Por tanto, puede y debe ser actualizado a lo largo del proyecto, pues es el instrumento básico de planificación y control de los datasets. 

Ciclo de uso y gestión de datos de investigación 

Sobre metadatos, puede ver este vídeo explicativo y consultar el RDA Metadata Standards Directory. Un esquema básico general recomendable es el OpenAIRE Guidelines for Data Archives

Depositar datos de investigación en repositorios. 

  Repositorios de datos

 

El destino definitivo de los datos, el repositorio donde vayan a depositarse, es objeto de una decisión importante, pues puede condicionar las opciones sobre formatos de datos, metadatos, licencias de uso, etc.  

 

Hay tres opciones, en orden aproximado de preferencia: 

 

 

Revistas científicas de datos. 

Los datos de la investigación se difunden mediante enlaces desde el artículo de revista al repositorio donde se ubica el dataset. Pero en bastantes casos también se incluyen como material complementario del artículo en la revista. Y también han surgido data journals o revistas de datos, especializadas en diseminar estos materiales. 

La difusión de un dataset a través de revistas es una vía complementaria a su depósito en repositorios, para los casos en que su revisión por pares y publicación tiene un interés intrínseco adicional, obviamente siempre en acceso abierto. Esto supone una mayor repercusión.  

Buscar datos de investigación. 

Buscar datos de investigación

Si necesita buscar datos y desconoce en qué sitio pueden estar, puede buscar repositorios de datos por tema y luego rastrear los datasets en los archivos pertinentes. O acudir directamente a buscadores de conjuntos de datos.  

     

 

Citar datos de investigación 

Citar datos de investigación

Los datasets son también resultados de la investigación y merecen ser consultados y citados, además de reutilizados. Por tanto, aumentan el prestigio de sus autores, como las publicaciones. 

Se pueden citar en cualquier estilo bibliográfico: APA, Chicago, MLA, Vancouver, Harvard, ISO 690, etc., pero teniendo en cuenta las indicaciones que se presentan a la derecha en el gráfico de CRUE REBIUN (pulse para ampliar). O siguiendo esta importante guía: 

Publications Office of the European Union, Jessop, P., Data citation : a guide to best practice, Publications Office of the European Union, 2022, https://data.europa.eu/doi/10.2830/59387

                      

                                      

                                                                   

Consulte en la Biblioteca

No dude en consultarnos cualquiera de estos aspectos: 

  • Orientación acerca de la gestión de datos de la investigación en general.  
  • Buscar, localizar y acceder a archivos de datos de la investigación. 
  • Elaborar planes de gestión de datos y tomar medidas para una correcta planificación. 
  • Seleccionar repositorios y depositar los datos: requerimientos, licencias, descripción, etc. 
  • Depositar los datasets en UCrea si es la solución preferida. 

Pide una cita con nuestros especialistas o escríbenos al buzón ucrea@unican.es.