Buenas prácticas en datos de investigaciónBuenas prácticas en datos de investigación<p>​<img class="ms-rtePosition-4" alt="icono pdf" src="/buc/PublishingImages/Iconos/pdf-icon_32.gif" style="margin:5px;" /><a title="Versión para imprimir" href="/buc/Documents/Formacion/Guia_buenas_practicas_datos.pdf"><strong>Versión para imprimir</strong></a></p><p>27/09/2019</p><div style="text-align:justify;"> <span> <div class="nav-tabs-vertical"><ul class="nav nav-tabs"><li> <a aria-expanded="false" href="#tab_1_1" data-toggle="tab">​<font color="#444444">Gestión de datos de la investigación</font></a></li><li class="active"> <a aria-expanded="true" href="#tab_1_2" data-toggle="tab">Recomendaciones o buenas prácticas</a><br></li></ul><div class="tab-content"><div class="tab-pane fade" id="tab_1_1"><p> <img class="ms-rtePosition-1" alt="Investigación" src="/buc/PublishingImages/Formacion/Gestion%20datos.jpg" style="margin:5px 15px;width:220px;height:147px;" />Realizar una gestión sistemática y abierta de los datos de la investigación se está convirtiendo en una exigencia más de la práctica científica. Se plasma especialmente en los planes de gestión de datos, pero también en un conjunto de recomendaciones o buenas prácticas al reunir, generar, manejar y conservar los archivos de datos, como las que aquí consignamos. En conjunto, facilitan la comunicación científica y preservación del conocimiento. Consulte en la Biblioteca.<br></p><p>Un documento general e introductorio sobre el tema es:<br></p><p>MELERO, R. 2019. <a href="http://hdl.handle.net/10261/173801" target="_blank">Recomendaciones para la gestión de datos de investigación dirigidas a investigadores</a>. En: <em>Digital CSIC.</em><br></p><p> </p></div><div class="tab-pane fade active in" id="tab_1_2"><ul><li>​​Redacte un <strong class="ms-rteForeColor-1">plan de gestión de datos </strong>como parte de la propuesta de financiación o del proyecto de investigación, que prevea los retos y soluciones principales al manejo de los datos. DMPOnline ofrece <a href="https://dmponline.dcc.ac.uk/public_templates" target="_blank">un conjunto de plantillas</a> según organismos de financiación; ninguno español, claro.<br></li><li>Al reunir o usar <span class="ms-rteForeColor-1"> <strong>datos de carácter personal </strong></span>respete los requisitos legales, éticos y contractuales sobre confidencialidad, privacidad y protección de los datos, para lo que pueden anonimizarse o evitar su difusión pública. Puede consultar la <a href="https://www.aepd.es/media/guias/guia-orientaciones-procedimientos-anonimizacion.pdf">guía sobre anonimización de datos personales</a> de la AEPD.<br></li><li>Establezca mecanismos apropiados de <span class="ms-rteForeColor-1"> <strong>almacenamiento</strong></span>, back-up y seguridad de la información durante el tiempo que dure el proyecto de investigación, que aseguren la confidencialidad, integridad y disponibilidad de los datos.</li><li>Procure planear y organizar la <span class="ms-rteForeColor-1"> <strong>arquitectura de los archivos </strong></span>de datos con cuidado. La estructura y denominaciones de las carpetas y archivos deben estar bien pensadas, ser descriptivas respecto al contenido, evitar nombres basados en simples números, incluir información de las versiones, usar guiones bajos y no espacios blancos, no superar los 25 caracteres, ni incluir signos especiales. Puede <a href="https://simmons.libguides.com/c.php?g=814790&p=5983200" target="_blank">consultar esta guía</a> al respecto.<br></li><li>Utilice en lo posible <span class="ms-rteForeColor-1"> <strong>formatos abiertos </strong></span>y no propietarios: datos codificados en ASCII o UTF-8; mejor csv que Excel, mejor txt o PDF/A que Word o PPT, mejor TIFF que .psd, etc. Vea <a href="https://www.ukdataservice.ac.uk/manage-data/format/recommended-formats" target="_blank">UK Data Service Recommended Formats</a>, página en la que se basa este cuadro:<br></li></ul><p> </p><table class="ms-rteTable-default" cellspacing="0" style="width:100%;"><tbody><tr><td class="ms-rteTable-default" style="width:50%;"> <strong class="ms-rteForeColor-1">Tipo de datos</strong></td><td class="ms-rteTable-default" style="width:50%;"> <strong class="ms-rteForeColor-1">Formatos más idóneos</strong></td></tr><tr><td class="ms-rteTable-default" style="width:50%;">Datos tabulares cuantitativos, metadatos ampliados</td><td class="ms-rteTable-default" style="width:50%;">Formato portátil SPSS: .por</td></tr><tr><td class="ms-rteTable-default" style="width:50%;">Datos tabulares cuantitativos, metadatos mínimos</td><td class="ms-rteTable-default" style="width:50%;">Valores separados por comas (CSV): .csv</td></tr><tr><td class="ms-rteTable-default" style="width:50%;">Datos geoespaciales</td><td class="ms-rteTable-default" style="width:50%;"><p> ESRI Shapefile: .shp, .shx, .dbf… <br>TIFF georreferenciada: .tif, .tfw                       <br>Datos CAD: .dwg<br>Datos de atributos GIS tabular</p></td></tr><tr><td class="ms-rteTable-default" style="width:50%;">Datos cualitativos, texto</td><td class="ms-rteTable-default" style="width:50%;"><p>XML según una DTD apropiada: .xml<br>Texto enriquecido: .rtf<br>Texto ASCII sin formato, UTF-8: .txt</p></td></tr><tr><td class="ms-rteTable-default" style="width:50%;">Datos de imagen digital</td><td class="ms-rteTable-default" style="width:50%;">TIFF versión 6 sin comprimir: .tif</td></tr><tr><td class="ms-rteTable-default" style="width:50%;">Datos de audio digital</td><td class="ms-rteTable-default" style="width:50%;">Free Lossless Audio Codec: .flac</td></tr><tr><td class="ms-rteTable-default" style="width:50%;">Datos de vídeo digital</td><td class="ms-rteTable-default" style="width:50%;">MPEG-4: .mp4</td></tr><tr><td class="ms-rteTable-default" style="width:50%;">Documentación y plan de gestión de datos</td><td class="ms-rteTable-default" style="width:50%;"><p>Rich Text Format: .rtf<br>HTML: .htm, .html<br>OpenDocument Text: .odt</p></td></tr></tbody></table><ul><p></p><p></p><li>De cara a su difusión realice una adecuada <span class="ms-rteForeColor-1"></span><strong class="ms-rteForeColor-1">organización y descripción</strong><span class="ms-rteForeColor-1"> </span>de los datos que permita conocer cómo son y cómo se crearon para poder reutilizarlos. La descripción debe proporcionar un contexto para la interpretación y utilización de los datos, del que carecen por sí mismos, a diferencia de las publicaciones científicas.</li><li>Utilice <span class="ms-rteForeColor-1"> </span> <strong class="ms-rteForeColor-1">metadatos</strong>, que sirven para describir de forma estructurada y normalizada los datasets: el propósito, origen, referencias temporales, referencias geográficas, autoría, condiciones de acceso y términos de uso de una colección de datos. Existen para ello esquemas de metadatos generales, especializados y generados por el propio software. Puede consultar por materias el <a href="https://rdamsc.bath.ac.uk/" target="_blank">RDA Metadata Standards Catalogue</a>.<br></li><li>Incorpore además un archivo <span class="ms-rteForeColor-1"> </span> <strong class="ms-rteForeColor-1">Readme.txt</strong> con instrucciones detalladas, por ejemplo: breve descripción del dataset; contacto del investigador principal para preguntas; fecha de recogida de datos y de creación del dataset; información geográfica de los datos; metodología y enlace a publicaciones y otra documentación; unidades de medida, protocolos, abreviaciones, códigos, símbolos asociados a los datos; licencia de uso; citación recomendada, etc. Puede <a href="https://data.research.cornell.edu/content/readme" target="_blank">consultar esta guía</a> al respecto. <br></li><li>Deposite en un <strong class="ms-rteForeColor-1"> repositorio </strong> <strong class="ms-rteForeColor-1">público</strong> los datos de la investigación, de modo que se asegure su preservación y difusión, posibilitando su uso para <span class="ms-rteForeColor-1"> </span> <strong class="ms-rteForeColor-1">reproducir y validar</strong><span class="ms-rteForeColor-1"> </span>la investigación o su <span class="ms-rteForeColor-1"> </span> <strong class="ms-rteForeColor-1">reutilización</strong> en nuevos estudios y trabajos.<strong></strong><a title="Re3data" href="http://www.re3data.org/" target="_blank"><strong> Re3data</strong></a><strong> </strong>es un buen directorio de repositorios. <img class="ms-rtePosition-2" alt="Datos en la nube" src="/buc/PublishingImages/Formacion/nube.jpg" style="margin:5px 15px;width:200px;height:215px;" /></li><li>Efectúe una <span class="ms-rteForeColor-1"> </span> <strong class="ms-rteForeColor-1">selección de los datos</strong><span class="ms-rteForeColor-1"> </span>que se van a conservar y difundir<strong>. </strong>Incluso participar en Horizon 2020 no supone necesariamente conservar todos los datos o conservarlos todos en abierto. Pero es preciso planear, seleccionar, decidir y justificar los criterios aplicados. Con frecuencia conviene limpiar y procesar los datos en bruto, depurar los que se van a conservar finalmente. La decisión sobre qué datos conservar y durante cuánto tiempo puede ser tomada con arreglo a los criterios inspirados en la guía <strong> </strong> <a title="5 pasos para decidir qué guardar" href="http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep" target="_blank"> <strong> Five steps to decide what data to keep (DCC)</strong></a><strong>.</strong></li><li>Defina bajo qué <span class="ms-rteForeColor-1"> </span> <strong class="ms-rteForeColor-1">licencias públicas y formas de acceso</strong><span class="ms-rteForeColor-1"> </span>se van a difundir los datos. Es recomendable en general facilitar una reutilización poco restrictiva (CC0, CCBY), pero si es necesario pueden tomarse precuciones (embargos, permisos, etc.). Como orientación general es útil este <a href="https://ufal.github.io/public-license-selector/" target="_blank">License Selector</a>, aunque la licencia definitiva depende de las que el repositorio ofrezca.</li></ul><p> </p></div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade"> </div><div class="tab-pane fade" id="tab_1_5">​​ <p>​contenido del quinto panel</p></div><div class="tab-pane fade" id="tab_1_6">​​ <p>​contenido del sexto panel</p></div></div></div></span> </div><p> </p>