Wikier

FAIR forskningsdata

English version - FAIR research data


På denne siden får du vite hva FAIR data er, og hvordan du gjør dine forskningsdata FAIR.

Hva er FAIR data?

De internasjonale FAIR-prinsippene er et sett overordnete retningslinjer for å tilrettelegge forskningsdata for videre bruk av både mennesker og maskiner. FAIR står for findable, accessible, interoperable og reusable.

FAIR data er altså organisert på en måte som gjør dem mulige å finne, og hvor formatbruk og tilleggsinformasjon gjør det mulig å forstå og gjenbruke dem. Husk at data i svært få tilfeller vil være fullstendig FAIR. Hensikten med å jobbe etter FAIR-prinsippene er å øke potensialet for gjenbruk og i mange tilfeller kan selv små grep øke FAIRhetsgraden betraktelig.

FAIR data innebærer blant annet bruk av:

  • varige identifikatorer (for eksempel DOI)
  • tilstrekkelige metadata og dokumentasjon
  • tydelige lisenser (for mer informasjon om lisensiering av forskningsdata, se Openscience.no)
  • aksepterte standarder og formater

I tillegg til de grunnleggende prinsippene for Findable, Accessible, Interoperable, and Reusable (FAIR), inkluderer FAIR også kravet om at data og metadata skal være utformet på en måte som gjør dem enkle for maskiner å forstå og håndtere. Ideelt sett bør maskiner kunne oppdage og utnytte disse dataene uten behov for manuell tilrettelegging.

Det er viktig å tenke FAIR selv om det aktuelle datamaterialet ikke skal deles åpent - data bør uansett være FAIR underveis i prosjektet for alle som skal ha tilgang, inkludert deg selv. Bruk datahåndteringsplanen aktivt for å planlegge for FAIR data. Her kan du blant annet beskrive hvordan filene skal organiseres, hvilke formater som skal brukes og hvordan dokumentasjon skal skapes og tas vare på. Ved å velge arkiv i god tid, kan du også planlegge datahåndteringen i lys av kriteriene til det aktuelle arkivet.

FAIR underveis i prosjektet

Mens du jobber med prosjektet, er det viktig å tenke organisering og oversikt.

Versjonskontroll
Ofte blir det laget nye versjoner av datafiler, og det anbefales at hver ny versjon får et unikt navn. Vanlige måter å gjøre dette på er å nummerere versjonene, for eksempel «v1», «v2», eller «v2.1».

Navngiving av filer
For å holde oversikt bør en også være nøye med navngivning og datering av filer. Bruk et datoformat som ÅÅÅÅMMDD, lag korte og forklarende filnavn, unngå spesialtegn og bruk understrek i stedet for mellomrom.

Dokumentasjon og ReadMe-fil
Ta vare på all dokumentasjon som kan være nyttig for å forstå datasettet og lag gjerne en ReadMe-fil som kan følge filene.

Også andre typer resultater og ressurser kan og bør gjøres mest mulig FAIR, for eksempel kildekode, programvare, modeller, protokoller og læringsressurser.

FAIR ved arkivering og publisering av data

Selv om det er viktig jobbe for å gjøre forskningsdata FAIR gjennom hele forskningsdatahåndteringen, er det spesielt viktig å tenke FAIR når data skal gjøres tilgjengelig, for eksempel når du skal publisere en artikkel. Ofte oppfylles mange av de grunnleggende FAIR-prinsippene ved å velge et sertifisert arkiv for forskningsdata når datasettet skal tilgjengeliggjøres.

Et godt arkiv gjør at blant annet at datasettet blir søkbart i søkemotorer for forskningsdata, utstyrer datasettet med en DOI eller annen identifikator, og har gjerne noen valgmuligheter for lisenser.

Det er viktig å tenke på filformater og bruk av åpen programvare fremfor produsenteid (proprietær) programvare. Ved arkivering av datasett, bør dokumentet derfor ofte lagres i et annet format enn det som ble brukt underveis, for eksempel ren tekst fremfor Microsoft Word, og CSV fremfor Microsoft Excel.

NTNUs forskningsdataarkiv i DataverseNO er et eksempel på arkiv som gir høy grad av FAIRhet ved at det blant annet sørger for DOI, har standardiserte metadata og bruker åpne formater.

Nyttige lenker

Kontakt