Wikier

NTNU Open Data

Her finner du informasjon om hvordan du kan arkivere datasett i NTNUs arkiv for åpne data i DataverseNO.

Temaside om forskningsdata | Sider merket med åpne data

English version - NTNU Open Data

Om NTNU og DataverseNO

NTNU-samlingen i DataverseNO er et institusjonsarkiv som kan brukes for åpne datasett fra alle fag og disipliner. Arkivet er en del av DataverseNO, som driftes av UiT Norges Arktiske Universitet. NTNU følger retningslinjer og policy for DataverseNO, og dette innebærer blant annet at alle datasett gjennomgår en kuratorkontroll før de publiseres. DataverseNO er Core Trust-sertifisert og utsteder DOI for alle publiserte datasett (Digital Object Identifier). Standardlisens for arkivet er CC0 (Creative Commons Zero), men ved behov kan andre åpne lisenser vurderes.

Hvordan arkivere i DataverseNO

Du logger inn i NTNU-samlingen med FEIDE (din NTNU-bruker). Vi anbefaler at du bruker DataverseNO sin guide for arkivering. Guiden er detaljert, og det er ikke alt som er like relevant for alle typer data. Vi gjengir derfor her de viktigste punktene, inkludert noen det er lett å overse. Ta også gjerne en kikk på andre datasettene i DataverseNO for å se eksempler på hvordan man kan beskrive og organisere data for publisering.

Vær klar over at det er begrenset mulighet for å endre på filstruktur og data når datasettet først er lastet opp. Vi anbefaler derfor at du gjør datasettet helt klart før du laster opp.

Et datasett kan ikke inneholde mer enn 300 filer. Trenger du å arkivere flere filer, kan du enten

  • Pakke inn filene i en eller flere (maks. 300) pakkefiler (zip).
  • Dele datasettet opp i flere (del)datasett.

Dersom filene dine er organisert i mapper (og undermapper) og du ønsker å ta vare på denne mappestrukturen i datasettet ditt, klikker du på Upload a Folder. Deretter klikker du på Select a Directory og velger den mappen som inneholder mappene og filene som du ønsker å laste opp. Merk at det øverste nivået i mappen ikke vil bli lastet opp/reflektert i datasettet, bare innholdet.

Filer:

  • Alle datasett må følges av en ReadMe-fil. Denne filen skal lagres i rent tekstformat (.txt) og ha prefikset 00 for å sikre at den havner øverst på listen over filer. Se arkiveringsguiden for nærmere beskrivelse av ReadMe-filen.
  • Visse filformater er bedre egnet enn andre for arkivering. Vi anbefaler at alle filer i datasettet er i et av de foretrukne filformatene. Originalformatet kan lastes opp i tillegg om du ønsker.
  • Størrelsen på individuelle filer bør ikke overstige 100 GB. Store filer kan skape problemer ved nedlasting og gjenbruk.
  • En filopplasting bør ikke overstige 200 GB av hensyn til problemfri overføring av data.

Metadata:

  • Vær obs på at alle navn skal være på formatet Etternavn, Fornavn.
  • Vær gjerne raus med nøkkelord, og legg dem til enkeltvis ved å bruke plusstegnet.
  • Beskrivelsen av datasettet bør gi utenforstående en god forståelse av hva det dreier seg om. Du kan gjerne bruke abstract for eventuell artikkel som utgangspunkt, men vær nøye med å presisere hva slags data det er snakk om, hvordan de er samlet inn eller produsert, og hvorfor.
  • Noen metadatafelt er obligatoriske, andre valgfrie. Arkiveringsguiden har mer informasjon om metadatafeltene.
  • Etter å ha lagret første utkast, vil du få mulighet til å legge inn flere metadata ved å trykke på «Add + Edit Metadata». Se liste over anbefalte felt.

Data om personer

Datasett som inneholder direkte eller indirekte identifiserende personopplysninger kan ikke publiseres i DataverseNO, jf DataverseNO Deposit Agreement. Derimot kan anonymiserte datasett i mange tilfeller publiseres. For å sikre at dette gjøres på en lovlig og etisk måte, må alle som laster opp datasett som er basert på informasjon om eller fra enkeltpersoner, fylle ut et lite Nettskjema. Her må du vurdere om datasettet er anonymt, beskrive hvordan data eventuelt ble anonymisert og hvilken informasjon som har blitt gitt til deltakerne. Mer inngående informasjon om vurderinger før publisering er tilgjengelig i eksempelmal for etisk og juridisk vurdering, og wiki om behandling av personopplysninger i forskning kan også være nyttig.

I tillegg oppfordres du til å legge ved relevant dokumentasjon som del av datasettet. Dette kan inkludere informasjonsskriv og samtykkeskjema, spørreskjema og eventuell intervjuguide, samt den etiske/juridiske vurderingen basert på svarene i Nettskjemaet over.

Gjennomgang og kuratering av datasett

Når du er fornøyd med datasettet, sender du det inn til review. En kurator ved Universitetsbiblioteket vil deretter gå gjennom det og enten publisere eller sende det i retur med tilbakemelding dersom noe er uklart. Dersom du ønsker å gi noen tilgang til datasettet før det er publisert (for eksempel redaktør, fagfelle eller samarbeidspartnere), kontakt Research Data @NTNU.

Se også

Kontakt