Wikier

NTNU Open Data

Her finner du informasjon om hvordan du kan arkivere datasett i NTNUs arkiv for åpne data i DataverseNO.

Temaside om forskningsdata | Sider merket med åpne data

English version - NTNU Open Data

Om NTNU og DataverseNO

NTNU-samlingen i DataverseNO er et institusjonsarkiv som kan brukes for åpne datasett fra alle fag og disipliner. Arkivet er en del av DataverseNO, som driftes av UiT Norges Arktiske Universitet. NTNU følger retningslinjer og policy for DataverseNO, dette innebærer blant annet at alle datasett gjennomgår en kuratorkontroll før de publiseres. DataverseNO er Core Trust-sertifisert og utsteder DOI for alle publiserte datasett (Digital Object Identifier). Standardlisens for arkivet er CC0 (Creative Commons Zero), men ved behov kan andre åpne lisenser vurderes.

Hvordan arkivere i DataverseNO

Du kan logge inn i NTNU-samlingen med FEIDE (din NTNU-bruker). DataverseNO har laget en guide for arkivering, og vi anbefaler at du tar en kikk på denne. Guiden er omfattende, og det er ikke alt som er like relevant for alle. Vi gjengir derfor her noen viktige punkter det er lett å overse. Ta også gjerne en kikk på noen av de andre datasettene i DataverseNO for å se eksempler på hvordan man kan beskrive og organisere data for publisering.

Vær klar over at det er begrenset mulighet for å endre på filstruktur og data når datasettet først er lastet opp. Vi anbefaler derfor at du gjør datasettet helt klart før du laster opp.

Et datasett kan ikke inneholde mer enn 300 filer. Trenger du å arkivere flere filer, kan du enten

  • Pakke inn filene i en eller flere (maks. 300) pakkefiler (zip).
  • Dele datasettet opp i flere (del)datasett.

Dersom filene dine er organisert i mapper (og undermapper) og du ønsker å ta vare på denne mappestrukturen i datasettet ditt, klikker du på Upload a Folder. Deretter klikker du på Select a Directory og velger den mappen som inneholder mappene og filene som du ønsker å laste opp. Merk at det øverste nivået i mappen ikke vil bli lastet opp/reflektert i datasettet, bare innholdet.

Filer:

  • Alle datasett må følges av en ReadMe-fil. Denne filen skal lagres i ren tekstformat (.txt) og ha prefikset 00 for å sikre at den havner øverst på listen over filer. Se arkiveringsguiden for nærmere beskrivelse av ReadMe-filen.
  • Visse filformater er bedre egnet enn andre for arkivering. Dersom datasettet er på et annet format, anbefaler vi at du konverterer til et av de foretrukne filformatene. Originalformatet kan lastes opp i tillegg.
  • Størrelsen på individuelle filer bør ikke overstige 100 GB. Store filer kan skape problemer ved nedlasting og gjenbruk.
  • En filopplasting bør ikke overstige 200 GB av hensyn til problemfri overføring av data.

Metadata:

  • Vær obs på at alle navn skal være på formatet Etternavn, Fornavn.
  • Vær gjerne raus med nøkkelord, og legg dem til enkeltvis ved å bruke plusstegnet.
  • Beskrivelsen av datasettet bør gi utenforstående en god forståelse av hva det dreier seg om. Du kan gjerne bruke abstract for eventuell artikkel som utgangspunkt, men vær nøye med å presisere hva slags data det er snakk om, hvordan de er samlet inn eller produsert, og hvorfor.
  • Etter å ha lagret første utkast, vil du få mulighet til å legge inn flere metadata ved å trykke på «Add + Edit Metadata». Se liste over anbefalte felt.
  • Arkiveringsguiden har også mer informasjon om metadatafeltene.

Når du er fornøyd med datasettet, sender du det inn til review. En kurator ved Universitetsbiblioteket vil deretter gå gjennom det og enten publisere eller sende det i retur med tilbakemelding dersom noe er uklart. Dersom du ønsker å gi noen tilgang til datasettet før det er publisert (for eksempel redaktør, fagfelle eller samarbeidspartnere), kontakt Research Data @NTNU.

Se også

Kontakt