Tale til tekst - Kunnskapsbasen
Tale til tekst
Tale til tekst er en NTNU-utviklet tjeneste for automatisk transkribering av åpne og interne data ved bruk av kunstig intelligens. På denne siden finner du informasjon om hva du kan bruke tjenesten til og hvordan du tar den i bruk.
Temaside om forskningsdata | Temaside for programvare
Engelsk versjon: Speech to text
Hva er Tale til tekst?
Tale til tekst er en tjeneste for automatisk transkribering ved bruk av språkmodellen Whisper fra OpenAI. Whisper gjenkjenner 98 forskjellige språk, deriblant norsk og engelsk. Du kan enten transkribere tekst i samme språk eller oversette til engelsk.
Tale til tekst kan brukes til å transkribere de aller fleste typene lyd- og videofiler med åpne (grønne) og interne (gule) data, for eksempel lydopptak, opptak fra Zoom eller Panopto (.opus fungerer dessverre ikke). Tjenesten kan også brukes for å effektivisere arbeidet med teksting av video. Les mer om ulike tjenester og verktøy for teksting av video.
Kvaliteten på den automatiske transkriberingen med Whisper vil variere, og det er nødvendig med manuell gjennomgang og korrigering. Dette avhenger både av lydkvaliteten på selve opptaket, samt hvilket språk eller dialekt som skal transkriberes.
Ta i bruk
- Logg inn i Tale til tekst. Husk at du må være koblet på NTNUs nettverk, enten direkte fra campus eller via VPN. Du bruker din NTNU-bruker for å logge deg inn (Feide-innlogging).
- Velg hvilket språk du ønsker å transkribere, eller om du vil ha automatisk gjenkjenning. Hvis du vil ha lydfilene oversatt til engelsk, så krysser du av for dette.
- Velg lyd- eller videofilene du ønsker å transkribere ved å dra over filer eller trykke på “browse files”. Husk å lese gjennom bruksvilkårene og krysse av for at du har klassifisert dine data. Selve transkriberingen kan ta litt tid, avhengig av hvor lang køen er. Du vil motta en e-post når alle transkripsjoner er ferdige.
- Last ned filene i ønsket format (txt, vtt eller srt). Velg srt-format om du skal tekste video.
Opplastede lyd/video-filer slettes med en gang transkripsjonen er ferdig. Transkriberte filer blir automatisk slettet etter 14 dager, om du ikke sletter de selv.
Retningslinjer for bruk
- Fri bruk for NTNUs studenter og ansatte.
- Tjenesten skal kun brukes på åpne eller interne data, men ikke fortrolige (røde) eller strengt fortrolige (svarte) data.
Klassifisering av personopplysninger
Som regel klassifiseres personopplysninger som interne eller fortrolige data, inkludert forskningsdata som inneholder personopplysninger. Dette betyr blant annet at du IKKE kan bruke tjenesten på materiale som inneholder særlige kategorier av persondata, da disse som hovedregel vil klassifiseres som fortrolige. Særlig kategorier inkluderer tema som helse, religion, rase eller politisk oppfatning. I tillegg vil forretningshemmeligheter eller forskning underlagt eksportkontroll vanligvis klassifiseres som fortrolig.
Vær oppmerksom på at alt av lyd i filer som blir lastet opp blir transkribert. Tenk derfor nøye gjennom om fortrolige eller sensitive tema tas opp, også om det skulle være uforutsett eller av lite omfang. Se også NTNUs lagringsguide for mer informasjon og eksempler på klassifisering av personopplysninger.
Håndtering av data og personvern
Tale til tekst er satt opp på servere og infrastruktur på NTNU IT, og lyd- eller videoinnholdet ditt forlater ikke NTNU og deles ikke med andre. Tjenesten er levert fra Forskningsdataprosjektet ved NTNU (2021-25) som også har gjennomført risikovurdering og personvernkonsekvensvurdering (DPIA).
Se også personvernerklæring for Tale til tekst.
Kontakt
Ta kontakt via NTNU Hjelp om du har spørsmål om bruk av Tale til tekst.
Har du behov for hjelp eller har spørsmål om forskningsdata, besøk Forskningsdatahjelpen (Research Data @NTNU) for mer informasjon.