Tale til tekst

Wikier

Tale til tekst er en kunstig intelligensbasert tjeneste utviklet ved NTNU som kan brukes til automatisk transkribering av visse klassifiseringer av data (åpne og interne). På denne siden finner du informasjon om hva du kan bruke tjenesten til og hvordan du tar den i bruk.

Temaside om forskningsdata | Temaside for programvare

Engelsk versjon: Speech to text

Innholdsfortegnelse [-]

illustrasjon med laptop, snakkeboble og transkribert dokument

Hva er Tale til tekst?

Tale til tekst er en tjeneste for automatisk transkribering ved bruk av språkmodellen Whisper fra OpenAI. Whisper gjenkjenner 98 forskjellige språk, deriblant norsk og engelsk. Du kan enten transkribere tekst i samme språk eller oversette til engelsk.

Tale til tekst kan brukes til å transkribere de aller fleste typene lyd- og videofiler med åpne (grønne) og interne (gule) data, for eksempel lydopptak, opptak fra Zoom eller Panopto (.opus fungerer dessverre ikke). Tjenesten kan også brukes for å effektivisere arbeidet med teksting av video. Les mer om ulike tjenester og verktøy for teksting av video.

Kvaliteten på den automatiske transkriberingen med Whisper vil variere, og det er nødvendig med manuell gjennomgang og korrigering. Dette avhenger både av lydkvaliteten på selve opptaket, samt hvilket språk eller dialekt som skal transkriberes.

Ta i bruk

Logg inn i Tale til tekst

Logg inn i Tale til tekst. Husk at du må være koblet på NTNUs nettverk, enten direkte fra campus eller via VPN. Du bruker din NTNU-bruker for å logge deg inn (Feide-innlogging).
Velg hvilket språk du ønsker å transkribere, eller om du vil ha automatisk gjenkjenning. Hvis du vil ha lydfilene oversatt til engelsk, så krysser du av for dette.
Velg lyd- eller videofilene du ønsker å transkribere ved å dra over filer eller trykke på “browse files”. Husk å lese gjennom bruksvilkårene og krysse av for at du har klassifisert dine data. Selve transkriberingen kan ta litt tid, avhengig av hvor lang køen er. Du vil motta en e-post når alle transkripsjoner er ferdige.
Last ned filene i ønsket format (txt, vtt eller srt). Velg srt-format om du skal tekste video.

Opplastede lyd/video-filer slettes med en gang transkripsjonen er ferdig. Transkriberte filer blir automatisk slettet etter 14 dager, om du ikke sletter de selv.

Retningslinjer for bruk

Fri bruk for NTNUs studenter og ansatte.
Tjenesten skal kun brukes på åpne eller interne data, men ikke fortrolige (røde) eller strengt fortrolige (svarte) data.

Klassifisering av personopplysninger

Personopplysninger - inkludert forskningsdata som inneholder personopplysninger - klassifiseres som regel som interne eller fortrolige data. Tal til tekst kan IKKE brukes på materiale som inneholder særlige kategorier av persondata, da disse som hovedregel vil klassifiseres som fortrolige. Særlig kategorier inkluderer tema som helse, religion, rase eller politisk oppfatning. I tillegg vil forretningshemmeligheter eller forskning underlagt eksportkontroll vanligvis klassifiseres som fortrolig.

Vær oppmerksom på at alt av lyd i filer som blir lastet opp blir transkribert. Tenk derfor nøye gjennom om fortrolige eller sensitive tema tas opp, også om det skulle være uforutsett eller av lite omfang. Se også NTNUs lagringsguide for mer informasjon og eksempler på klassifisering av personopplysninger.

Håndtering av data og personvern

Tale til tekst er satt opp på servere og infrastruktur på NTNU IT, og lyd- eller videoinnholdet ditt forlater ikke NTNU og deles ikke med andre. Tjenesten er levert fra Forskningsdataprosjektet ved NTNU (2021-25) som også har gjennomført risikovurdering og personvernkonsekvensvurdering (DPIA).

Se også personvernerklæring for Tale til tekst.

Kontakt

Ta kontakt via NTNU Hjelp om du har spørsmål om bruk av Tale til tekst.

Har du behov for hjelp eller har spørsmål om forskningsdata, besøk Forskningsdatahjelpen (Research Data @NTNU) for mer informasjon.

30159 Visninger

Målgruppe: Medarbeidere Studenter Tema: Forskning Formidling

Tagger

ub forskningsdata transkribering talegjenkjenning autotekst taletiltekst lydopptak forskningsdatahjelpen

Vedlegg

PNG

Informasjonsklasser åpen og intern.png

PNG

taletiltekst-turkisoransje 300x300pxl.png