Automatische transcriptie met Amberscript
Informatie over het gebruik van Amberscript
Verbeteren van de kwaliteit van de automatische transcriptie
Inleiding
Amberscript is een handige tool om opnames van gesprekken of interviews automatisch om te zetten naar geschreven tekst (transcriberen). Hoewel dit niet foutloos gaat, kan het gebruik van deze tool tijd en kosten besparen vergeleken met handmatige transcriptie of uitbesteding daarvan.
Uit een pilotproject dat de hogeschoolbibliotheek van 2019 t/m 2022 heeft uitgevoerd onder onderzoekers bleek dat het gebruik van Amberscript voor de hogeschool zinvol is. Daarom gaan we in 2023 na of het mogelijk is om Amberscript ongelimiteerd door zowel onderzoekers als studenten van de HHs te laten gebruiken.
Hoe werkt Amberscript
Amberscript zet audiobestanden snel en veilig om in in bewerkbare transcripten. Dat biedt de mogelijkheid om gemakkelijk door audio- en videobestanden te zoeken. Met behulp van de software kunnen audio- en videobestanden worden geüpload naar een webomgeving, waarna gebruikers de taal kunnen kiezen waarin het bestand moet worden getranscribeerd. Er worden al 39 talen ondersteund.
Voor transcriptie en ondertiteling worden de volgende bestandsformaten ondersteund.
Audio: AAC,DSS, FLAC, GSM, MP2, M4A, MP3, MPA, WAV.
Video: M4V, MOV, WMV, AVI, MP4, TS, FLV.
Audio/Video: MPEG, MPG, OGG, 3GP, OB, WMA, MXF, WebM.
Nadat het audiobestand is geüpload en de gewenste taal is gekozen, wordt het bestand snel omgezet in een bewerkbaar transcript. Zodra het transcript klaar is, ontvangt de gebruiker een e-mailnotificatie met een link waarmee hij het transcript in zijn persoonlijke webomgeving kan bekijken.
Het transcript is machinaal gegenereerd en is dus niet perfect. Daarom bevat AmberScript ook een handige webeditor die de mogelijkheid biedt om het audiobestand te beluisteren en tegelijkertijd eenvoudig fouten van de machine te corrigeren.
Na het bewerken zijn er verschillende andere functies beschikbaar, zoals het toevoegen van hoogtepunten in het audiobestand of het exporteren van het transcript in verschillende formaten.
Toegang tot Amberscript
Belangrijk: gebruik voor Amberscript altijd een recente versie van de browser Google Chrome
1. Heb je ooit eerder een account aangemaakt bij Amberscript zonder gebruik te maken van je HHs SURFconext login? Download dan éérst eventueel aanwezige bestanden en stuur een email aan [email protected] dat je oude account verwijderd kan worden. De bibliotheek handelt het verder af.
2. Wil je Amberscript voor het eerst gaan gebruiken via SURFconext (SSO)? Ga dan naar: https://app.amberscript.com/saml en type (een deel van) de naam van onze instelling bijv. haag of hague. Klik vervolgens op: De Haagse Hogeschool.
Je kunt inloggen via SURFconext met je reguliere inloggegevens. Eenmalig moet je toestemming geven voor het gebruik van je persoonsgegevens voor toegang. Je komt dan in je persoonlijke Amberscriptomgeving terecht.
Het saldo staat op 10 min. en bij gebruik van Amberscript wordt het urentegoed negatief, maar dat is geen probleem.
Bij vragen of problemen kun je contact opnemen met de bibliotheek: [email protected]
Informatie over het gebruik van Amberscript
Het werkt vrij intuïtief, bekijk de demo in Amberscript zelf. Voor meer informatie zie:
Automatische transcriptie en Kennisbank, met name de Blog en de Helpdesk (Aan de slag; FAQ).
Over de privacy: de audio en transcripten worden uitsluitend automatisch, versleuteld en geanonimiseerd verwerkt. De HHs heeft een Verwerkersovereenkomst afgesloten met Amberscript.
Amberscript mobile app
Er is ook een mobile app beschikbaar via de App Store en Google Play. Daarmee kun je met je smartphone audio of video opnemen, automatisch transcriberen, editen en exporteren. Ook is er functie voor live transcriptie. Afhankelijk van de audio kwaliteit is de accuratesse tot 80 %.
Nota bene: de mobile app kan helaas niet meer gebruikt worden, nu de inlog via SSO (SURFconext) plaatsvindt. Amberscript werkt aan een oplossing.
Verbeteren van de kwaliteit van de automatische transcriptie
Automatische transcripties zijn niet perfect. De audiokwaliteit is de belangrijkste factor die bepaalt hoe goed de spraak zal worden omgezet naar tekst. Het gebruik van een externe microfoon wordt aangeraden. Lees s.v.p. de handleiding waarin wordt uitgelegd hoe de audiokwaliteit verbeterd kan worden.
Webeditor sneltoetsen
Afspelen en pauzeren van je audio bestand: Control+Spatie {of alleen Spatie}
Ga vijf seconden terug in je audio bestand: Control+R
Audio laten verspringen bij klikken: Alt+Klik
Tekst markeren: Control+H
Ongedaan maken: Control+Z
Herstellen: Control+Shift+Z