Modern språkdokumentation har gått från att fältlingvisten behandlar talarna av ett språk som ganska passiva informanter till att vara mycket aktiva språkkonsulter. I detta ingår att språkkonsulterna ska kunna hantera teknisk utrustning som inspelningsapparater och att kunna göra transkriptioner på egen hand.
Många verktyg för transkriptioner är dock komplicerade både att arbeta med och att exportera data från. Här presenteras ett språkoberoende verktyg för transkription av ljudfiler som är direkt anpassat för annotering enligt Leipzig glossing rules.
Verktyget presenterar ljudet på en webbsida som scrollas på vanligt sätt: uppåt och neråt. På detta sätt undviks den oöversiktliga vy som är vanlig i många verktyg där ljudet presenteras som en enda lång horisontell tidslinje och där användaren behöver zooma in och ut i materialet för att växla mellan översikt och detalj.
Ljudfilen delas upp i ungefär 10 sekunder långa delar, som sedan läggs under varandra. Verktyget försöker dela upp ljudfilen vid pauser, men om användaren hittar lämpligare punkter i ljudfilen kan punkterna enkelt justeras. Varje del av ljudfilen representeras av ett spektrogram som inte är tillräckligt högupplöst för ingående fonetiska analyser, men hjälper användaren att navigera och avgöra var yttranden börjar och slutar.
Användaren får sedan tillgång till tre transkriptionslager: fonetiskt/fonematiskt, glossning och fri översättning. Det fonetisk/fonematiska lagret ger ett stöd till glossningen. Glossningslagret används för morfosyntaktisk transkription och morfosyntaktisk förklaring enligt Leipzig glossing rules. Slutligen löper den fria översättningen över hela yttrandet.
Verktyget är tänkt att användas för ett lager i taget, där användaren markerar en region i spektrogrammet med musen, lyssnar på regionen med TAB-tangenten och sedan enkelt skriver in transkriptionen. Transkriptioner i det fonetisk/fonematiska lagret sprids ut över hela den markera- de regionen för att foner/fonem ska komma någorlunda nära respektive plats i spektrogrammet.
Verktyget kan generera direkt publicerbar LATEX-kod med formatering enligt Leipzig glossing rules och automatiska tidsstämplar för varje transkriberat yttrande i ljudfilen.
Verktyget utvecklas av Språkbanken Sam inom Nationella språkbanken.