Ändra sökning
Avgränsa sökresultatet
1 - 12 av 12
RefereraExporteraLänk till träfflistan
Permanent länk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Träffar per sida
  • 5
  • 10
  • 20
  • 50
  • 100
  • 250
Sortering
  • Standard (Relevans)
  • Författare A-Ö
  • Författare Ö-A
  • Titel A-Ö
  • Titel Ö-A
  • Publikationstyp A-Ö
  • Publikationstyp Ö-A
  • Äldst först
  • Nyast först
  • Skapad (Äldst först)
  • Skapad (Nyast först)
  • Senast uppdaterad (Äldst först)
  • Senast uppdaterad (Nyast först)
  • Disputationsdatum (tidigaste först)
  • Disputationsdatum (senaste först)
  • Standard (Relevans)
  • Författare A-Ö
  • Författare Ö-A
  • Titel A-Ö
  • Titel Ö-A
  • Publikationstyp A-Ö
  • Publikationstyp Ö-A
  • Äldst först
  • Nyast först
  • Skapad (Äldst först)
  • Skapad (Nyast först)
  • Senast uppdaterad (Äldst först)
  • Senast uppdaterad (Nyast först)
  • Disputationsdatum (tidigaste först)
  • Disputationsdatum (senaste först)
Markera
Maxantalet träffar du kan exportera från sökgränssnittet är 250. Vid större uttag använd dig av utsökningar.
  • 1.
    Ahltorp, Magnus
    et al.
    Institutet för språk och folkminnen, Språkrådet.
    Hessel, Jean
    Institutet för språk och folkminnen, Språkrådet.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Skeppstedt, Maria
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    A Digital Swedish–Yiddish/Yiddish–Swedish Dictionary: A Web-Based Dictionary that is also Available Offline2022Ingår i: Proceedings of the EURALI Workshop @LREC2022, 2022Konferensbidrag (Refereegranskat)
    Abstract [en]

    Yiddish is one of the national minority languages of Sweden, and one of the languages for which the Swedish Institute for Language and Folklore is responsible for developing useful language resources. We here describe the web-based version of a Swedish–Yiddish/Yiddish–Swedish dictionary. The single search field of the web-based dictionary is used for incrementally searching all three components of the dictionary entries (the word in Swedish, the word in Yiddish with Hebrew characters and the transliteration in Latin script). When the user accesses the dictionary in an online mode, the dictionary is saved in the web browser, which makes it possible to also use the dictionary offline.

  • 2. Berg, Johanna
    et al.
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    Edlund, Jens
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Fallgren, Per
    House, David
    Lindström, Eva
    Magnusson Petzell, Erik
    Institutet för språk och folkminnen, Dialekt-, namn- och folkminnesarkivet i Göteborg (DAG).
    Malisz, Zofia
    Nylund Skog, Susanne
    Institutet för språk och folkminnen, Dialekt- och folkminnesarkivet i Uppsala (DFU).
    Öqvist, Jenny
    Institutet för språk och folkminnen, Dialekt- och folkminnesarkivet i Uppsala (DFU).
    Making Archival Speech Recordings Accessible for Research: A Report from the Tilltal Project2019Ingår i: Svenska landsmål och svenskt folkliv, ISSN 0347-1837, Vol. 141, s. 171-178Artikel i tidskrift (Övrigt vetenskapligt)
  • 3.
    Domeij, Rickard
    et al.
    Institutet för språk och folkminnen, Språkrådet.
    Edlund, Jens
    TMH, KTH.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Fallgren, Per
    TMH, KTH.
    David, House
    TMH, KTH.
    Lindström, Eva
    Institutionen för lingvistik, SU.
    Nylund Skog, Susanne
    Institutet för språk och folkminnen, Dialekt- och folkminnesarkivet i Uppsala (DFU).
    Öqvist, Jenny
    Institutet för språk och folkminnen, Dialekt- och folkminnesarkivet i Uppsala (DFU).
    Exploring the archives for textual entry points to speech: Experiences of interdisciplinary collaboration in making cultural heritage accessible for research2020Ingår i: Proceedings of the Twin Talks 2 and 3 Workshops at DHN 2020 and DH 2020 / [ed] Steven Krauwer & Darja Fišer, Riga, 2020, Vol. 2717, s. 45-55Konferensbidrag (Övrigt vetenskapligt)
    Abstract [en]

    Tilltal (Tillgängligt kulturarv för forskning i tal, ‘Accessible cultural heritage for speech research’) is a multidisciplinary and methodological project undertaken by the Institute of Language and Folklore, KTH Royal Institute of Technology, and The Swedish National Archives in cooperation with the National Language Bank and SWE-CLARIN [1]. It aims to provide researchers better access to archival audio recordings using methods from language technology. The project comprises three case studies and one activity and usage study. In the case studies, actual research agendas from three different fields (ethnology, sociolinguistics, and interaction analysis) serve as a basis for identifying procedures that may be simplified with the aid of digital tools. In the activity and usage study, we are applying an activity-theoretical approach with the aim of involving researchers and investigating how they use – and would like to be able to use – the archival resources at ISOF. Involving researchers in participatory design ensures that digital solutions are suggested and evaluated in relation to the requirements expressed by researchers engaged in specific research tasks[2].In this paper, we focus on one of the case studies, which investigates the process by which personal experience narratives are transformed into cultural heritage [3], and account for our results in exploring how different types of text material from the archives can be used to find relevant sections of the audio recordings. Finally, we discuss what lessons can be learned, and what conclusions can be drawn, from our experiences of interdisciplinary collaboration in the project.

  • 4.
    Domeij, Rickard
    et al.
    Institutet för språk och folkminnen, Språkrådet.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Magnusson Petzell, Erik
    Institutet för språk och folkminnen.
    Nylund Skog, Susanne
    Institutet för språk och folkminnen.
    Skott, Fredrik
    Institutet för språk och folkminnen.
    Öqvist, Jenny
    Institutet för språk och folkminnen.
    Lindström, Eva
    Lingvistik, SU.
    Text as an entryway to speech: a journey into the most inaccessible areas of the archives2019Ingår i: Book of abstracts 4th Conference of The Association Digital Humanities in the Nordic Countries Copenhagen, March 6–8 2019., 2019Konferensbidrag (Refereegranskat)
  • 5.
    Eriksson, Gunnar
    et al.
    Institutet för språk och folkminnen, Språkrådet.
    Karlgren, Jussi
    KTH, Teoretisk datalogi, TCS.
    Features for modelling characteristics of conversations: Notebook for PAN at CLEF 20122012Ingår i: CLEF 2012 Evaluation Labs and Workshop Online Working Notes, 2012Konferensbidrag (Refereegranskat)
    Abstract [en]

    In this experiment, we find that features which model interaction andconversational behaviour contribute well to identifying sexual grooming behaviourin chat and forum text. Together with the obviously useful lexical features —which we find are more valuable if separated by who generates them — weachieve very successful results in identifying behavioural patterns which maycharacterise sexual grooming. We conjecture that the general framework can beused for other purposes than this specific case if the lexical features are exchangedfor other topical models, the conversational features characterise interaction andbehaviour rather than topical choice.

    Ladda ner fulltext (pdf)
    Eriksson Karlgren 2012 Features for modelling characteristics of conversations
  • 6. Skeppstedt, Maria
    et al.
    Ahltorp, Magnus
    Institutet för språk och folkminnen, Språkrådet.
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Öqvist, Jenny
    Institutet för språk och folkminnen, Avdelningen för arkiv och forskning i Uppsala (AFU).
    Mining for Recurring Themes in Speech Recording Descriptions2021Konferensbidrag (Refereegranskat)
    Ladda ner fulltext (pdf)
    Mining for Recurring Themes in Speech Recording Descriptions 2021
  • 7. Skeppstedt, Maria
    et al.
    Ahltorp, Magnus
    Institutet för språk och folkminnen, Språkrådet.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    A Pipeline for Manual Annotations of Risk Factor Mentions in the COVID-19 Open Research Dataset2021Ingår i: Selected Papers from the CLARIN Annual Conference 2020, 2021Konferensbidrag (Refereegranskat)
    Abstract [en]

    We here demonstrate how a set of tools that are being maintained and further developed within the Språkbanken Sam and SWE-CLARIN infrastructures can be employed for creating manually labelled training data in a low-resource setting. As example text, we used the “COVID-19 Open Research Dataset”, and created manually annotated training data for its associated Kaggle task,“What do we know about COVID-19 risk factors?”. We first used our topic modelling tool to i) select a text set for manual annotation, ii) classify the texts into preliminary classification categories, and iii) analyse the texts in search for potential refinements of the annotation categories. We then annotated the text set on a more granular level by labelling the token sequences that indicated the existence of the refined categories in the text. Finally, we used the granularly annotated text set as a seed set, and applied our active learning tool for actively selecting additional texts for annotation. For the token-sequence annotations, we used our text annotation tool, which includes support for incorporating automatic pre-annotations.

  • 8.
    Skeppstedt, Maria
    et al.
    Institutet för språk och folkminnen.
    Ahltorp, Magnus
    Institutet för språk och folkminnen, Språkrådet.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    Annotating risk factor mentions in the COVID-19 Open Research Dataset2020Ingår i: Proceedings of CLARIN Annual Conference 2020 / [ed] Costanza Navarretta and Maria Eskevich, 2020, s. 52-55Konferensbidrag (Refereegranskat)
    Abstract [en]

    We here describe the creation of manually annotated training data for the Kaggle task “What do we know about COVID-19 risk factors?”. We applied our text mining tool on the “COVID-19 Open Research Dataset” to i) select data for manual annotation, ii) classify the data into initially established classification categories, and iii) analyse our data set in search for potential refinements of the annotation categories. The process resulted in a corpus consisting of 50,000 tokens, for which each token is annotated as to whether it is part of an expression that functions as a “risk factor trigger”. Two types of risk factor triggers were annotated, those indicating that the text describes a risk factor, and those indicating that something could not be shown to be a risk factor.

  • 9.
    Skeppstedt, Maria
    et al.
    Institutet för språk och folkminnen.
    Ahltorp, Magnus
    Institutet för språk och folkminnen, Språkrådet.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    Line-a-line: A Tool for Annotating Word-Alignment2020Ingår i: Proceedings of the 13th Workshop on Building and Using Comparable Corpora / [ed] Reinhard Rapp, Pierre Zweigenbaum och Serge Sharoff, 2020, s. 1-5Konferensbidrag (Refereegranskat)
    Abstract [en]

    We here describe line-a-line, a web-based tool for manual annotation of word-alignments in sentence-aligned parallel corpora. The graphical user interface, which builds on a design template from the Jigsaw system for investigative analysis, displays the words from each sentence pair that is to be annotated as elements in two vertical lists. An alignment between two words is annotated by drag-and-drop, i.e. by dragging an element from the left-hand list and dropping it on an element in the right-hand list. The tool indicates that two words are aligned by lines that connect them and by highlighting associated words when the mouse is hovered over them. Line-a-line uses the efmaral library for producing pre-annotated alignments, on which the user can base the manual annotation. The tool is mainly planned to be used on moderately under-resourced languages, for which resources in the form of parallel corpora are scarce. The automatic word-alignment functionality therefore also incorporates information derived from non-parallel resources, in the form of pre-trained multilingual word embeddings from the MUSE library.

  • 10. Skeppstedt, Maria
    et al.
    Dahlberg, Simon
    Institutet för språk och folkminnen, Språkrådet.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    Texts and Terms from Swedish Public Agencies in the SB Sam Language Bank2020Ingår i: Proceedings of SLTC 2020, 2020Konferensbidrag (Refereegranskat)
    Abstract [en]

    We here describe data from the SB Sam Language Bank, one of three divisions within the Swedish language technology and research infrastructure The National Language Bank of Sweden. The SB Sam Language Bank aims at making data gathered by the Institute for Language and Folklore more available, i.e. folklore and dialect archives, terms and dictionaries, as well as language data produced at other Swedish public agencies. The data gathered from public agencies in SB Sam consists of three main repositories, (i) translation memories, i.e. sentence-aligned texts in different languages that have either been extracted from translation tools or from automatically sentence-aligned parallel texts, (ii) terms gathered from public agencies, and (iii) parallel texts in several languages, that either have been crawled from public agency web sites or that were received directly from the agency.

  • 11.
    Skeppstedt, Maria
    et al.
    Institutet för språk och folkminnen.
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Öqvist, Jenny
    Institutet för språk och folkminnen, Avdelningen för arkiv och forskning i Uppsala (AFU).
    Digital humanities for the spreadsheet nerd: Presenting the output of a topic modelling tool as tabular data2022Ingår i: DHNB 2022 Conference: Book of Abstracts, 2022Konferensbidrag (Refereegranskat)
  • 12. Skeppstedt, Maria
    et al.
    Kangas, Elina
    Institutet för språk och folkminnen, Språkrådet.
    Ljunglöf, Peter
    Eriksson, Gunnar
    Institutet för språk och folkminnen, Språkrådet.
    Domeij, Rickard
    Institutet för språk och folkminnen, Språkrådet.
    Plans for using texts from public authorities for creating a partly parallel Meänkieli corpus2020Konferensbidrag (Refereegranskat)
1 - 12 av 12
RefereraExporteraLänk till träfflistan
Permanent länk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf