We here demonstrate how two types of NLP models - a topic model and a word2vec model - can be combined for exploring the content of a collection of Swedish Government Reports. We investigate if there are topics that frequently occur in paragraphs mentioning the word "democracy". Using the word2vec model, 530 clusters of semantically similar words were created, which were then applied in the pre-processing step when creating a topic model. This model detected 15 reoccurring topics among the paragraphs containing "democracy". Among these topics, 13 had closely associated paragraphs with a coherent content relating to some aspect of democracy.
Yiddish is one of the national minority languages of Sweden, and one of the languages for which the Swedish Institute for Language and Folklore is responsible for developing useful language resources. We here describe the web-based version of a Swedish–Yiddish/Yiddish–Swedish dictionary. The single search field of the web-based dictionary is used for incrementally searching all three components of the dictionary entries (the word in Swedish, the word in Yiddish with Hebrew characters and the transliteration in Latin script). When the user accesses the dictionary in an online mode, the dictionary is saved in the web browser, which makes it possible to also use the dictionary offline.
Innehåll
TRE UTOMNORDISKA PERSPEKTIV
Language planning and language policy for the EU and for international institutions / av Ulrich Ammon. The spaces and places of linguistic minorities / av Susan Gal. Rättstavning, offentlighet och legitimeringskris: 1996 års tyska reform / av Sally Johnson.
IDEOLOGIER, ATTITYDER, POLITIK OCH SPRÅKVÅRDSUPPGIFTER
Globalisme og hegemonisk tænkning i sprogpolitiken / av Hartmut Haberland. Kursändring i klarspråksarbetet? Om myndighetsspråkvård och språkforskning / av Catharina Nyström Höög. On the sociolinguistic and political limits of language planning and langauge policy - the lessons to be learned from the Norwegian case / av Ernst Håkon Jahr. The potency and impotency of official language policy / av Tore Kristiansen. The »overt« and »covert« ub LPP terminology / av Páll Kristinsson.
FLERSPRÅKIGHET OCH SPRÅKPOLITIK I UTBILDNINGEN
Tvåspråkig ämneskompetens? En studie av naturvetenskaplig parallellspråkighet i svensk högre utbildning av John Airey och Cedric Linder. Språkpolitik - från EU till klassrummet / av Carla Jonsson. Språklig mångfald inom den högre utbildningen: att analysera policy och praktik / av Jan Lindström och Mirja Saari. Internationalisering i praktiken. Språkbruk i två svenska utbildningsmiljöer / av Hedda Söderlundh.
ORDBÖCKER OCH LEXIKAL NORMERING
SAOL mellan bruk och system / av Sven-Göran Malmgren. Om finlandismer och språkvårdens möjligheter att motverka dem / av Charlotta af Hällström-Reijonen. Rettskrivningsordbøker som normeringsreiskapar i Norden / av Lars S. Vikør
Naturen är bäst på att ta hand om sig själv. Det är grundtanken i det växande samhällsfenomenet återförvildande, eller rewilding på engelska. I många projekt världen över försöker man nu återställa naturen som den var innan människan förstörde den.
Vilka språk som syns i det offentliga rummet är betydelsefullt för samhället, både ur ett kommunikativt perspektiv och som en signal om vilka språk som uppfattas som betydelsefulla.
Språklagen uttrycker att offentlig verksamhet har ett ansvar för enskildas tillgång till språk: svenska, nationella minoritetsspråk, det svenska teckenspråket och andra modersmål. Av tradition har svensk språkvård främst fokuserat på nyttoperspektivet, det vill säga effektiviteten i myndigheters kommunikation, men Svenskan är den fasta inredningen har istället fokus på symboliska aspekter av språkanvändning i offentliga miljöer.
Rapporten ger en inblick i hur flerspråkigheten synliggörs i offentlig miljö i Sverige. Språkrådet har kartlagt vilka språk som syns på skyltar och anslag, på 14 vårdcentraler och 14 bibliotek, i 11 svenska orter. Undersökningen är ett led i Institutet för språk och folkminnens uppdrag att följa upp språklagen, och att regelbundet undersöka användningen av svenska och andra språk i Sverige.
The study compares the uses of the native-speaker concept as a legitimizing resource in language-standard ideologies and normative discourse in five languages of European origin. Much research and international discussion has focused on the native speaker of English, a symbolically international language. We aim to show how the native-speaker concept may function differently in national-standard ideologies. The study entails a concise comparison of five European standardization ideologies, a closer look at three such ideologies, and a case study of the native speakers’ function in the normative discourse on a syntactic construction of a national language, namely Swedish. Much language planning and standardizing relies on academic linguistics for legitimacy, and native speakers’ judgments are an irrefutable data source in theoretical linguistics. However, the concept of the native speaker as a judge of linguistic material is recontextualized in normative discourse. Drawing on analyses of national-standard ideologies and standardizing discourse, results indicate that the native speaker may have different repercussions depending on the heterogeneity of the speech community and the standard ideology. We argue that the native speaker may function as a border marker of the standard language, but in national languages also of what is considered intralingual variation, and thus in symbolic terms the nation.
The theme of this study is the linguistic experiences of inter-Scandinavian communication. More specifically, using language portraits as a method, the study maps the linguistic experiences of two individuals who have moved from Denmark to Sweden as adults, and who now speak in a manner that generally passes as Swedish. The focus of the present study, however, is not these individuals’ acquisition of the Swedish language but their experiences of friction between differing ways of evaluating interaction in the two countries. Several of the individuals’ narrated experiences illustrate how utterances which in Denmark are perceived as witty and humorous are perceived as vulgar and aggressive in Sweden. The individuals’ experiences and the sociolinguistic implications of them are analyzed using notions and perspectives from Pierre Bourdieu – in particular, the notions of linguistic habitus and linguistic market are used – along with the notion of Spracherleben, developed by Brigitta Busch. The study illuminates that even though Danish and Swedish are closely related languages, there are significant differences in the pragmatic logic that prevail in the linguistic markets of the two countries, and that these differences generate critical effects on the linguistic experiences of these mobile individuals.
Med de nya möjligheter den digitala tekniken och språkteknologin ger, kaninformation och medier göras tillgängliga för fler. Ett aktuellt exempel är utvecklingenav teknik för direkttextad tv baserad på talteknologi som gör attBBC sedan en tid tillbaka textar alla sina program. Men teknikutvecklingenkräver kostsamma språkresurser; för ett direkttextningssystem krävs t.ex. storamängder systematiskt inspelat och transkriberat tal. Och eftersom det kommersiellaintresset för att ta fram sådana resurser för svenska och andra nordiskaspråk inte är tillräckligt stort, riskerar vi i de nordiska länderna i värsta fallatt bli utan sådan teknik. Därför har Språkrådet i samarbete med Sveriges television(SVT) tagit fram ett förslag på hur en nationell språkinfrastruktur somstimulerar utvecklingen av direkttextning på tv och andra tillgängliga tjänsterkan utvecklas.
Innehåll: Språkteknologi för språken i Sverige / av Rickard Domeij. NY TEKNIK, NYA MÖJLIGHETER: Att kommunicera med och utan teknik / av Peter Gärdenfors och Jana Holsanova. Att söka information på Internet / av Lars Iselid och Lars Våge. Nya metoder ger bättre maskinöversättning / av Anna Sågvall Hein. Bättre tala än texta - talteknologi nu och i framtiden / av Olav Engwall. SÅ PÅVERKAS SPRÅKET: Kommunikationsteknik och skrivande hos svenska skolbarn / av Sylvana Sofkova Hashemi. Läsning i gamla och nya medier / av Jana Holsanova, Kenneth Holmqvist och Nils Holmberg. Från datorprat till cyberkreol: samtal med datorer förändrar språket / av Staffan Larsson. TEKNIK FÖR ATT STUDERA SPRÅK: Att studera skrivande med hjälp av loggning / av Kirk Sullivan, Eva Lindgren och Ingmarie Mellenius. Studera språket med hjälp av en korpus / av Ylva Berglund Prytz. Lär dig använda digitala språkresurser / av Ola Karlsson. SPRÅK, TEKNIK OCH SAMHÄLLE: Sökteknologi och personlig integritet / av Jussi Karlgren. Tillgänglighet på webben / av Funda Denizhan. Datorstöd för samiska och andra minoritetsspråk / av Sjur Nørstebø Moshagen och Trond Trosterud.
Vad kan språkteknologin bidra med för att göra myndigheterna i de nordiska länderna tillgängliga för alla? I rapporten diskuteras frågan i form av artiklar baserade på de presentationer som hölls vid ett nordiskt seminarium i Linköping hösten 2010.
Med språkteknologiska hjälpmedel som automatisk textuppläsning och översättning finns möjligheter att förbättra tillgängligheten till information och service för alla, inte minst för personer med läs- och skrivsvårigheter, nationella minoriteter och personer med annat modersmål än majoritetsspråket m.fl. I ett demokratiskt perspektiv är det en angelägen uppgift att se till att sådan teknik utvecklas.
Tilltal (Tillgängligt kulturarv för forskning i tal, ‘Accessible cultural heritage for speech research’) is a multidisciplinary and methodological project undertaken by the Institute of Language and Folklore, KTH Royal Institute of Technology, and The Swedish National Archives in cooperation with the National Language Bank and SWE-CLARIN [1]. It aims to provide researchers better access to archival audio recordings using methods from language technology. The project comprises three case studies and one activity and usage study. In the case studies, actual research agendas from three different fields (ethnology, sociolinguistics, and interaction analysis) serve as a basis for identifying procedures that may be simplified with the aid of digital tools. In the activity and usage study, we are applying an activity-theoretical approach with the aim of involving researchers and investigating how they use – and would like to be able to use – the archival resources at ISOF. Involving researchers in participatory design ensures that digital solutions are suggested and evaluated in relation to the requirements expressed by researchers engaged in specific research tasks[2].In this paper, we focus on one of the case studies, which investigates the process by which personal experience narratives are transformed into cultural heritage [3], and account for our results in exploring how different types of text material from the archives can be used to find relevant sections of the audio recordings. Finally, we discuss what lessons can be learned, and what conclusions can be drawn, from our experiences of interdisciplinary collaboration in the project.
Syftet med arbetet bakom den här rapporten är att inventera utbudet av automatiska uppläsningsfunktionerför webben och gå igenom forskningen om deras användbarhet med fokus på personer med andra modersmålän svenska. Här presenteras resultatet av det arbetet. Målet är att öka vår egen kunskap om användningen ochanvändbarheten av hjälpmedel för textuppläsning, bl.a. för att kunna följa upp och ge vägledning tillmyndigheter och andra organisationer i deras tillgänglighetsarbete. Det kan ses som en del i vårt arbete meduppföljningen av språklagen.
Rapporten är uppdelad i fyra delar. I den första delen redogör vi för vad talsyntes är och hur det används somhjälpmedel vid läsning på nätet. I del två går vi igenom vilka hjälpmedel som finns för uppläsning av text påwebben och vilken funktionalitet de har. Vi ser också på vilka råd det finns för användningen av dem. Vi beröräven kort de skärmläsare som finns på marknaden, dvs. uppläsningshjälpmedel som användaren självinstallerat på sin dator. I del tre redogör vi för den forskning som finns om användbarheten avuppläsningshjälpmedel för olika grupper av användare med särskilt fokus på personer med andra modersmålän svenska. I del fyra drar vi slutsatser och blickar framåt.
"Vi ser resultatet av det arbete som gjorts i detta projekt som grundläggande för Språkrådet i arbetet med att utveckla metoder för att kontinuerligt kunna följa upp och utvärdera den flerspråkiga tillgängligheten på myndigheters webbplatser. Projektet visar att ett sådant utvärderingsarbete kan utgå från en kombination av webbplatsobservation och enkätundersökning som sedan komplettas med resultatet från andra studier som utförs i samarbete med minoritetsspråksrepresentanter och andra grupper."
Här finns en beskrivning av språkets struktur på tecken- upp till textnivå samt hur området framför den tecknande utnyttjas språkligt i en teckenspråkstext. Sidorna innehåller både text och film med exempel från svenskt teckenspråk.
Du kan läsa om vilka tecken som finns i teckenförrådet, hur de är uppbyggda och hur de bildas. Den grammatiska delen beskriver bland annat ordklasser, teckens formförändringar och satsbildning. Olika filmklipp visar hur riktningar och positioner framför den tecknandes kropp kan utnyttjas språkligt och du får också lära dig om hur man inleder ett teckenspråkigt samtal som är av visuell karaktär.
Samhällsordlista med översättningar till svenskt teckenspråk, till stöd för alla som vill använda svenskt teckenspråk i offentliga sammanhang.
In this experiment, we find that features which model interaction andconversational behaviour contribute well to identifying sexual grooming behaviourin chat and forum text. Together with the obviously useful lexical features —which we find are more valuable if separated by who generates them — weachieve very successful results in identifying behavioural patterns which maycharacterise sexual grooming. We conjecture that the general framework can beused for other purposes than this specific case if the lexical features are exchangedfor other topical models, the conversational features characterise interaction andbehaviour rather than topical choice.
Artikeln presenterar en studie om ord och fraser kopplade till ekologisk hållbarhet, som listats i nyordslistor publicerade av Språkrådet och dess föregångare åren 1986–2021. Resultaten visar att 132 av de 1 533 nyord som hittills publicerats i listorna går att koppla till området. Dessa ord analyseras vidare med hänsyn till hur uppkomsten av hållbarhetsnyord i listorna relaterar till samhällsdebattens idékonjunkturer, vad hållbarhetsnyorden typiskt betecknar, samt vilka hållbarhetsnyord som får störst spridning. Syftet med studien är ytterst att bidra till en diskussion om språkets roll i hållbar utveckling.
Blogginlägget skildrar terminologiskt arbete som ett område där humanister bidrar till en hållbar samhällsutveckling. Det betonar vikten av texter och samtal om hållbarhetsfrågor, och lyfter särskilt ordens roll i omställningen – hållbarhet i termer av termer. Därmed exemplifierar inlägget också ett praktiskt arbete som sker utanför universiteten, men som grundar sig i en typ av humanistisk kunskap som samhället behöver mer av.
Romska språket är ett språk med lång muntlig tradition. Språket har ofta saknat möjlighet att utveckla och sprida den terminologi som statsbärande språk har. I socialordlistorna på dialekterna arli, lovari och kelderasch har en rad facktermer inom socialförsäkringsområdet samlats. De innehåller också juridiska termer och arbetsmarknadstermer. Arbetet har utförts av ett arbetsteam med översättare med olika bakgrund, i samarbete med språkgranskare och juridiska experter.
Språkrådets svensk-romska omsorgsordlista innehåller uppslagsord och fraser på svenska och deras motsvarigheter på romska. Målgruppen för ordlistan är vårdanställda som inte alls kan romska eller som kan relativt lite, men som ändå ibland behöver använda romska i sitt arbete. En annan målgrupp är tolkar och översättare.