![]() ![]() |
ENGLISH |
Resurs- och kunskapscentra– Swedish in a Multilingual Setting, SMSK-centrumet Svenska i ett flerspråkigt sammanhang (CLARIN-SMS) inriktar sig på språkteknologi för svensk och flerspråkig text (såsom parallella korpusar). Dessutom erbjuder CLARIN-SMS expertis inom språkteknologi för svenskt teckenspråk (STS). CLARIN-SMS riktar sig främst till forskare inom humaniora och samhällsvetenskap med behov av analys, annotering eller utvinning av information när det gäller svensk eller flerspråkig text, och även mot forskare med behov av verktyg och korpusar för svenskt teckenspråk. CLARIN-SMS gör resurser i form av korpusar och verktyg för språklig bearbetning tillgängliga för forskning inom humaniora och samhällsvetenskap. Resurserna inkluderar enspråkiga (främst svenska) och flerspråkiga korpusar som spänner över flera domäner, samt verktyg för grundläggande bearbetning av text, inklusive tokenisering, morfologisk analys, ordklasstaggning, syntaktisk parsning och namnigenkänning. Huvudsakliga expertisområdenCLARIN-SMS erbjuder specialiserad expertis:
Även om varje nod inom CLARIN-SMS fungerar som en separat enhet och marknadsför sina tjänster och resurser på olika sätt – inklusive webbsidor som presenterar projekt och resurser och presentationer vid CLARIN-relaterade evenemang – utgör kunskapscentret en gemensam resurs. CLARIN-SMS är en dynamisk gemenskap och, i enlighet med CLARIN:s övergripande mål att skapa och främja språkliga resurser, har en mängd aktiviteter genomförts vid de olika noderna, inklusive utveckling av verktyg och resurser för språkanalys, både för flerspråkiga sammanhang och enbart för svenska. Ett aktivt forskningscenterEtt antal aktiviteter är särskilt inriktade på att främja användningen av språkteknologi inom humaniora och samhällsvetenskap. Ett exempel är ett projekt som analyserar utvecklingen av begreppet 'handikappad' ur ett svenskt parlamentariskt perspektiv. Inom detta projekt hjälper vi forskare att bearbeta och analysera den svenska regeringens offentliga utredningar från tidigt 1900-tal fram till idag, med hjälp av olika SweClarin-resurser och språkteknologiska verktyg, såsom SPARV-pipelinen. Ett annat exempel är analysen av protokoll från Sveriges Riksbank, där vi jämför protokoll från perioden då de var anonyma med protokoll från perioden då de inte längre var det. Ett av målen med studien är att undersöka om det är möjligt att identifiera enskilda talare i protokoll från den anonyma perioden. Ett annat mål är att ge Riksbanken information om potentiella skillnader och likheter i argumentation mellan de två typerna av protokoll. För detta ändamål använder vi olika SweClarin-resurser, såsom sentimentlexikonet sentaldo-v02 och SPARV-pipelinen för parsning, i kombination med analysmodeller för ämnesklassificering och sentimentanalys. Ytterligare ett exempel är ett projekt i samarbete med forskare inom förvaltning, där vi analyserar svenska företags efterlevnad och införande av informationssäkerhetsstandarden ISO 27001. Syftet med projektet är att undersöka den kommunikativa konstitutionen av förebyggande innovation inom organisationer. För detta projekt har vi hjälpt till att skapa en korpus och analysera den ur flera tvärvetenskapliga perspektiv, med hjälp av SweClarin-verktyg och resurser, såsom sentimentlexikonet sentaldo-v02 och SPARV-pipelinen för parsning, samt andra språkteknologiska verktyg, inklusive ordmoln. Verktyg och resurser
Medverkande Språkbanken-CLARIN-medlemmarCLARIN-SMS är ett så kallat distribuerat K-centrum med flera deltagare:
Kontakt (helpdesk)Arne Jönsson, arne.jonsson@liu.sePublikationer
|