Dansk sprogteknologi

Udviklingen af de forskellige former for kunstig intelligens, vi mennesker kommunikerer med og gør brug af i hverdagen, hænger uløseligt sammen med sproget. Udviklingen af dansk sprogteknologi er en forudsætning for, at man kan interagere med nye teknologier på dansk og at teknologien understøtter dansk kultur.

For at understøtte udviklingen af sprogteknologiske løsninger på dansk og for at sikre, at det digitale sprog i Danmark er dansk, har staten, KL - tidligere Kommunernes Landsforening og Danske Regioner i fællesskab udviklet den digitale platform sprogteknologi.dk.

Den digitale platform sprogteknologi.dk skal give let adgang til danske sprogressourcer, så udviklere og leverandører har mulighed for at bygge ovenpå eksisterende viden for at skabe nye løsninger inden for fx talegenkendelse, tekstanalyse og sprogforståelse. Disse er i mange sammenhænge helt centrale teknologier for udviklingen af kunstig intelligens.

Stort potentiale i den offentlige sektor

Der er et stort potentiale i den offentlige sektor for, at kunstig intelligens kan effektivisere eksempelvis sagsbehandlingen og give bedre service til borgere og virksomheder. Derfor er det helt centralt for anvendelsen af dansksproget kunstig intelligens i det offentlige, at udviklerne har adgang til sprogressourcer af rette kvalitet, kvantitet og målrettet sektorens særlige behov.

I Danmark har vi behov for, at forskellige former for kunstig intelligens bliver understøttet af dansk sprogteknologi på et højt niveau. Det drejer sig fx om, at store sprogmodeller er bygget, så de kender til danske forhold og danske værdier, så den digitale assistent forstår, når lægen dikterer patientjournaler på dansk, eller myndighedernes chatbots forstår borgernes spørgsmål og samtidig giver intelligente svar, der afspejler danske samfundsforhold.

Den digitale platform sprogteknologi.dk

Danmark er et lille sprogområde med et komplekst sprog. Derfor er det dyrt at udvikle sprogteknologiske løsninger i forhold til, hvor stort markedspotentialet er for den enkelte virksomhed. Derfor stiller myndighederne nu sprogteknologi.dk til rådighed for alle til sprogteknologiske formål.

Den digitale platform skal give let adgang til danske sprogressourcer ved at samle metadata – dvs. data eller information om data – om danske sprogressourcer ét sted samt på sigt udvikle nye sprogressourcer, som kan styrke udviklingen af sprogteknologiske løsninger på dansk.

Målgruppen er virksomheder, der arbejder med sprogteknologi, offentlige myndigheder og private virksomheder, der selv udvikler sprogteknologi, samt forskere. Den digitale platform indeholder metadata om blandt andet sprogdata som tale- og tekstsamlinger, ordbøger, termbaser, sprogteknologiske supportværktøjer og infrastrukturkomponenter. Platformen vil løbende blive udbygget, og på sigt vil der desuden blive udviklet nye sprogressourcer.

Besøg platformen sprogteknologi.dk

Det politiske afsæt

Med baggrund i "National strategi for kunstig intelligens" blev det i regi af Digitaliseringspagten aftalt at igangsætte et fællesoffentligt samarbejde om udviklingen af en fælles dansk sprogressource, som i dag har taget form gennem initiativet sprogteknologi.dk. Initiativet blev efterfølgende forankret i Økonomiaftalen 2020 mellem regeringen, KL og Danske Regioner og løber i perioden 2019-2026. Arbejdet tager blandt andet udgangspunkt i nogle af de anbefalinger, som Sprogteknologiudvalget, nedsat af Dansk Sprognævn under Kulturministeriet, kom med i rapporten "Dansk sprogteknologi i Verdensklasse" i april 2019. Initiativet er blevet genforankret i Den Fællesoffentlige Digitaliseringsstrategi 2022-2025 og Danmarks Digitaliseringsstrategi 2022-2026.

Find Den Fællesoffentlige Digitaliseringsstrategi 2022-2025

Find Danmarks Digitaliseringsstrategi 2022-2026 her

Governance

Arbejdet med sprogteknologi.dk er politisk forankret i Styregruppen for Digital Innovation og Grøn Omstilling, der består af en række statslige myndigheder, KL og Danske Regioner. Digitaliseringsstyrelsen varetager formandskabet for styregruppen, ligesom Digitaliseringsstyrelsen er sekretariat for sprogteknologi.dk.

Andre projekter

Udover sitet sprogteknologi.dk, arbejdes der i regi af initiativet også på en række indsatser for at tilvejebringe højkvalitetsdata til udvikling af dansk sprogteknologi. Fx Det Centrale Ordregister (COR), et høj kvalitets talekorpus (CoRaL). Initiativet arbejder ud fra en udbredelsesstrategi, som går ud på at samle det danske sprogteknologiske miljø og sprede viden og information om dansk sprogteknologi. Dette er både i form af workshops, gå-hjem-møder og en årlig konference i samarbejde med Center for Sprogteknologi ved Københavns Universitet.

Desuden følger Digitaliseringsstyrelsen en række europæiske sprogteknologiske initiativer, herunder det fælleseuropæiske Language Data Space og det europæiske digitale infrastrukturkonsortium Alliancen for sprogteknologi. Her gør styrelsen en indsats for at præge, at initiativerne også vil komme dansk sprogteknologi til gode.

Du kan følge med i udviklingen af initiativet på sprogteknologi.dk eller ved at følge sprogteknologi.dk på LinkedIn.

Find sprogteknologi.dk på LinkedIn

Find et eksempel på en workshop