Generativ kunstig intelligens analyserer store mængder data fra virksomheders årsrapporter

Brug af generativ kunstig intelligens gør det muligt at analysere større datamængder

Vigtig vejledningsopgave om dataetik

Siden 2021 har store danske virksomheder været forpligtet til at skulle forholde sig til dataetik i deres årsrapporter.

Virksomhedernes årsrapporter er dermed en vigtig kilde til viden, som kan bruges til at videreudvikle og styrke Digitaliseringsstyrelsens vejledning om dataetik.

Mængden af tekstmateriale er imidlertid så omfattende, at medarbejderne tidligere har nøjedes med at analysere et udpluk af årsrapporterne og ikke dem alle sammen. Fra 2022 og 2023 er der i alt 3.673 årsrapporter, som fylder samlet set cirka 88.000 sider.

Et prompt klassificerer indholdet

Siden efteråret 2023 har Digitaliseringsstyrelsen arbejdet med at bruge generativ AI. Opgaven med at analysere afsnit om dataetik i store virksomheders årsrapporter blev udvalgt som en case, da generativ AI har muliggjort at analysere samtlige årsrapporter. 

Konkret er der udarbejdet et prompt med 30 kategorier, som det generative AI-værktøj systematisk klassificerer indhold ud fra. Det drejer sig fx om, hvilken type dataetisk politik virksomheden har, hvordan de anskuer dataetik, eller hvorfor de ikke har en dataetisk politik.

Udvikling af promptet har krævet adskillige iterationer og validering ved manuelt at faktatjekke i udvalgte årsrapporter.

""

Det har været en lærerig proces. Nøglen har været at prøve os frem for at finde ud af, hvad der virker, og i sidste ende validere det på systematisk vis. Erfaringerne kan genbruges i mange andre sammenhænge og gør, at vi i fremtiden vil kunne analysere mere data på kortere tid.

Rasmus Dam Poulsen, Digitaliseringsstyrelsen

Analyse af populationer og ikke kun stikprøver

Fordelen ved at bruge generativ AI til at analysere store tekstmængder er, at man har mulighed for at få analyseret alt relevant tekstmateriale, hvilket ofte ikke er muligt at gøre manuelt af ressourcemæssige årssager. Medarbejdere kan lettere og på kortere tid få indsigt i data og gå mere i dybden med analysemateriale. På den måde kan de lave bedre analyser, end analyser der kun baserer sig på stikprøver.

Resultaterne fra analysen med brug af generativ AI blev offentliggjort i en rapport i juni 2024. Analysemetoden forventes at blive brugt til lignende analyser fremover.

Organisatorisk:

Digitaliseringsstyrelsen gav hurtigt medarbejderne lov til at teste sig frem ved at bruge de tilgængelige teknologier. Yderligere er der oprettet et medarbejdernetværk, der skal sikre opkvalificering af medarbejderne.

Kompetencer:

Digitaliseringsstyrelsen har givet medarbejderne mulighed for at opbygge kompetencer inden for området. Dette gøre fx ved at sende medarbejdere på kurser og ved at invitere oplægsholdere til at fortælle om udviklingen og brugen af generativ kunstig intelligens.

Jura og retningslinjer:

Brugen af generativ kunstig intelligens til at analysere årsrapporter, tager udgangspunkt i Digitaliseringsstyrelsens interne retningslinjer. Det har bl.a. været afgørende, at ChatGPT kun fik adgang til offentligt tilgængelig data, og at svarene efterfølgende er valideret.

Data og vedligehold:

Løsningen bruger ChatGPT som API. Ved at justere i de prompts og det indhold, som man deler med ChatGPT, kan løsningen anvendes til forskellige analyseopgaver. Det gør løsningen fleksibelog kræver blot, at man løbende er opmærksom på de prompts og den datakvalitet, som man deler med ChatGPT i forskellige analyseopgaver.