Tilgængelig PDF via automatiserede processer

Her beskrives de tre scenarier for tilgængelige PDF via automatiserede processer

Ser man bort fra PDF-dokumenter, som skabes manuelt i almindelige kontorpakker, er der tre forskellige scenarier for automatiseret produktion af PDF-dokumenter:

  1. Ældre (især mainframe-baserede) systemer. Her skabes kildedokumenterne ofte som printfiler i et proprietært format (fx AFP, PostScript, PCL). Information om dokumenternes semantiske struktur, den logiske rækkefølge, billedbeskrivelser mv. findes ikke længere i printfilerne, og skal i givet fald genskabes.
  2. Moderne databasebaserede systemer. Her skabes dokumenterne dynamisk på grundlag af udtræk og transformation (XML, XSLT) fra databasesystemet. Information om dokumenternes semantiske struktur kan i princippet afgøres på basis af databasestrukturen, ligesom læserækkefølgen mv. kan skabes i forbindelse med transformationen.
  3. Dokumentcentriske ESDH- og fagsystemer. Her skabes dokumenter enkeltvis i systemerne ved at flette skabeloner med systemdata og brugerskabt information i løsninger, som ofte anvender almindelig kontorautomatisering (fx Microsoft Office, Open Office). Information om dokumenternes semantiske struktur, læserækkefølgen mv. afhænger af skabelonerne, og hvordan skabelonerne anvendes af brugerne.

For hvert af de tre scenarier findes metoder og teknologier, som kan anvendes til at sikre, at den automatiserede produktion resulterer i tilgængelige PDF-dokumenter. Disse metoder og teknologier er beskrevet i det følgende.

Tilgængelig PDF fra ældre mainframesystemer mv.

Det er muligt med teknologi at skabe tilgængelige dokumenter på grundlag af printfiler.

Det drejer sig fx om systemer, der producerer masseudsendelser som kontoudtog, opkrævninger, lønsedler og skattebilletter, hvor printfilen er den eneste praktiske mulighed. Sådanne løsninger kan ligeledes anvendes i situationer, hvor man ikke har adgang til de bagvedliggende systemer, der producerer printfilerne, men er nødt til at anvende printfilerne som kildedokumenter. Arbejdsgangen, som genkender data og strukturer i printfiler, er skitseret i Figur 4:

Proces fra genkendelse over indsætning i skabelon til tilgængelig PDF

Figur 4. Proces for tilgængelige PDF-dokumenter fra mainframe/legacy systemer

En række leverandører har udviklet løsninger, som kan genkende indholdselementer i printfilerne, indsætte disse i foruddefinerede skabeloner og på det grundlag skabe tilgængelige PDF-dokumenter. Indholdselementerne genkendes på basis af en kombination af zoner, regioner, regler og automatiseret opmærkning i løsningerne, som også kendes fra scanning og genkendelse af blanketter.

Tilgængelig PDF fra databasebaserede systemer

Når man har adgang til det bagvedliggende databasesystem og har mulighed for at lave udtræk og/eller eksportere til et opmærket, kendt format i eksempelvis XML, har man behov for løsninger, som kan samle indholdet i dokumenterne, transformere dem til et passende visuelt og digitalt format i en skabelon og udgive dem som tilgængelig PDF. Her er ligeledes tale om systemer, som især anvendes til at producere masseudsendelser fra eksempelvis offentlige myndigheder og finansielle institutioner, idet løsningerne ofte er af nyere dato.

Arbejdsgangen til at skabe og udgive tilgængelige PDF-dokumenter på basis af udtræk fra databasesystemer er skitseret i Figur 5:

Konvertering fra database via xml, xslt og lignende

Figur 5: Tilgængelige PDF-dokumenter fra strukturerede data

Det er muligt at tilpasse processen selv, så slutresultatet bliver tilgængelige PDF-dokumenter.

Derudover har en række leverandører udviklet løsninger til at understøtte produktion af tilgængelige PDF-dokumenter på basis af udtræk fra forskellige databasesystemer, fordi det er nødvendigt at tilpasse transformationer og skabeloner i forhold til de konkrete udtræks- og dokumenttyper.

Tilgængelig PDF fra dokumentcentriske ESDH- og fagsystemer

Når dokumenter skabes i ESDH- eller fagspecifikke systemer, sker dette oftest som enkeltdokumenter ved at flette data fra systemet med valgte dokumentskabeloner, eventuelt suppleret med brugerindtastet information. I mange tilfælde er systemernes dokumentproduktion baseret på almindelig kontorautomatisering (fx Microsoft Office, Open Office). Det drejer sig eksempelvis om systemer, som anvendes til sagsbehandling i alle dele af den offentlige sektor (fx afgørelser, patientvejledning, udbudsmaterialer, domstolsafgørelser).

Arbejdsgangen, som kan anvendes til at skabe og udgive tilgængelige PDF-dokumenter på basis af kildedokumenter fra ESDH- og fagspecifikke systemer, er skitseret nedenfor i Figur 6:

Konvertering fra fag-og sagssystemer via skabeloner

Figur 6: Tilgængelige PDF-filer fra dokumentcentriske systemer

For dokumenter, som skabes i ESDH- og fagspecifikke systemer, afhænger tilgængeligheden til de endelige PDF-dokumenter i stor udstrækning af

  • tilgængeligheden til de anvendte dokumentskabeloner,
  • af brugernes anvendelse af skabelonerne samt af,
  • hvorledes kildedokumenterne konverteres til PDF.

Hvis skabelonerne overholder kravene til tilgængelighed, dvs. semantisk opmærkning, metadata, læserækkefølge og sprog, og hvis brugerne udfylder skabelonerne korrekt, udestår kun selve konverteringen til PDF. I den forbindelse er det vigtigt at notere sig, at skabelonerne skal indeholde muligheder for at beskrive overskrifter, tabeller, tabeloverskrifter og lignende.

Derudover er det også vigtigt, at væsentlige informationer (fx kontaktinformation til sagsbehandlere, sagsnumre og lignende) ikke placeres i sidehoved eller sidefod, da hverken sidehoved eller sidefod er egentlige indholdselementer og derfor ikke indgår i den naturlige læserækkefølge.