Informationen zum ISO Format PDF/A
PDF/A: Die ISO-Norm
ISO 19005-1 ist eine Norm der International Organisation for Standardization (ISO) und wurde am 1.10.2005 veröffentlicht als:
ISO 19005-1: Document Management - Electronic document file format for long term preservation - Part 1: Use of PDF 1.4 (PDF/A-1)
Diese ISO-Norm definiert ein Standardformat (PDF/A-1) für die Langzeitarchivierung von elektronischen Dokumenten. Sie setzt auf das PDF-Format von Adobe in der Version 1.4 auf (PDF 1.4 entspricht weitgehend dem in Adobe Acrobat 5 implementierten Funktionsumfang).
PDF/A: Die Vorteile
Elektronische Dokumente haben unzählbare Vorteile gegenüber traditionellen Archivierungsformaten (z.B. Papier, Mikrofilm). Allein die verbesserte Verfügbarkeit kann die Einführung eines elektronischen Archivs begründen. Einige Vorteile eines PDF/A-Archivs gegenüber einem TIFF- oder einem Papierarchiv sind:
Volltext-Suche
PDF/A speichert Objekte wie Textzeichen und Graphiken. Damit kann der volle Text im ganzen Archiv effizient durchsucht werden. Ein TIFF-Dokument ist ein Rasterbild und muss daher zuerst mittels OCR (Optical Character Recognition) gescannt werden.
Dateigrösse
PDF/A-Dateien benötigen nur einen Bruchteil des Speicherplatzes der Originaldatei- oder einer vergleichbaren TIFF-Datei, ohne an Qualität zu verlieren. Der geringere Speicherplatzbedarf wirkt sich vor allem auch bei der elektronischen Übermittlung (FTP, Anlage zum E-Mail usw.) der Dokumente aus.
Optimierung
PDF/A-Format ist optimierbar. Je nach Verwendungszweck kann die Priorität auf Bildqualität (z.B. Schecks) oder Extraktion von strukturierten Daten (z.B. Buchungsbelege) liegen. TIFF macht hier keine Unterschiede.
Metadaten
Metadaten wie Titel, Autor, Erstellungsdatum, Änderungsdatum, Thema, Schlüsselwörter usw. können als Bestandteil einer PDF/A-Datei gespeichert werden. Anhand der XMP Metadaten können PDF-Dateien automatisch ohne manuelle Intervention klassifiziert werden.
Quelle: PDF/A Competence Center