Identyfikacja
Znalazłem to narzędzie, które wygląda na to, czego możesz użyć do identyfikacji plików PDF / A. Nazywa się DROID (Digital Record and Object Identification) . Jest oparty na Javie i może być uruchamiany z GUI lub wiersza poleceń.
fragment
DROID to narzędzie opracowane przez The National Archives do automatycznej identyfikacji partii formatów plików. Opracowany przez Departament Ochrony Cyfrowej w ramach szeroko zakrojonych działań związanych z ochroną cyfrową, DROID został zaprojektowany, aby spełnić podstawowe wymaganie każdego cyfrowego repozytorium, aby móc dokładnie określić format wszystkich przechowywanych obiektów cyfrowych i połączyć tę identyfikację z centralnym rejestrem informacji technicznych na temat tego formatu i jego zależności.
Biorąc pod uwagę, że jest sponsorowany przez Archiwa Narodowe, zakładam, że jest to właściwe narzędzie do tego celu, biorąc pod uwagę zamierzony cel formatu PDF / A. Również projekt jest open source, a kod jest dostępny na Github, a także spakowany w formie binarnej ze strony National Archives .
Walidacja i konwersja
Jeśli szukasz narzędzia do sprawdzania poprawności i konwersji, wierzę, że PDFBox może to zrobić. PDFBox zawiera listę walidacji PDF / A na pierwszej stronie swojej witryny. To kolejna aplikacja Java 8-).
fragment strony internetowej
Walidacja PDF / A Sprawdzaj poprawność
plików PDF w stosunku do standardu ISO PDF / A.
W sekcji narzędzi wiersza poleceń po lewej stronie ich strony głównej pokazano następujące użycie narzędzia:
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
veraPDF to kolejne narzędzie do sprawdzania poprawności plików PDF / A; jest częścią zestawu narzędzi referencyjnych Open Preservation Foundation. To także aplikacja Java.
Konwersja
Do samej konwersji znalazłem tę metodę z postu na blogu zatytułowanego: Darmowy sposób konwersji istniejącego pliku PDF na PDF / A , który wykorzystuje następujące narzędzia:
- Tylko Ghostscript 8.64.
- PDFBox 0.7.3
- znaczniki pdf (plik do dostarczenia dodatkowych metadanych)
- PDFA_def.ps
- USWebCoatedSWOP.icc
Po zastosowaniu powyższego polecenia użyj następującego polecenia:
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
Nie jest bez brodawek. W artykule omówiono jeden z nich, naprawiając flagi drukowania na hiperłączach jako jednym z nich. Artykuł zawiera aplikację Java, której można użyć do naprawy tych:
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
Nie jest ładny, ale wydaje się wykonalny. Zobacz artykuł, aby uzyskać więcej informacji.
Bibliografia