Extra #026 Langzeitarchivierung
Archivierung – ein Begriff, der Assoziationen an mit Schriftstücken bepackten endlosen und staubigen Regalreihen in einem Kellerraum weckt. Doch trotz der Digitalisierung kann sogar diese Form der Aufbewahrung von Dokumenten auch in der technischen Dokumentation von Nutzen sein.
Wie überall dort, wo es um die sichere Aufbewahrung von Dokumenten geht, kommt das Thema Archivierung ins Spiel. Der Begriff Archivierung hat seinen Ursprung vermutlich im antiken Griechenland. Dort wurden nämlich wichtige Dokumente in einem sogenannten Archeion eingelagert. Hierbei handelte es sich meist um bestimmte staatliche Gebäude der Verwaltung oder Regierung. Für uns phonetisch greifbarer ist der später entwickelte lateinische Begriff archivum, der einen Aktenschrank bezeichnet.
Das Archivieren ist gemeinhin als eine zeitlich begrenzte Aufbewahrung von Informationen definiert. Das, was sich dann in einem Archiv befindet, ist das sogenannte Archivgut. Im Prinzip archviert jeder von uns etwas. Meist sind dies Fotos oder Schriftstücke, die wir aus irgendeinem Grund für eine lange Zeit aufbewahren möchten. Jedes Fotoalbum ist gewissermaßen bereits ein Archiv.
Aber nicht nur im privaten Leben, sondern besonders im geschäftlichen, im beruflichen Bereich wird archiviert. Und dies längst nicht immer auf freiwilliger Basis wie bei meinem Beispiel mit dem Fotoalbum. Eine Vielzahl von Gesetzen und Verordnungen legt uns die Pflicht auf, bestimmte Dokumente für eine gewisse Zeit nach bestimmten Kriterien aufzubewahren. So auch in der technischen Dokumentation, und das ist auch gut so. Warum, werden wir später noch sehen.
Eine Form der Archivierung nehmen wir (hoffentlich) regelmäßig jeden Tag vor: die, der in unserer EDV gespeicherten Daten im Rahmen eines Backups, einer Datensicherung. Ich durfte einmal selbst quasi hautnah miterleben, welche Konsequenzen eine fehlende Datensicherung haben kann: Der IT-Beauftragte eines Herstellers bemerkte über mehrere Wochen nicht, dass die eingerichtete Datensicherung nicht mehr lief. Eines Tages kam nach Murphys Law, was kommen musste, und gleich zwei Festplatten des Servers verabschiedeten sich sang- und klanglos aus ihrem Dienst. Die Folge: Nicht nur sämtliche Buchhaltungsdaten, sondern auch alle Daten der Konstruktionsabteilung inklusive der für die Steuerung der CNC-Maschinen der letzten vier Wochen waren für immer verloren, denn auch ein eilig herbeizitierter sehr teuerer Datenrettungsdienst konnte hier nicht mehr viel ausrichten. Die abschließende Bewertung ergab einen finanziellen Schaden in Höhe von mehreren hunderttausend Euro. Keine Frage, hier waren bereits im Vorfeld gravierende Fehler gemacht worden, denn der IT-Beauftragte hatte vom Begriff RAID offensichtlich noch nie etwas gehört. Wie auch immer, eine funktionierende Datensicherung hätte das schlimmste in jedem Fall verhindert.
Die revisionssichere elektronische Archivierung
Aber auch wenn diese Form der Archivierung von essentieller Bedeutung ist, um sie soll es in diesem Podcast nicht gehen. Hier dreht sich vielmehr alles um das Thema revisionssichere elektronische Archivierung. Um eine Abgrenzung zur kurzzeitigen Archivierung – den eben erwähnten Backups der auf einem Server gespeicherten Daten – deutlich zu machen spricht man oftmals auch von der revisionssicheren elektronischen Langzeitarchivierung. Denn im Gegensatz zu den erwähnten Backups, bei der ein Sicherungssatz in der Regel maximal einen Monat umfasst und der dann wieder mit neuen Sicherungssätzen überschrieben wird, geht es bei der Langzeitarchivierung um eine Mindestdauer von 10 Jahren.
Was hat es mit der Revisionssicherheit auf sich?
Verschiedene Gesetze aus allen Bereichen des Geschäftslebens machen hierzu Vorgaben. Revisionssicher bedeutet u. a., dass die einmal archivierten Daten nachträglich nicht mehr veränderbar sein dürfen. Ein so gespeicherter Datensatz stellt somit immer den Urzustand des gespeicherten Dokumentes dar, nachträgliche Einfügungen oder Löschungen von Inhalten sind nicht möglich.
Entsprechende Vorgaben kommen beispielsweise aus den §§ 239 und 257 des HGB, der Abgabenordnung (AO), dem Vertragsrecht (BGB) oder den Grundsätzen ordnungsmäßiger DVgestützter Buchführungssysteme (GoBS) an die sichere, ordnungsgemäße Aufbewahrung von kaufmännischen Dokumenten.
Aber damit nicht genug: Auch die für den Hersteller und uns als technische Redakteure wichtigen EU-Richtlinien fordern dies.
So fordert die Maschinenrichtlinie 2006/42/EG sowohl für die Konformitätserklärung als auch die Einbauerklärung eine Aufbewahrungsfrist von mindestens 10 Jahren. Genauer ist die Aufbewahrungspflicht in Anhang VII, Abschnitt A, Absatz 2 ausgeführt. Hiernach sind die in Absatz 1, des gleichen Abschnittes, genannten technischen Unterlagen mindestens 10 Jahre bereitzuhalten. Wichtig dabei: Diese Frist beginnt z. B. bei einer Sondermaschine am Tag nach der Bereitstellung auf dem Markt, bei Maschinen aus der Serienfertigung hingegen erst nach dem Tag an dem das letzte Modell der Serie fertiggestellt wurde. Wenn Sie also eine Maschine herstellen, die bereits seit 15 Jahren unverändert in einer Serie produziert wird, müssen Sie ihre technischen Unterlagen somit mindestens für 25 Jahre bereithalten.
Diese Forderung ist durchaus berechtigt, und kann beispielsweise in einem Schadenersatzprozess von großer Bedeutung sein. Stellen Sie sich einmal vor, Sie haben für einen Kunden eine Sondermaschine produziert. Dieser Kunde erhebt nun Klage, weil durch Ihre Maschine ein Schaden eingetreten sein soll, der auf einem Fehler in der Bedienungsanleitung beruht. Nun könnten Sie ja das entsprechende Dokument aus Ihrer EDV ziehen und bei Gericht mit dem Hinweis vorlegen, dass dieses Dokument diesen Fehler gar nicht enthält. Böse Zungen könnten allerdings behaupten, dass Sie das Dokument nachträglich zu Ihren Gunsten abgeändert haben. Was theoretisch der Kläger übrigens auch tun könnte, denn ein PDF lässt sich prinzipiell in der Tat problemlos nachträglich bearbeiten.
Anhand dieses Beispiels werden dann die Vorteile der rechtssicheren Langzeitarchivierung deutlich. Doch wie sollen die Daten gesichert werden, und auf welchem Medium?
Schaut man in die Regale von Museen, antiquarischen Buchhandlungen oder spezialisierten Bibliotheken wird man feststellen, dass ein gedrucktes Dokument durchaus Jahrhunderte ohne nennenswerte Probleme überdauern kann (eine entsprechende Lagerung und säurefreies Papier vorausgesetzt). Und auch heute noch setzt man in der Tat auf dieses Trägermedium – vorausgesetzt es ist nach DIN EN ISO 9706 zertifiziert. Ein solches Papier garantiert eine Haltbarkeit von mindestens 200 Jahren, wenn es korrekt gelagert wurde. Nun, dieser Zeitraum ist für unser Tätigkeitsgebiet nicht von Bedeutung, dennoch wollte ich diese Möglichkeit erwähnt haben, denn ein auf Papier ausgedrucktes Dokument gilt als generell sehr fälschungssicher. Ob der Ausdruck dann aber aus einem nachträglich manipulierten Wordfile stammt, lässt sich vermutlich – wenn überhaupt – nur im forensischen Bereich ermitteln.
Muster-Betriebsanleitungen, Vorlagen für Warnhinweise, sowie Checklisten, E-Books und vieles mehr. Besuchen Sie jetzt unseren Online-Shop für die Technische Dokumentation!
Die Datenformate
Aus praktischer Sicht scheint es heute geraten, eine Archivierung elektronisch durchzuführen. Ein wesentlicher Vorteil dieser Methode aus meiner Sicht ist die recht einfache Sicherung der Daten gegen Verlust durch Diebstahl, Wasserschaden oder Feuer. Ein reines Papierarchiv wirft in dieser Hinsicht erhebliche Probleme auf.
Gemäß dem aktuellen Stand der Technik eignen sich für die elektronische Langzeitarchivierung die Datenformate ASCII (American Standard Code for Information Interchange) nach ISO 8859 oder Dateien im JPEG oder TIFF G4-Format. Allerdings habe diese Formate einige kleine Schwächen: So können im ASCII-Format keine Grafiken gespeichert werden und auch die Auszeichnung des Textes wie Fettschrift ist damit nicht möglich. Im Grafikformat JPEG lassen sich zwar grundsätzlich sowohl Bild als auch Textinformationen speichern, der hier wohl wesentlichste Nachteil liegt jedoch darin, dass der Text nicht durchsuchbar ist. Für bestimmte Daten wie einfarbige Schaltpläne oder Konstruktionszeichnungen, bei denen also keine farblichen Hervorhebungen erforderlich sind, kann das TIFF G4-Format verwendet werden.
Aus praktischen Gründen wird man jedoch heute das PDF/A-Format zur Langzeitarchivierung von Daten verwenden. Zu beachten in diesem Zusammenhang ist auch, dass es sich bei PDF/A mit ISO 19005 mittlerweile um einen internationalen Standard handelt, eine Einstufung, die dem TIFF-Format bislang fehlt.
Was ist das PDF/A-Format?
Wohl jedem von uns ist das PDF-Format bekannt. Kaum noch ein Unternehmen oder eine Behörde wird bei der Publikation von Dokumenten nicht darauf zurückgreifen. Ein wesentlicher Vorteil des PDF-Formates liegt darin, dass es vollkommen plattformunabhängig ist. Ob unter Windows, macOS oder Linux, ob auf einem Smartphone oder Tablet – ein im PDF-Format publiziertes Dokument lässt sich auf jedem Endgerät öffnen. Einzige Voraussetzung: Eine geeignete Software – auch PDF-Reader genannt – wie beispielsweise der bekannte Acrobatreader den es für jedes Betriebssystem kostenlos gibt.
Ein weiterer Vorteil dieses von Adobe Systems im Jahre 1993 veröffentlichten Dateiformates ist, dass ein Dokument im PDF-Format auf jeder Plattform exakt so wiedergegeben wird, wie es die Formatierung des Originaldokumentes vorgibt.
Neben der Möglichkeit, den Text eines Dokumentes elektronisch durchsuchen zu können, bietet das PDF-Format heute eine Vielzahl weiterer Leistungsmerkmale wobei die Multimediafähigkeit wohl zu den spektakulärsten gehört.
Im Laufe der Zeit wurde das PDF-Format in weitere Formate unterteilt, die jeweils einem spezifizierten Anwendungszweck dienen. So verwendet man beispielsweise das Format PDF/UA wenn es um barrierefreie Dokumente geht. Das Kürzel UA steht hier für Universal Accessibility. Das Format PDF/X (X steht für Exchange) ist für den standardisierten Dokumentenaustausch in der Druckvorstufe konzipiert.
Soll ein Dokument interaktive 3D-Darstellungen ermöglichen, verwendet man das Format PDF/E – das E steht für Engineering.
Und auch für die Langzeitarchivierung hat man bei Adobe Systems eine Lösung konzipiert – eben das Format PDF/A. Die Bedeutung des Buchstabens A ist in diesem Zusammenhang unschwer zu erraten – er steht für Archive.
Um ein Dokument im PDF/A-Format speichern zu können, gilt es verschiedenes zu beachten. Hierzu unterscheidet man in Elemente, die das Dokument zwingend enthalten muss, in die die enthalten sein können, und in die die keinesfalls enthalten sein dürfen. Diese Aufstellung erinnert mich immer ein wenig an das Rezept für einen guten Grog: Rum muss, Zucker sollte, Wasser braucht nicht unbedingt.
So darf eine Quelldatei für ein PDF/A-Dokument beispielsweise digitale Signaturen (die hinsichtlich der Rechtssicherheit des Dokumentes unerlässlich sind) oder Metadaten im XMP-Format (z. B. Angaben zum Autor, zu Quellen oder zum Inhalt) und Links enthalten.
Nicht enthalten sein dürfen hingegen eingebettete multimediale Inhalte wie Video- oder Audiodateien, Verschlüsselungen, Javascript oder die Sperrung von Funktionen zum Drucken oder kopieren, etc.
Hinsichtlich des Inhaltes multimedialer Elemente bedauere ich dies, da ich ein großer Freund ihres Einsatzes bin, solange dies dem besseren Verständnis der zu vermittelnden Informationen dient.
Die Versionen und Konformitätsstufen
Nun gibt es nicht DAS PDF/A-Format – das wäre ja auch zu einfach – sondern man hat bis heute vier Standards definiert wobei der derzeit aktuellste PDF/A-4 ist. Jeder dieser Standards ist in Konformitätsstufen unterteilt. Je nach Zweck würde die Auswahl zur Speicherung des Dokumentes in der gewünschten Version beispielsweise PDF/A-2a lauten. Hiermit könnten wir nun ein PDF/A-Dokument erzeugen, das dem Standard A-2 entspricht, wodurch es möglich ist, Open-Type-Fonts einzubetten, Grafiken mit JPEG2000 zu komprimieren und transparente Elemente und PDF-Ebenen zu unterstützen. Außerdem unterstützt werden digitale Signaturen nach PAdES (PDF Advanced Electronic Signatures). Durch die Auswahl der Konformitätsstufe a (für accessible – zugänglich) wird darüber hinaus die barrierefreie Anwendung ermöglicht. Die Konformitätsstufe b würde die eindeutige visuelle Reproduzierbarkeit ermöglichen und die Stufe u – welche erst ab PDF/A-2 eingeführt wurde – den gesamten Text im Schriftzeichenstandard Unicode abbilden.
Ist PDF/A revisionssicher?
Jein oder eher sogar nein.
Revisionssicherheit bedeutet allgemein, dass digitale Daten so aufzubewahren sind, dass sie vor nachträglicher Änderung oder Fälschung geschützt sind.
Zwar ist ein Dokument im PDF/A-Format grundsätzlich erst einmal vor der Bearbeitung geschützt – ein entsprechender Hinweis beim Öffnen der Datei informiert uns darüber. Allerdings: Durch einen Klick auf die Schaltfläche „Bearbeitung aktivieren“ sind wir wieder in der Lage, das Dokument zu bearbeiten und damit zu verändern. Auch ein Schreibschutz durch setzen des entsprechenden Flags in den Dateiattributen hilft hier nicht dauerhaft weiter.
Revisionssicherheit wird man nur erreichen können, wenn ein entsprechendes Dokumentenmanagementsystem zum Einsatz kommt. Erst dieses sorgt durch Berücksichtigung bzw. Umsetzung der Anforderungen für die Revisionssicherheit. So zum Beispiel (diese Liste ist nicht vollständig):
- Es ist wichtig jedes, Dokument so früh wie möglich zu archivieren und damit zu dokumentieren, was zu welchem Zeitpunkt verändert und archiviert wurde.
- Die archivierten Dokumente müssen mit dem Original übereinstimmen und dürfen nach der Archivierung nicht mehr verändert werden können (diese Forderung erfüllt der PDF/A -Standard alleine leider nicht).
- Jedes archivierte Dokument muss vor einer Löschung vor Ablauf der Aufbewahrungsfrist geschützt sein. Dies schließt auch die Notwendigkeit einer regelmäßigen Datensicherung des Dokumentenmanagementsystems ein, schließlich sind auch seine Datenträger nicht vor Zerstörung oder Defekt geschützt.
- Jedes Dokument muss zu jedem Zeitpunkt ohne Zeitverzug abrufbar sein.
- Und da der Wandel der Technik nicht stehen bleibt und heute verwendete Datenträger in 10 Jahren veraltet oder längst defekt sein können, muss dafür Sorge getragen werden, dass ein notwendiger Umzug auf ein anderes System vollständig und verlustlos erfolgt.
Sie wollen die Übersicht behalten? Dann nutzen Sie unsere kostenlosen Checklisten für die Technische Dokumentation und zur Überprüfung Ihrer Betriebsanleitungen!
Die Datenträger zur Archivierung
Wie eingangs bereits erwähnt, ist es grundsätzlich möglich, Dokumente auf entsprechendem Papier zu archivieren. Als Freund gedruckter Werke begrüße ich dieses sogar, da ich selbst sehr gerne gedruckte Werke in Händen halte und lese.
Aber es ist einzusehen, dass diese Lösung alleine nicht die richtige ist und auch Nachteile bietet. Die fehlende elektronische Unterstützung bei der Volltextsuche sei stellvertretend in diesem Zusammenhang erwähnt.
Aber egal ob CD, DVD, BlueRay, Festplatte, SSD oder Bandlaufwerk – sie alle haben zwar ihre Vorzüge, aber auch ihre Schwächen. So sind dies bei den CD/DVD/Blue Ray die Empfindlichkeit der Reflexschicht gegenüber mechanischer Beschädigungen wie Kratzer, bei Festplatten die begrenzte Lebensdauer der Mechanik und der mit zunehmender Laufzeit einhergehenden abnehmenden Zuverlässigkeit durch defekte Sektoren der Magnetscheiben oder die auch bei SSDs nicht unendlich vorhandene Fähigkeit, Daten speichern zu können, da die Speicherzellen über begrenzte Schreibzyklen verfügen. Und auch der Klassiker seit Anbeginn der IT in der Datenspeicherung – das Bandlaufwerk – hat eine begrenzte Lebenszeit. Dies nicht nur in Hinsicht auf das Trägermaterial, sondern auch auf die Umgebungsbedingungen bei der Lagerung. Ein absoluter Killer für Daten auf Bandlaufwerken (und auch den damals verwendeten Disketten) sind nämlich Magnetfelder von Lautsprecherboxen und anderen Geräten. Hinzu kommt, dass Bandlaufwerke nur einen sequentiellen Zugriff auf die Daten erlauben. Den Älteren unter uns ist die manchmal doch etwas aufwändige Suche nach einem bestimmten Song auf einer 120 min Musik-Cassette und das damit verbundene konsequente Vor- oder Zurückspulen des Bandes sicher noch in lebhafter Erinnerung.
Für welchen Datenträger man sich auch entscheidet: Man sollte stets im Kopf behalten, dass diese bzw. die erforderlichen Lesegeräte (DVD-Laufwerk, Bandlaufwerk) möglicherweise irgendwann nicht mehr zur Verfügung stehen. So gibt es heute praktisch keinen neuen PC mehr, der noch ein Diskettenlaufwerk besitzt und selbst DVD-Laufwerke finden sich mittlerweile nur noch selten in einem fabrikneuen Computer.
Fazit
- Die revisionssichere Langzeitarchivierung der Daten in Zusammenhang mit einem Produkt sind sowohl für den Hersteller als auch die technische Redaktion unverzichtbar
- Dateiformate wie jpg und TIFF G4 eignen sich grundsätzlich für die Langzeitarchivierung, den Vorzug sollte man jedoch dem Format PDF/A geben.
- Bei der Auswahl der Datenträger für die revisionssichere Langzeitarchivierung sollte man auf die Lebensdauer achten und die Daten regelmäßig auf neue Datenträger migrieren, um Datenverlust durch Defekte vorzubeugen.
- Eine revisionssichere Langzeitarchivierung ist auch mit dem Einsatz von PDF/A nicht zu erreichen. Hierzu bedarf es eines entsprechenden Dokumentenmanagementsystems.