Grundlagen der Digitalisierung und Archivierung, Teil 1 Digitale Archivierung: eine Notwendigkeit für alle Unternehmen

Von Michael Matzer 6 min Lesedauer

Im Zuge der Digitalisierung aller Geschäftsprozesse stellen Unternehmen auf rein digitale Datenerfassung und -speicherung um. Dazu gehört die Digitalisierung von Papierdokumenten, aber auch die Einführung digitaler Archivlösungen. Sie erhöhen damit ihre eigene Effizienz, erfüllen aber auch gesetzliche Vorgaben.

Beispiel für Tape-Kassetten des IBM-Modells Ultrium.(Bild:  IBM)
Beispiel für Tape-Kassetten des IBM-Modells Ultrium.
(Bild: IBM)

Für die elektronische Archivierung werden in der Regel spezielle Archivsysteme eingesetzt. Der Begriff „elektronische Archivierung“ fasst unterschiedliche Komponenten eines Enterprise-Content-Management-Systems (ECM) zusammen. Dazu gehören die Datenerfassung etwa durch optische Zeichenerkennung (OCR), die geschützte und rechtskonforme Ablage in Verzeichnissen sowie die Speicherung auf verschiedenen Medien (Bandlaufwerke, WORM-Medien, Cloud) für die spätere Abfrage. In manchen Fällen dienen die ECM-Systeme auch der regelmäßigen Veröffentlichung von Inhalten, so an Instituten und in Behörden.

Der wissenschaftliche Begriff eines Archivs im Sinne der Langzeitarchivierung ist inhaltlich nicht identisch mit dem Begriff, der von der Dokumentenmanagement-Branche verwendet wird. Während heute Unternehmen schon Aufbewahrungsfristen von zehn Jahren – etwa für Finanzbuchhaltung und Steuererklärung – für handelsrechtlich und steuerlich relevante Daten und Dokumente als nur sehr schwierig umsetzbar sehen, wird in historischen Archiven von einer sicheren, geordneten und jederzeit zugreifbaren Aufbewahrung von Informationen mit Speicherzeiträumen von mehreren Jahrhunderten gesprochen.

Angesichts der sich ständig verändernden Techniken, immer neuer Software, Formate und Standards ist dies eine große Herausforderung für die Informationsgesellschaft. Eben diese Gesellschaft ist jedoch auf solche Archive angewiesen, um beispielsweise Rechtsansprüche und Rechtskonformität nachzuweisen, häufig in regelmäßigen Abständen.

Immer mehr Information entsteht digital, und die Ausgabe als Papier ist nur noch eine mögliche Repräsentation des ursprünglichen elektronischen Dokuments. Durch den Einsatz elektronischer Signaturen erhalten elektronische Dokumente den gleichen Rechtscharakter wie ursprünglich manuell unterzeichnete Schriftstücke. Solche digitalen Dokumente existieren rechtskräftig nur noch in elektronischer Form.

Diese Entwicklungen zwingen inzwischen jedes Unternehmen, sich verstärkt mit dem Thema elektronische Archivierung auseinanderzusetzen. In Forschung und Entwicklung ist beispielsweise der Zugriff auf die Patentlage von großer Bedeutung, um nicht die Rechte anderer Firmen zu verletzen.

Technische Grundlagen

Die Datenerfassung erfolgt entweder durch Sammlung elektronischer Dateien oder durch Optical Character Recognition (OCR), bei der eine entsprechende Software eingesetzt wird. Diese wird häufig bereits in ECM-Systemen, Dokumentenmanagement-Systemen (DMS) oder Grafik-Software mitgeliefert. Wichtig ist der Aspekt der Ablage in entsprechenden Verzeichnissen, die gegen unbefugten Zugriff geschützt sind. Wie bei Backup & Disaster Recovery sollten entsprechend viele Kopien jeder Datei angelegt werden.

Bei den elektronischen Speichertechnologien ist eine Trennung zwischen der Verwaltungs- und Ansteuerungs-Software (ECM usw.) einerseits und den eigentlichen Speichermedien andererseits notwendig. Herkömmliche magnetische Speichermedien galten in der Vergangenheit als nicht geeignet für die revisionssichere elektronische Archivierung, da die gespeicherten Informationen jederzeit geändert und überschrieben werden können.

Dies betrifft in besonderem Maße Festplatten, die von Betriebssystemen dynamisch verwaltet werden. Magnetische Einflüsse, „Head-Crashs“ des Schreib-/Lesekopfes und andere Risiken wiesen den Festplatten die Rolle der reinen Online-Speicher zu. SSDs dienen aus den gleichen Gründen nicht als Speicher, zudem ist ihre Kapazität ebenfalls (noch) begrenzt. Bei Magnetbändern kam neben der Löschbarkeit hinzu, dass diese Medien hohen Belastungen und Abnutzungen sowie magnetischen Überlagerungen bei zu langer Aufbewahrung unterliegen.

Herkömmliche WORM-Medien

In den 1980er-Jahren wurden spezielle digital-optische Speichermedien entwickelt, die in ihrem Laufwerk mit einem Laser berührungsfrei nur einmal beschrieben werden können. Diese Speichertechnologie bezeichnet man als WORM: „Write Once, Read Multiple Times“. Die Speichermedien selbst sind durch ihre physikalischen Eigenschaften gegen Veränderungen geschützt und bieten eine wesentlich höhere Lebensdauer als die bis dahin bekannten magnetischen Medien.

In diese Kategorie von Speichermedien fallen folgende Typen:

CD-WORM

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Bei der nur einmal beschreibbaren Compact Disc mit etwa 650 Megabyte Speicherkapazität wird die Speicheroberfläche des Mediums beim Schreiben irreversibel verändert. CD-Medien sind durch ISO 9660 (ISO: International Standards Organization) standardisiert und kostengünstig. Die Qualität mancher billiger Medien ist aber für eine Langzeitarchivierung als nicht ausreichend zu erachten: Sie nutzen sich ab. Die Ansteuerung der Laufwerke wird von den Betriebssystemen direkt unterstützt. Größtes Manko heute: die sehr begrenzte Speicherkapazität. Die von DVDs ist höher.

DVD-WORM

Ähnlich wie die CD wird bei der DVD-ROM die Speicheroberfläche irreversibel im Medium verändert. DVDs bieten unterschiedliche Speicherkapazitäten zwischen 4 und 24 Gigabyte. Beim Einsatz für die Archivierung ist darauf zu achten, dass Laufwerk und Medien den Anforderungen der langzeitigen Verfügbarkeit gerecht werden. Es gibt auch hier zahlreiche Anbieter und die meisten Laufwerke werden direkt von den gängigen Betriebssystemen unterstützt. 24 GB reichen inzwischen für viele Zwecke nicht mehr aus, daher bieten sich vor allem Magnetbänder (siehe unten) mit Kapazitäten von mehreren Terabyte pro Kassette an.

Weitere Technologien

Neben den klassischen Archivspeichern, die auf rotierenden, digital-optischen Wechselmedien basieren, treten inzwischen zwei weitere Technologien auf:

Content Addressed Storage (CAS)

Hierbei handelt es sich um Festplattensysteme, die durch spezielle Software die gleichen Eigenschaften wie ein herkömmliches WORM-Medium erreichen. Ein Überschreiben oder Ändern der Information auf dem Speichersystem wird durch die Kodierung bei der Speicherung und die spezielle Adressierung verhindert. Bei diesen CAS-Speichersystemen handelt es sich um abgeschlossene Subsysteme, die allerdings nahezu wie herkömmliche Festplattensysteme direkt in die IT-Umgebung integriert werden können. Sie bieten Speicherkapazitäten mit hoher Performance im Terabyte-Bereich.

WORM-Bänder

WORM-Bänder sind Magnetbänder, die durch mehrere kombinierte Eigenschaften ebenfalls die Anforderungen an ein herkömmliches WORM-Medium erfüllen. Hierzu gehören spezielle Bandmedien sowie geschützte Kassetten und besondere Laufwerke, die die Einmalbeschreibbarkeit sicherstellen. Besonders in Rechenzentren, in denen Bandroboter und Library-Systeme („Tape-Libraries“) bereits vorhanden sind, stellen die WORM-Bänder eine einfach zu integrierende Komponente für die Langzeitarchivierung dar. Die vorhandene Steuer-Software kann mit den Medien umgehen und auch das entsprechende Umkopieren und Sichern automatisieren.

In jedem Fall sollte eine Datenkompression durchgeführt werden, optional auch Deduplizierung, nachdem große Dateimengen ins System eingespielt worden sind. (Mehr dazu in Teil 3 dieser Serie.) Ein verbreitetes Dateiformat für die zugriffsgesicherte Archivierung ist PDF/A. (Weitere Dateiformate werden in Teil 2 dieser Serie vorgestellt.)

Rechtliche Rahmenbedingungen

Das Thema Archivierung und Langzeitspeicherung hat in den letzten Jahren besonders durch rechtliche und regulative Vorgaben an Bedeutung gewonnen. Die Gleichbehandlung digitaler Dokumente mit elektronischer Signatur und herkömmlicher Papierdokumente, der Sarbanes-Oxley Act und andere Compliance-Anforderungen in den USA sowie die Diskussion um die Archivierung steuerrelevanter Daten entsprechend den DSGVO in Deutschland und Europa machen revisionssichere Archiv- und Speichersysteme erforderlich.

Das „richtige“ Speichermedium gibt es jedoch nicht, denn der technologische Wandel eröffnet immer neue Möglichkeiten. Das gesamte Verfahren der Archivierung muss geschlossen und sicher sein. Dies geht über die Frage der Speicherlaufwerke und -medien hinaus und bezieht auch die organisatorischen Prozesse mit ein.

Gesetzliche Aufbewahrungsfristen

Anstelle von simpler Ablage spielt seit etwa 20 Jahren der Begriff des Informationslebenszyklus (ILM) eine Rolle. Denn es gilt bei der Wahl der Medien wie auch der Software zu bedenken, dass viele archivierte Dokumente nur eine begrenzte Gültigkeit und damit eine Verjährungsfrist aufweisen, bevor sie erneuert werden müssen, so etwa Zertifikate nach bestimmten Normen und gemäß Auditierungen.

Abgeschlossene Geschäftsvorgänge können nochmals Bedeutung erlangen, insbesondere wenn Verjährungsfristen noch nicht abgelaufen sind und eine Verwirkung noch nicht eingetreten ist. Auch Gewährleistungsfristen und Produkthaftungsfristen erfordern eine längere Aufbewahrung von Geschäftsunterlagen, da mit ihrer sofortigen Vernichtung eine nachteilig wirkende Beweisnot einhergeht. Eventuell auftretende Rechtsstreitigkeiten oder sonstige beweispflichtige Vorgänge erfordern daher eine Archivierung von Unterlagen, um aus ihnen jederzeit nicht mehr erinnerbare Vorgänge ableiten zu können.

Am weitesten verbreitet und bekannt sind die Aufbewahrungsfristen („Retention Period“) nach Handels- und Steuerrecht. Daneben gibt es branchen- oder anwendungsspezifische Aufbewahrungsfristen für Schriftgut der Justizbehörden aufgrund der Schriftgutaufbewahrungsverordnungen, aber auch in der Pharmaforschung, Lebensmittel- und Pharmaproduktion, in Krankenhäusern, der Qualitätssicherung, im Umweltschutz, in der Telekommunikation und Energieerzeugung, im Bauwesen und so weiter. Von Aufbewahrungspflichten sind nicht nur Unternehmen betroffen, sondern auch Privathaushalte, etwa in der Finanzbuchhaltung und bei den Steuerunterlagen (zehn Jahre).

Auf Aspekte wie Datenschutz und Informationssicherheit sowie Compliance-Anforderungen geht der dritte Beitrag in dieser Artikelserie näher ein. Zu den „organisatorischen Rahmenbedingungen“ gehören die Einrichtung der Stelle eines Chief Document Officers und die Unterstellung der Archivierungsfunktion unter kompetente Stellen, etwa die eines Controllers oder Finanzvorstands (Chief Financial Officers, CFO).

Aktuelles eBook

Open-Source-Storage – Speicher-Software zum Nulltarif

eBook Open-Source-Storage
eBook „Open-Source-Storage“
(Bild: Storage-Insider)

Der Bedarf an Speicherkapazität steigt von Tag zu Tag – nicht nur, um die Daten von Produkten, Kunden und Transaktionen zu sichern, sondern auch, um Compliance-Anforderungen zu erfüllen und Auditierungen gut zu überstehen. Eine leistungsfähige Storage-Lösung ist also gefragt. Eine kostenlose Option bietet Open-Source-Software für Storage, insbesondere dann, wenn man sie selbst den eigenen Anforderungen anpassen darf.

Die Themen im Überblick:

  • Warum Storage als Open Source?
  • NAS & Objektspeicher
  • Backup & Disaster Recovery
  • Dateisysteme
  • Technologiestapel & Ökosysteme

(ID:50184416)