Elektronische Archivierung - aktueller denn je

Elektronische Archivierung – wer meint, das sei ein alter Hut, der irrt gewaltig. Auch wenn die ersten Systeme bereits vor mehr als 20 Jahren auf den Markt kamen, im Zeitalter der Globalisierung ist die Informationsverfügbarkeit von Unternehmensinformationen wichtiger denn je. Unverzichtbare Voraussetzung dafür ist das elektronische Archiv, heute nicht mehr nur als Insellösung in einzelnen Abteilungen zu sehen, sondern mehr und mehr als unternehmensweiter Informationsspeicher für alle Daten und Dokumente, auch neudeutsch zentrales Content Repository genannt.

In der aktuellen Diskussion um Enterprise Content Management, service-orientierte Architekturen und Geschäftsprozessoptimierung verliert man leicht aus dem Blickfeld, dass alle dokumentenbezogenen Transaktionen im Unternehmen eine Basis benötigen. Kein effizientes eMail Management ohne eMail-Archiv, keine automatisierte Rechnungsbearbeitung ohne elektronische Archivierung der Buchhaltungsbelege, kein kompetenter Kundenservice mit elektronischen Kundenakten ohne Repository für die Dokumente, keine systemunabhängige Vorbereitung auf elektronische Steuerprüfungen ohne auswertbares Archiv für steuerrelevante Daten. Ob Highend-Archiv für tausend Anwender im Rechenzentrumsbetrieb oder Abteilungsarchiv mit einer Handvoll Usern – im großen wie im kleinen Maßstab gelten grundsätzliche Anforderungen, die ein System für elektronische Archivierung erfüllen muss.

Die Luft wird dünner: Compliance

Das Korsett nationaler und internationaler gesetzlicher Vorgaben und Regeln wie Abgabenordnung (AO), Grundsätze ordnungsmäßiger DV-gestützter Buchführungssysteme (GoBS), Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU), Euro-SOX, Basel II, MiFID etc. wird immer enger und die Einhaltung nicht einfacher. Statt die Augen zu verschließen, ist rechtzeitige Planung angesagt. Sollen Belege aus dem Rechnungswesen archiviert werden, gilt es, die Vorschriften der AO, der GOBs und der GDPdU zu beachten. Revisionssichere Langzeitarchivierung und Auswertbarkeit steuerlich relevanter Daten auch nach Jahren sind hier die Stichworte. Mit dem Modewort Compliance rückt auch die Archivierung der eMail-Kommunikation in den Fokus. Spätestens seit den Skandalen in den USA – SOX lässt grüßen – tut jedes Unternehmen gut daran, geschäftsrelevante eMails quasi griffbereit aufzubewahren, um z.B. der Beweispflicht in Gerichtsverfahren genüge tun zu können.

Hinzu kommen unternehmensspezifische Anforderungen an die jederzeitige Verfügbarkeit der Unternehmensinformationen. Soll das Wissen des Unternehmens kein totes Kapital bleiben, muss es in den Geschäftsprozessen zur Verfügung stehen. Die Voraussetzung: ein elektronisches Archiv für alle Daten und Dokumente im Unternehmen. Waren Archive in den 80er und 90er Jahren kaum mehr als eine „Ablage-Tonne“ für Dokumente, auf die per Schlagwort wieder zugegriffen werden konnte, sofern man den richtigen Begriff eingab, so sind heutige Archivsysteme moderne Dokumenten-Management-Systeme mit ausgefeilten Archivfunktionen für jede Anforderung, skalierbar für jede Unternehmensgröße, mit intelligenten Retrieval-Methoden und eingebettet in komplexe ECM-Strukturen.

Die Konzeption der Archivierungslösung und ihrer Storage-Infrastruktur richtet sich nach dem konkreten Bedarf: Revisionssichere Langzeitarchivierung, Hochverfügbarkeit archivierter Dokumente, redundante Systeme für einen ausfallsicheren Betrieb, kostengünstige Storage-Technologien – ob für kleine und mittlere Unternehmen oder für Großkonzerne und Organisationen – nach einer Analyse der Gegebenheiten im Unternehmen können passgenaue Archivierungslösungen zugeschnitten werden. Entscheidend für das Archivkonzept sind Fragen wie: Wie sieht der Lebenszyklus der Dokumente aus? Werden sie nur in den ersten Monaten stark nachgefragt und später kaum noch für Recherchen benötigt? Oder muss jederzeit auf den kompletten Bestand zugegriffen werden?

Information Lifecycle im Blick

Information Lifecycle Management (ILM) ist ein intelligentes Konzept im Rahmen der elektronischen Archivierung zur Verwaltung sämtlicher Informationen eines Unternehmens über ihren gesamten Lebenszyklus hinweg, entsprechend ihrem Wert und der jeweils erforderlichen Verfügbarkeit. Anhand von Regeln – die Dokumente und Geschäftsprozesse priorisieren, sowie gesetzliche Bestimmungen und Kostenaspekte berücksichtigen – werden die Informationen auf dem jeweils optimalen Speichermedium automatisch abgelegt und vorgehalten. ILM bietet doppelten Nutzen: Zum einen werden die Unternehmensdaten den Vorschriften entsprechend optimal verwaltet, aufbewahrt und geschützt und zum anderen werden die geforderten Zugriffszeiten zu den jeweils günstigsten Speicherkosten erreicht. Information Lifecycle Managements gewährleistet eine ordnungsgemäße Langzeitarchivierung beliebiger strukturierter und unstrukturierter Dokumente inklusive Telefax, eMail und COLD (Computer Output On Laserdisk)-Daten auf verschiedenen Speichermedien über einen Zeitraum von mehreren Jahrzehnten.

Rechtssichere Langzeitarchivierung

Zur ordnungsgemäßen Langzeitarchivierung unterstützen moderne Archivsysteme als Speichermedien sowohl in Jukeboxen vorgehaltene UDO-Medien, AIT-Magnetbänder und Magnetplatten/RAID-Systeme als auch spezielle Speichersysteme für Fixed Content wie z.B. EMC Centera, IBM DR 550, Netapp Snap-Lock oder auch Kombigeräte wie den SER Archive Store G2, der moderne UDO-Technologie mit hochverfügbaren RAID-Systemen ergänzt. Die Auswahl des Speichermediums basiert auf den unternehmensspezifischen Anforderungen und den Erkenntnissen aus einer Kosten-Nutzen-Analyse. Eine Speichervirtualisierung ermöglicht die flexible Nutzung dieser unterschiedlichen Storage-Technologien ohne großen Migrationsaufwand. Mit einem optimal an den Unternehmensbedarf angepassten Speichermix erzielen Unternehmen kurze Zugriffszeiten bei niedrigen Speicherkosten – mit einer einzigen Speichertechnologie lässt sich das nicht erfüllen. Mit dem Konzept der Speichervirtualisierung lässt sich in jeder individuellen Kundensituation eine optimale Balance aus Leistungs- und Kostenanforderungen herstellen. Die Speichervirtualisierung sollte dabei transparent im Hintergrund erfolgen und ohne Auswirkung auf die Anwendungssoftware ablaufen. Die Vorteile liegen auf der Hand:

  • Investitionssicherheit bei Technologiewechseln durch einheitliche Sicht auf alle Speichersysteme
  • Abstraktion der physischen Speichersysteme und Medien
  • Flexible Wahl des kostengünstigsten Mediums für Langzeit-Datenbestände
  • Flexible Wahl des besten Mediums für Bestände mit hoher Rückgriffshäufigkeit
  • Automatisierbares medienbasiertes hierarchisches Speichermanagement (HSM)

Beispielhaft: Hochleistungsarchiv der GEZ

Täglich bis zu 250.000 Blatt Eingangspost und monatlich 3,5 bis 4 Mio. Ausgangsbriefe – das sind die Dokumentmengen, mit denen die Gebühreneinzugszentrale der öffentlich-rechtlichen Rundfunkanstalten in Deutschland - kurz: GEZ umgeht. Die dort implementierte SER-Archivlösung auf Basis der DOXiS iECM-Suite zeigt exemplarisch, wie ein Archivsystem über viele Jahre hinweg mit dem steigenden Dokumentaufkommen mit wächst und auch die Storage-Hardware kontinuierlich im laufenden Betrieb dem Bedarf angepasst werden kann. Die zum Einsatz kommenden Funktionen lassen sich für kleinere Unternehmen und Organisationen entsprechend anpassen.

Diese Größenordnung im DMS bewältigt die Gebühreneinzugszentrale in ihrem Rechenzentrum in Köln, in dem knapp 100 Mitarbeiter beschäftigt sind. Dort befindet sich die gesamte IT-Infrastruktur der GEZ. Sie besteht u.a. aus Großrechnern für die hostbasierte Verwaltung der rund 42 Millionen Teilnehmerkonten, Servern, Storage- und Backup-Systemen für das SER-Archiv, ausgelegt für bis zu 32 Terabyte; Bandspeicher als Sicherung für die Datenbanken der Großrechner und weiteren nachgelagerten Systemen. Das Rechenzentrum ist aufgeteilt in einen „Kommandosaal“ für die Überwachung der Systeme und Steuerung der Server, einen „Maschinensaal“ mit den primären Servern und Speichersystemen sowie separaten Räumen in einem anderen Gebäude mit den redundant ausgelegten Backup-Systemen.

„Nichts ist so teuer wie ein Produktionsausfall“

Ein Dokumenten-Management in der Größenordnung der GEZ stellt besondere Anforderungen bzgl. Hochverfügbarkeit und Performanz an das zugrunde liegende System. Das System muss von morgens um sieben bis abends 19 Uhr ununterbrochen zur Verfügung stehen. Ein Ausfall von nur 15 Minuten entspräche bei den Anwendern der GEZ einer verlorenen Arbeitszeit von gut 40 Tagen! Da ein Großteil der Eingangsdokumente einer Massenvorgangsverarbeitung zugeführt wird, muss das System eine höchstmögliche Performanz aufweisen. Der Zugriff auf ein zum Vorgang gehörendes Dokument – und zwar auf alle im System enthaltenen Dokumente der letzten Dekade - soll in weniger als zwei Sekunden erfolgen.

Um diese hohen Anforderungen zu erfüllen, wurde ein anspruchsvolles Archivkonzept entwickelt und umgesetzt. Das Herz des DMS/Archivs im Rechenzentrum der GEZ umfasst Server, RAID-Systeme und Tapelibraries. „Primär- und Sicherungssysteme werden parallel betrieben und haben einen identischen Datenbestand, so dass bei einem Systemausfall sofort mit dem Sicherungssystem weitergearbeitet werden kann“, beschreibt Volker Thorey, Abteilungsleiter und zuständig für die IT-Infrastruktur bei der GEZ, das Hochverfügbarkeitskonzept der SER-Lösung. „Denn nichts ist so teuer wie ein Produktionsausfall.“ Im Januar 2007 wurde ermittelt, dass pro Tag ca. 200.000 Anfragen der Sachbearbeiter an das DMS gestellt werden. Die Dokumente werden dann jedes Mal aus 180 Millionen gespeicherten Eingangsdokumenten und 270 Millionen Ausgangsdokumenten in Sekunden recherchiert und auf dem Bildschirm des Bearbeiters angezeigt.

Immer bedarfsgerecht – frei skalierbares Archiv

Zu Beginn der elektronischen Archivierung bei der GEZ sah das SER-System noch ganz anders aus. Die Ursprungskonfiguration – 1997 anhand des aktuellen Bedarfs aufgestellt – erwies sich bald als zu klein dimensioniert. Ursache war vor allem ein verändertes Kommunikationsverhalten der Rundfunkteilnehmer, die immer häufiger Anfragen an die GEZ per Telefon oder per E-Mail mit der Erwartung stellten, möglichst sofort eine abschließende Auskunft zu erhalten. Hinzu kamen ein starker Anstieg des Dokumentenaufkommens aufgrund veränderter gesetzlicher Rahmenbedingungen sowie eine Umstellung auf elektronische Sachbearbeitung. Gestartet war die GEZ vor mehr als 10 Jahren mit einem redundant ausgelegten SER-Archiv/DMS, bestehend aus zwei identischen Server- und Jukebox-Installationen und einem 800 GigaByte-Festplatten-Cache, der jeweils die Daten des letzten halben Jahres im direkten Online-Zugriff zur Verfügung stellte.

Um den gesamten Dokumentenbestand im schnellen Zugriff zu haben und nicht nur den Schriftverkehr der letzten sechs Monate, vollzog die GEZ im Jahr 2000 einen kompletten Technologiewechsel hin zu einer Hochverfügbarkeitslösung für den gesamten Datenbestand. Zur sicheren Speicherung der archivierten Dokumente und ihrer Indexdaten implementierte SER ein so genanntes Fibre-Channel-Speichernetz (SAN Storage Area Network) mit zwei räumlich getrennten Plattensubsystemen (RAID). Die vorhandenen DOXiS-Software-Pakete wurden auf den neuesten Stand gebracht. Ziel der Erweiterung waren gleichmäßig gute Retrievalzeiten für den kompletten Dokumentenbestand mit Antwortzeiten unter zwei Sekunden pro Seite. Außerdem sollte die Kapazität des Systems durch Ausbau der Hardware erweiterbar sein, damit die Archivierung der konstant wachsenden Datenmenge auch in Zukunft sichergestellt werden kann. Denn die Dokumentmenge der GEZ vergrößert sich pro Jahr um 1,5 bis zwei TeraByte. Mittlerweile wurde das SER-System der GEZ im Sommer 2006 zum dritten Mal - nach 2000 und 2003 - grundlegend ausgebaut. Das derzeitige archivierte Dokumentenvolumen beträgt rund 10TB.

Aufgaben eines elektronischen Archivs

  • Archivierung von Dokumenten (NCI- und CI-Dokumente), Daten und eMails
  • Indexverwaltung (Inhalte und Attribute)
  • Sicherung von Dokumenten, Daten und eMails
  • Recherche von Dokumenten und eMails
  • Versionierung und Check-in/Check-out
  • Verwaltung von Aufbewahrungsfristen
  • Mandantenverwaltung
  • Datenbestandsverwaltung
  • Verwaltung von Speichergeräten
  • Verwaltung von Medien und Laufwerken
  • Virtualisierung physikalischer Speicher
  • Rekonstruktion von Dokumenten/Daten aus den Medien










Wünschen Sie weitere Informationen?
Vorname
Nachname
Email *
Bemerkungen