Langes Leben für digitale Archive

04.02.2007

Wer kennt das nicht: Beim Hervorkramen einer uralten E-Mail, eines Briefes oder des lange liegen gebliebenen Buchprojekts aus den Tiefen des Rechners stellt man plötzlich fest, dass sich die Datei nicht mehr öffnen lässt. Mehr dazu heute im Ö1-Magazin "matrix" - um 22.30 Uhr.

Denn in der Zwischenzeit hatte man das x-te Update des Betriebssystems oder Erstellungsprogramms installiert oder das Programm beim Kauf eines neuen Computers nicht übertragen. Noch schlimmer wird es, wenn man plötzlich etwas braucht, das sich auf alten Disketten befindet - womöglich noch auf einer Floppy Disk -, und der Rechner nur noch ein CD-Laufwerk hat.

"Matrix" berichtet heute um 22.30 Uhr in Ö1 über digitale Archive. Hören Sie doch vorbei!

Digitales Vergessen

Die Langzeitarchivierung von digitalen Daten ist ein Problem, das jeden betrifft. Was für Privatpersonen oder Firmen unangenehm sein kann, ist für Bibliotheken und Archive aber sogar dramatisch. Sind digitalisierte oder digital erstellte Bücher, Zeitungen, Musikstücke, Filme oder Bilder nicht mehr lesbar oder interpretierbar, geht das kulturelle Erbe der Menschheit unwiederbringlich verloren.

In aller Welt bemühen sich deshalb Bibliotheken und Forschungseinrichtungen darum, langfristige Lösungen für die digitale Archivierung zu finden. In der Europäischen Union laufen mehrere Initiativen und Forschungsprojekte für die Entwicklung entsprechender Techniken und Services, weil die Zeit drängt.

Einerseits werden analoge Medieninhalte digitalisiert, um empfindliche Originale vor weiterem Verfall durch die Benützung zu schützen. Andererseits schafft die Digitalisierung neue Möglichkeiten der einfacheren Benützung.

Die Österreichische Mediathek

In der Österreichischen Mediathek in Wien werden mehr als eine Million Tonaufnahmen und etwa 30.000 Videoaufnahmen vom ausgehenden 19. Jahrhundert bis in die Gegenwart aufbewahrt.

Die Tonbänder, Filme und Videos sind Alterungsprozessen unterworfen und werden digitalisiert, weil das ewige Umkopieren auf neue Tonbänder oder Filme keine Lösung ist. Dadurch werden die Materialien aber auch leichter benützbar.

Statt einen Archivar für ein gewünschtes Tonband ins Lager zu schicken, brauchen die Besucher der Mediathek bei digitalisierten Werken nur noch in der Datenbank suchen und können sich die Audiodatei sofort anhören.

Sicherheit wird bei digitalem Kulturgut groß geschrieben. Deshalb werden zum Beispiel CD-ROMs und DVDs, die in der Österreichischen Nationalbibliothek abgeliefert werden, sofort auf Plattenspeicher kopiert, laufend Backups gezogen und zusätzliche Kopien in einem sicheren Bunker aufbewahrt.

Archiv Nationalbibliothek

Andere digitale Medien müssen laut Mediengesetz derzeit nicht bei der Nationalbibliothek abgeliefert werden, Angebote werden aber gerne angenommen. Die Nationalbibliothek bemüht sich auch darum, in Zukunft Online-Medien sinnvoll speichern und archivieren zu können.

Konvertierungskette

Das große Problem der Langzeitarchivierung ist jedoch die Schnelllebigkeit von Betriebssystemen, Applikationen und Dateiformaten. Um zu verhindern, dass archivierte Inhalte eines Tages nicht mehr lesbar sind, werden sie immer wieder in neue Datenformate transferiert.

Dabei muss jedoch darauf geachtet werden, dass Formatierungen, Farben und andere Eigenschaften eines Dokuments nicht verändert werden. Forscher entwickeln deshalb gemeinsam mit der Industrie und den Standardisierungsbehörden Empfehlungen für Dateiformate, die langlebig sind.

Standards

Eine Lösung bietet zum Beispiel das Format PDF/A. PDF/A ist ein im Jahr 2005 als ISO-Norm verabschiedeter Standard zur Verwendung von PDF für die Langzeitarchivierung elektronischer Dokumente.

PDF steht für Portable Document Format. Es wurde vor 13 Jahren von der Firma Adobe entwickelt und ist ein kommerzielles, aber offen gelegtes Dateiformat. Während man bei PDF auch Audiodateien, Animationen und verschlüsselte Daten einbetten kann, ist das bei PDF/A nicht erlaubt.

So soll garantiert werden, dass die Daten auch in vielen Jahren noch lesbar sind. Am 29. Jänner hat Adobe bekannt gegeben, die gesamte Spezifikation von PDF 1.7 zur Standardisierung bei der ISO eingereicht zu haben.

~ Link: Adobe reicht PDF zur Standardisierung ein (../../http://www.fuzo-archiv.at/?id=167925v2) ~

Metadaten

Ein weiterer wichtiger Punkt bei der digitalen Langzeitarchivierung ist die Erstellung von Metadaten. Die Daten über die Daten sind entscheidend, damit Dokumente wieder gefunden werden können und ihre Geschichte auch nach mehrfachem Umkopieren und Transferieren noch nachvollziehbar ist.

Weil die digitale Langzeitarchivierung ein Problem ist, das jeden betrifft, wird die Österreichische Computergesellschaft einen Arbeitskreis gründen, der für jeden zugänglich ist. Das Kick-off-Meeting findet am 27. Februar statt.

(matrix | Sonja Bettel)