:: wikimiki.org ::
| Backup |
BackupUnter einer Datensicherung versteht man sowohl den Vorgang des Kopierens der in einem Computersystem vorhandenen Daten auf ein Speichermedium (das im Allgemeinen transportabel ist), als auch das Ergebnis - die auf dem Speichermedium gesicherten Daten. Die Datensicherung wird auch als Backup [] oder Sicherungskopie bezeichnet. Deren Wiederherstellung wird auch als Restore bezeichnet.
Die Datensicherung dient dem Schutz vor Datenverlust durch Hardware-Schäden, Diebstahl, Feuer, Fluten, versehentliches oder absichtliches Löschen oder Überschreiben und logischen Fehlern innerhalb der Daten. Durch die kurzfristige Aufbewahrung (in der Regel 3 bis 6 Monate) unterscheidet sie sich von der längerfristigen Datenarchivierung, die anderen Gesetzmäßigkeiten unterliegt.
Die Aufbewahrung von Datensicherungen erfolgt örtlich entfernt von der EDV-Anlage in einer sicheren Umgebung. Für kleinere Unternehmen eignen sich z.B. Bankschließfächer. Größere Unternehmen benutzen Lampertz Zellen zur feuersicheren Unterbringung der Backup Roboter und der Verteilung der Backupdaten auf mehrere Standorte oder Rechenzentren.
Das einzig sichere Kriterium einer erfolgreichen Datensicherung ist der Nachweis, dass die gesicherten Daten auch vollständig und innerhalb eines angemessenen Zeitraums wiederhergestellt werden können.
Man unterscheidet zwischen differenzieller, inkrementeller und vollständiger Datensicherung. Bei einem differenziellen Backup werden die seit dem letzten vollständigen Backup geänderten Daten vollständig gespeichert. Bei der inkrementellen Datensicherung werden nur die Daten gesichert, die sich seit der letzten Datensicherung (meist dem letzten inkrementellen Backup) verändert haben. Eine vollständige Datensicherung bezeichnet die Sicherung aller Daten unabhängig vom Datum ihrer letzten Sicherung.
In Unternehmen wird die Datensicherung aufgrund einer Datensicherungsstrategie durchgeführt. In ihr ist festgelegt:
- Wie die Datensicherung zu erfolgen hat.
- Wer für die Datensicherung verantwortlich ist.
- Wann Datensicherungen durchgeführt werden.
- Welche Daten gesichert werden sollen.
- Welches Speichermedium zu verwenden ist.
- Wo die Datensicherung aufbewahrt wird.
- Wie lange Datensicherungen aufzubewahren sind.
- Wann und wie Datensicherungen auf ihre Wiederherstellbarkeit überprüft werden.
- Welche Backupstrategie (a) vollständiges Backup am Wochenende (b) inkrementelles oder differenzielles Backup werktags um Mitternacht
Allgemein essentiell für Datensicherungen ist deren:
: Regelmäßigkeit
::Datensicherungen sollen in regelmäßigen Abständen erfolgen. Diese Abstände variieren je nach Anwendung. Eine monatliche Sicherung der Daten auf einem privaten PC kann durchaus ausreichend sein, während in Produktionsumgebungen meistens tägliche Sicherungen notwendig sind.
: Aktualität
:: Die Aktualität der Datensicherung wird durch die Regelmäßigkeit erreicht.
: Verwahrung
:: Datensicherungen von Unternehmen beinhalten Firmengeheimnisse und müssen vor unbefugtem Zugriff geschützt werden.
:: Datensicherungen müssen räumlich getrennt von der EDV-Anlage gelagert werden. Die räumliche Entfernung der Datensicherung vom gesicherten Datenbestand sollte so groß sein, dass eine Katastrophe (Brand, Erdbeben, Flut...), welche die EDV-Anlage heimsucht, den gesicherten Datenbestand nicht gefährdet.
: ständige Prüfung auf Vollständigkeit und Integrität
:: Datensicherung und Datensicherungsstrategie müssen regelmäßig überprüft und angepasst werden. Wurden die Daten wirklich vollständig gesichert? Ist die eingesetzte Strategie konsistent? Erfolgte das Backup ohne Fehler?
: Regelmäßige Überprüfung auf Wiederherstellbarkeit
:: Ein Restore muss innerhalb eines festgelegten Zeitraums durchgeführt werden können. Hierzu muss die Vorgehensweise einer Datenwiederherstellung ausreichend dokumentiert und die benötigten Ressourcen (Personal, Medien, Bandlaufwerke, Speicherplatz auf den Ziellaufwerken) verfügbar sein.
Hot Backup
Ein Hot Backup ist eine Sicherung eines Systems (beispielsweise einer Datenbank), die möglichst aktuell gehalten wird - im Idealfall ist sie auf dem gleichen Stand wie das Live-System. Vorteil dieser Methode ist das Vorhalten eines aktuellen "Ersatz-Datenbestandes", der im Fall eines Systemabsturzes sofort einsatzbereit ist.
Eine Realisierungsmöglichkeit ist beispielsweise über RAID 1 ("Mirroring") denkbar.
Aufgrund des engen Verbundes von Hot-Backup und Live-System ersetzt diese Variante nicht herkömmliche Backup-Methoden, da beispielsweise versehentliche Löschoperationen auch im Backup sofort abgelegt werden.
Siehe auch
- Technischer Datenschutz
- EDV
- Bandlaufwerk
- Datenrettung
- Generationenprinzip
- elektronische Archivierung
Literatur
- Klaus-Rainer Müller: IT Sicherheit mit System, 2. Auflage 2005, VIEWEG, ISBN 3-528-15838-7
- Egbert Wald: Backup & Disaster Recovery, ISBN 3-826-60585-3
Weblinks
- [http://www.hdd-guide.de/datenverlust Informationen zum Thema Datenverlust]
- [http://www.heise.de/ct/99/11/138/ Datensicherung]
- [http://www.wikidorf.de/reintechnisch/Inhalt/Datensicherung Artikel über Datensicherung]
- [http://www.backuptrauma.com/video/default2.aspx Satire mit John Cleese über Backup-Traumata]
- [http://www.storitback.de/service/backup-recovery.html Infos zu Datensicherung / Backup]
- [http://www.pro-datenrettung.net/datenrettung-faq.html Sehr gute Erklärung zum Thema Datensicherung]
Kategorie:Datenbank
Kategorie:IT-Sicherheit
DatenDer Begriff Daten ist der Plural von Datum (lat. Singular datum, Plural data = Gegebenes).
Sprachliche Anmerkung
Diese Pluralform folgt damit anderen Wörtern lateinischen Ursprungs wie Faktum/Fakten und Skriptum/Skripten. In der deutschen Sprache hat sich jedoch die Bedeutung von "Datum" im allgemeinem Sprachgebrauch auf "Kalenderdatum" eingeengt.
Deshalb ist die Verwendung des Wortes "Daten" als Plural von "Datum" unüblich. "Datum" wird behandelt, als ob es ein Singularetantum (Wort ohne Plural) wäre; "Daten" wird behandelt, als ob es ein Pluraletantum (Wort ohne Singular) wäre. Falsche scherzhafte Pluralia von "Datum" sind Datümer und Datumse; eine beliebte Methode, das Wort "Daten" zu vermeiden, ist die Umschreibung mit "Termine". Um dagegen das Wort "Datum" als Singular zu "Daten" zu vermeiden, werden Wörter wie "Datenelement", "Angabe" oder "Wert" verwendet.
Informatik
Die Informatik und Datenverarbeitung (EDV) benutzen Daten als (maschinen-) lesbare und bearbeitbare Repräsentation von Information. Die Information wird dazu in Zeichen (bzw. Zeichenketten) kodiert, deren Aufbau strengen Regeln folgt, der so genannten Syntax. Daten werden zu Informationen, wenn sie in einem Bedeutungskontext stehen.
Beispiel: 0815 kann eine Telefonnummer sein und damit zu den Daten gehören. Wenn dazu der Name des Teilnehmers genannt wird, so wird daraus eine Information.
Man unterscheidet:
- strukturierte Daten (zum Beispiel Datenbanken, XML)
- unstrukturierte Daten (beispielsweise Dokumente)
- transiente Daten
Während sich strukturierte Daten relativ einfach maschinell weiterverarbeiten lassen, ist dies bei unstrukturierten Daten nur schwer oder ungenau möglich.
Das Synchronisieren von Daten wird als Datenabgleich bezeichnet.
Semiotik
Die Semiotik definiert Daten als potenzielle Information. In der Semiotik werden Daten heute in die Sigmatik-Ebene eingeordnet.
Beispiele für Daten
- 0010100100100001
- Ländercodes (Internet)
- Ländervorwahlen für das internationale Telefonnetz
- Städtevorwahlen für Deutschland
- Anzahl der Fenster in einem Haus
- Größe und Masse
- Ergebnisse von Experimenten in den Naturwissenschaften
- technische Fakten
- Antworten von Umfragen, Volkszählungen,...
Siehe auch
Datensatz, Datei, Datenfernübertragung, Faktum, Datenschutz, Technischer Datenschutz, Sozialdaten, Datensicherheit, Datenwiederherstellung, Datenqualität, Datatypist, Personenbezogene Daten, Diagramm
Kategorie:Datenstruktur
Kategorie:Praktische Informatik
Kategorie:Semiotik
ja:データ
ko:데이터
simple:Data
Speichermedium
Ein Speichermedium dient zur Speicherung von Daten bzw. Informationen.
Man kann hierbei zwischen nur lesbaren, einmalig beschreibbaren und wiederbeschreibbaren Datenträgern unterscheiden.
Außerdem lassen sich solche Medien danach klassifizieren, wie die Informationen auf ihnen gespeichert werden.
Speichermedien können folgendermaßen untergliedert werden:
Physische Speicherung
Umfasst alle Speichermedien, für die mechanische Bearbeitungsprozesse benötigt werden. Als Beispiele seien genannt der Druck von Schrift auf Papier und das Erstellen von Keilschrift auf Tontafeln.
Hier finden wir auch alle klassischen, nicht EDV-spezifischen Speichermedien. Unterschiede bestehen hierbei in der Handhabung sowie der Lebensdauer (Haltbarkeit) des jeweiligen Speichermediums.
Ohne Hilfsmittel zu lesen
Die Informationen auf diesen Speichermedien können durch Menschen ohne technische Hilfsmittel unmittelbar verarbeitet werden
- Papier, auch Papyrus, Pergament, Palmblatt
- Folie
- Steintafel
- Tontafel, Tonzylinder
- Holztafel, Kerbholz
- Wachstafel
- Leder,
- Knotenschrift
- Wandzeichnung
- Schiefertafel
- Schreibfolie
- Teppich von Bayeux
Mit Hilfsmitteln zu lesen
Um die Information von den folgenden Speichermedien zu lesen, braucht man im Allgemeinen ein technisches Hilfsmittel.
(Informationen auf Lochkarten und Lochstreifen lassen sich im Notfall aber auch ohne Hilfsmittel bzw. mittels einer Tabelle entziffern.)
- Lochkarten
- Lochstreifen
- LP (Langspielplatte, Vinyl)
- Schellack-Platte
- Wachszylinder
Elektronische Speicherung / Halbleiterspeicher
Unter der Elektronischen Speicherung sind alle Speichermedien zusammengefasst, welche Informationen in oder auf Basis von elektronischen Bauelementen speichern. Die elektronische Speicherung findet heute praktisch nur noch in Silizium realisierten integrierten Schaltkreisen statt. Die einzelnen Speichermechanismen können nach der Charakteristik der Datenhaltung unterschieden werden:
- flüchtige Speicher, deren Information verloren gehen, wenn sie nicht aufgefrischt werden oder der Strom abgeschaltet wird,
- permanente Speicher, in denen sich eine einmal gespeicherte oder festverdrahtete Information befindet, die nicht mehr verändert werden kann und
- semi-permanente Speicher, die Informationen permanent speichern, in denen aber Informationen auch verändert werden können.
Um elektronische Speichermedien lesen zu können, bedarf es auch technischer Hilfsmittel.
- Flüchtig:
- DRAM, dynamisches RAM (dynamic random access memory)
- SRAM (static random access memory)
- Permanent:
- ROM (read only memory)
- PROM (programable read only memory)
- Semi-permanent:
- EPROM (erasable programable read only memory)
- EEPROM (electrically erasable programable read only memory)
- Flash-EEPROM (USB-Stick)
- FRAM
- MRAM
- Phase Change RAM
(siehe auch Permanentspeichermedium)
Der Endanwender erhält die elektronischen Speichermedien häufig jedoch nicht als einzelnen Speicherbaustein, sondern bereits als kombiniertes Produkt:
Im Fall von DRAM für die Anwendung als Arbeitsspeicher in Computern oder Peripheriegeräte werden mehrere Speicherbausteine auf sogenannte Speichermodule kombiniert.
Die für die Speicherung von Multimedia-Daten in mobilen Anwendungen beliebten Flash-Speicher kommen in vielfältigen, meist als Speicherkarte ausgeführten Gehäusen, die neben dem eigentlichen Speicherbaustein auch Controller enthalten.
Magnetische Speicherung
Die magnetische Speicherung von Information erfolgt auf magnetisierbarem Material. Dieses kann auf Bänder, Karten, Papier oder Platten aufgebracht werden. Magnetische Medien werden (außer Kernspeicher) mittels eines Lese/Schreibkopfes gelesen respektive geschrieben.
Wir unterscheiden hier zwischen rotierenden Platten(stapeln), die mittels eines beweglichen Kopfes gelesen und geschrieben werden und nicht rotierenden Medien, die üblicherweise an einem feststehenden Kopf zum Lesen/Schreiben vorbeigeführt werden.
Bild:magnetspeicher.png|Magnetspeicher
- Magneto-elektronisch
- Kernspeicher
- Nicht rotierende Speichermedien
- Magnetband
- Magnetkarte
- Magnetstreifen
- Compact Cassette (Datasette)
- Rotierende Speichermedien
- Magnet-Trommel
- Festplatte (hard disk)
- Diskette (floppy disk)
- Wechselplatte z. B. Zip-Diskette (von iomega)
Optische Speicherung
Die optische Speicherung nutzt Filter-, Reflexions- und Beugungseigenschaften von verschiedenen Materialien. Beim Film und in der Photographie werden farbfilternde Eigenschaften ausgenutzt, bei CDs die reflektiven Eigenschaften und bei Hologrammen die lichtbeugenden Eigenschaften.
- Film und Mikrofilm.
- Laserdisc.
- PD.
- CD, Unterformate: Audio-CD, CD-ROM, CD-R, CD-RW, SVCD, VCD, MVCD.
- DVD, Unterformate: DVD-Video, DVD-Audio, DVD-ROM, DVD-RAM, DVD±R, DVD±RW.
- DVD-Nachfolger: Blu-ray Disc, HD-DVD, Ultra Density Optical.
- HVD
- Holographischer Speicher.
Magneto-optische Speicherung
Die Magneto-Optische Speicherung nutzt die Tatsache, dass einige Materialien durch Magnetisierung ihre optischen Eigenschaften verändern, aber auch dass ein Laserstrahl mittels Wärmeinduktion die Magnetisierung eines magnetischen Materials aufheben kann. Ausgelesen werden magneto-optische Medien rein optisch.
- MiniDisc
- MO-Disk
Sonstige Speicherung
- Laufzeitspeicher
- "biologische Speicher": siehe Deinococcus radiodurans
- Wasser als Speichermedium [http://www.stmugv.bayern.de/de/aktiv/schule/48/home/ch_forsh.htm]
Weitere Kriterien zur Untergliederung
- Beschreibbarkeit
- Kapazität und Zugriffsgeschwindigkeit
- Lebensdauer
Siehe auch
- Kategorie: Speichermedium - Eine alphabetische Liste aller Artikel über Speichermedien in Wikipedia.
- Backupserver
- Digitales Vergessen
- Datenrettung
- ECM-Komponenten
- Elektronische Archivierung
- Information Lifecycle Management
- Revisionssichere Speicher
Weblinks
- [http://www.netzeitung.de/servlets/page?section=984&item=222111 netzeitung.de: Strahlenresistente Bakterien als dauerhafte Datenspeicher]
- [http://zeus.zeit.de/text/2003/09/DNA-Text_10 Die Zeit: Biologische Festplatte]
- [http://www.wissenschaft.de/wissen/news/249875.html www.wissenschaft.de: Plastikkugeln schlagen DVD - Neues Speichermedium punktet mit deutlich höherer Speicherdichte]
- [http://www.wissenschaft.de/wissen/news/255413.html www.wissenschaft.de: Scharfe Superdisk - Nachkömmling der DVD kann 100 Gigabyte speichern]
Kategorie:Fototechnik
Kategorie:Speichermedium
ja:記憶装置
DatensicherungsstrategieUnter Datensicherungsstrategie versteht man in der Informatik ein Konzept zur erfolgreichen Datensicherung.
Eine Datensicherungsstrategie kann überall dort zum Einsatz kommen, wo es einzigartige Daten eines gewissen Wertes gibt, sei es im Privatanwenderbereich, in Projekten oder im Unternehmensbereich. Letzterenfalls kann diese als bindende Vorgabe in Form einer Richtlinie existieren.
Die optimale Datensicherungsstrategie ist von vielen Faktoren abhängig und daher in jedem Einzelfall neu zu ermitteln.
Wichtige Faktoren, die berücksichtigt werden müssen sind:
Die Art der Daten
Maschinell wiederherstellbare Daten: Dazu gehört z. B. installierte Software, die nur wieder eingespielt werden muss.
Manuell wiederherstellbare Daten: Dazu gehören z. B. erstellte Texte oder Erfassungen von Sachbearbeitern. Zu beachten ist, dass auch die aufwendige Konfiguration und Administration von installierter Software in diese Rubrik fällt.
Unersetzliche Daten: Dazu gehören z. B. digitale Fotos und Videos, aber auch eingescannte Belege wenn die Originale nicht mehr vorhanden sind.
Der Wert der Daten
Hier sind zwei Aspekte zu unterscheiden:
Erstens, welcher Verlust entsteht, wenn die Daten unwiederbringlich zerstört werden. Wenn z. B. in einem Unternehmen Daten tagesaktuell in der Nacht gesichert werden, müssen bei einem Datenverlust kurz vor Feierabend alle Erfassungen wiederholt werden. Aus der Gehaltssumme der betroffenen Mitarbeiter ergibt sich ein Anhaltspunkt für den Verlust. Vor allem bei den unersetzlichen Daten ist allerdings oft auch der ideelle Wert zu berücksichtigen.
Zweitens, welcher Verlust entsteht durch die Zeit, die die vollständige Wiederherstellung benötigt und in der ggf. nicht gearbeitet werden kann. Wenn z. B. die Installation eines PC einen Tag benötigt, kann der Schaden den Wert der installierten Software weit übersteigen. Hier wäre also ein Sicherungsverfahren zu wählen, was es ermöglicht den installierten Stand sehr schnell wieder vollständig zu rekonstruieren (Image Copy).
Die Änderungshäufigkeit der Daten
Dieser Faktor hat entscheidenden Einfluss auf die Anwendung und Gestaltung des Generationenprinzips. Daten mit geringer Änderungshäufigkeit, wie z. B. Betriebssystem und installierte Software müssen nicht unbedingt regelmäßig gesichert werden. Es kann auch ausreichend sein, diese Bereiche nur vor oder nach Eingriffen zu sichern.
Je schneller Daten verändert werden, desto geringer wird man die Zyklendauer der Sicherung entsprechend dem Generationenprinzip wählen. Zu beachten ist hier auch die Verfallsdauer. Während es für viele Daten im Geschäftsleben gesetzlich geregelte Aufbewahrzeiten gibt (beispielsweise Rechnungsdaten), können z. B. aktuelle Inhalte von Webseiten u. U. schon nach kurzer Zeit verworfen werden, wenn sie nicht mehr benötigt werden.
Gesetzliche Anforderungen
Die Datensicherungsstrategie muss in der Lage sein, mögliche gesetzliche Auflagen zu garantieren (z.B. Revisionssicherheit).
Zu beachten:
GoBS (Grundsätze ordnungsmäßiger Buchführungssysteme) speziell: Absatz 5.1 und 5.2
Speicherort
Da es also sehr unterschiedliche Arten von Daten mit unterschiedlichen Anforderungen an die Sicherungsstrategie gibt, ist es zweckmäßig diese Daten schon im Vorfeld auf verschiedene Speicherorte (Festplatten, Partitionen) zu trennen. Für jeden Speicherort kann dann die optimale Strategie gewählt werden.
Zeitaufwand der Datensicherung
Bei der Wahl eines geeigneten Konzepts spielt insbesondere aus unternehmerischer Sicht der für die Datensicherung benötigte Zeitaufwand eine wichtige Rolle. Der Gesamtaufwand setzt sich aus dem wiederkehrenden Sicherungsaufwand und dem im Falle eines Datenverlusts anfallenden Wiederherstellungsaufwand zusammen. Die Relation, in der diese beiden Größen zu einander stehen, ist abhängig von der Auswahl eines konkreten Datensicherungsverfahrens. Ein geringer Sicherungsaufwand wird insbesondere dann angestrebt, wenn große Datenmengen während des Sicherungsvorganges gesperrt werden müssen, was bei modernen Systemen aber oft vermieden werden kann. Zu diesem Zweck gibt es heutzutage Software, die Daten eines Systems im laufenden Betrieb sichern können.
Kriterien für die Datensicherung
Je nach Medium und Art der Datensicherung werden die Kriterien anders ausfallen. Meistens erwähnt werden jedoch folgende Punkte:
- Die Datensicherung sollte automatisch, möglichst ohne Eingriff eines Benutzers erfolgen.
- Die Datensicherung sollte periodisch (in betrieblichem Umfeld meist täglich) erfolgen.
- Besteht die Datensicherung aus mehreren Speichermedien, sollte sichergestellt werden, daß ein Restore auch dann erfolgen kann, wenn eines dieser Medien fehlt oder beschädigt ist.
- Es sollten zumindest zwei Kopien der Daten vorhanden sein. Diese Kopien sollten sich auf verschiedenen Medien befinden, welche räumlich voneinander getrennt aufbewahrt werden (Es nützt das beste Backupkonzept nichts, wenn die Sicherungen mit dem Büro abbrennen)
- Für den Ernstfall ist eine Checkliste zu erstellen. Im Ernstfall hat niemand Zeit oder Nerven, nachzudenken, was als nächstes zu tun ist. Daher ist eine Checkliste sehr nützlich.
- Nach Möglichkeit sollten die Daten vor der Sicherung nicht komprimiert werden. Redundanz kann bei der Wiederherstellung von Daten nützlich sein.
- Wo immer möglich, verbreitete Standardformate für Dateien und Medien benutzen. E-Mails und Officedokumente sind ausgedruckt in einem Ordner fast nützlicher als auf einem Sicherungsmedium.
- Es ist zumindest ein Laufwerk bereitzuhalten, welches die verwendeten Medien lesen kann.
- Die Lesbarkeit der bespielten Medien sollte regelmässig überprüft werden.
- Das Vorgehen im Ernstfall sollte mehreren Mitarbeitern bekannt sein.
Kategorie:Datenschutz
Kategorie:IT-Sicherheit
KatastropheEine Katastrophe (griechisch καταστροφή aus altgriechisch katá - einer Vorsilbe, die eine Umkehr oder Abwärtsrichtung ansagt und strephein - wenden) ist ein entscheidendes, folgenschweres Unglücksereignis.
In versicherungsrechtlicher Sicht ist sie nach bundesdeutschem Verständnis ein Schadensereignis, welches deutlich über die Ausmaße von Schadensereignissen des täglichen Lebens hinaus geht und dabei Leben und Gesundheit zahlreicher Menschen, erhebliche Sachwerte und/oder die lebensnotwendigen Versorgungsmaßnahmen für die Bevölkerung erheblich gefährdet oder einschränkt.
Hingegen ist in der Theorie des Dramas die "Katastrophe" die entscheidende Schlusswendung, in der der in der Katastasis geschürzte Knoten der Handlungsstränge und Motive gelöst wird, gewöhnlich mit verhängnisvollem Ausgang.
In der Mathematik beschreibt die Katastrophentheorie geometrische Eigentümlichkeiten von Flächen in dreidimensionaler Darstellung und gehört zur Systemtheorie.
Als Gegenbegriff wird (selten) Anastrophe verwandt.
Katastrophe als Ereignis
Der soziale Zustand "Katastrophe" wird subjektiv empfunden und kommunikativ verbreitet. Er kann von einem persönlichen Notfall, örtlichen Schadenfällen (Desaster, disaster) bis zu einer großflächigen Zerstörung von Leben, Infrastruktur und Hilfsmöglichkeiten eines ganzen Lebensraumes, sogar bis zum Untergang ganzer Gesellschaften reichen. Im Bereich der Exekutive ist die Katastrophenabwehr eine Aufgabe des Katastrophenschutzes. Dort wird im Bereich der Hilfskräfte wird von einer "Katastrophe" gesprochen, wenn bei einem Großschadensereignis mehr Verletzte als Helfer vor Ort sind.
Katastrophe und Katastrophenschutz
Deutschland
Juristisch wird hier "Katastrophe" von Großschadensereignis bzw. dessen Synonymen Großschadenslage und Großunfall insofern abgegrenzt, als die "Katastrophe" (nach jewiligem Landesrecht) generell ein Hinzuziehen von Strukturen des Katastrophenschutzes (Führungseinheiten, Personal und Material) zu ihrer Bewältigung erforderlich macht.
Weiter ist Voraussetzung zur Verwendung des Begriffs "Katastrophe" im operativen Sinn, dass adäquate Gegenmaßnahmen nur gezielt getroffen werden können, wenn eine einheitliche/zentrale Koordination der Abwehrmaßnahmen durch Katastrophenschutzbehörden erfolgt und Mittel des Katastrophenschutzes für die Beseitigung der Katastrophe bzw. die Abmilderung ihrer Folgen herangezogen werden müssen (siehe zum Beispiel Bayerisches Katastrophenschutzgesetz Art. 1).
Ein "Großschadensereignis" stellt hingegen eine Schadenslage dar, welche sich durch die Notwendigkeit der Integration von ortsfremden Hilfseinheiten im Rahmen der überörtlichen Amtshilfe auszeichnet. Auf Katastrophenschutzmittel muss dabei nicht notwendigerweise zurückgegriffen werden. Auch ein Unglück, bei dem es zu einem Massenanfall von Verletzten kommt, wird als Großschadenslage bezeichnet. Wenn eine Großschadenslage vorliegt bzw. ausgerufen wird, ist es möglich besondere Hilfe von Landesbehörden zu bekommen, so zum Beispiel überörtliche Hilfe von anderen Feuerwehren oder Geldmittel.
In Deutschland existieren (auf Grund der Länderzuständigkeit gemäß der föderalen Staatsordnung) 16 verschiedene Legaldefinitionen in der den Katastrophenschutz betreffenden Gesetzgebung. Wenn eine Großschadenslage vorliegt bzw. ausgerufen wird, ist es möglich besondere Hilfe von Landesbehörden zu bekommen, so zum Beispiel überörtliche Hilfe von anderen Feuerwehren oder Geldmittel.
Österreich
In Österreich kann bei den oben beschriebenen Veränderungen ein bestimmtes Gebiet zum Katastrophengebiet werden. Je nach Ausdehnung kann ein Bürgermeister, Bezirkshauptmann oder Landeshauptmann die Katastrophe ausrufen.
Die Katastrophenschutzgesetzgebung obliegt den einzelnen Bundesländern. Damit treten bestimmte Notstandsgesetze in Kraft um die Auswirkungen leichter und unbürokratischer in den Griff zu bekommen. Wenn Personen durch eine Katastrophe im Ausland betroffen sind, so zählt die Hilfe zu den Aufgaben des Außenministeriums.
In erster Linie ist die Bekämpfung von Katastrophen Aufgabe der Feuerwehr mit den organisierten Katastrophenhilfsdiensten und den Rettungsorganisationen. Aber auch das Bundesheer kann zu Assistenzhilfsleistungen herangezogen werden.
In den USA ist zentral die FEMA (Federal Emergency Management Agency) zuständig. Vgl.
- [http://en.wikipedia.org/w/index.php?title=FEMA englischer wikipedia-Artikel über die FEMA]
- [http://www.fema.gov] bzw. [http://www.fema.gov/about/history.shtm Die Entwicklung der FEMA] (Selbstdarstellung)
Andere Länder
Fast alle Staaten haben gegen Katastrophen für den Katastrophenschutz zuständige Organisationen, zumindest rudimentär. Arme Länder oder Länder mit instabilen politischen Verhältnissen sind beim Eintritt einer Katastrophe oft auf Hilfe durch andere Staaten sowie internationale nichtstaatliche Institutionen und Organisationen wie beispielsweise die Internationale Rotkreuz- und Rothalbmond-Bewegung angewiesen.
Typologie
Eingetretene oder drohende Katastrophen, pragmatisch aufgezählt, wären:
- Nukleare Katastrophen (A-Gefahren)
- Seuchen (B-Gefahren, biologische Gefahren, vgl. z. B. die Grippe)
- Chemiekatastrophen (C-Gefahren)
- Datennetzbezogene Katastrophen (D-Gefahren)
- Elektromagnetisch ausgelöste Katastrophen (E-Gefahren)
- Katastrophen durch Freisetzung von mechanischer und/oder thermischer Energie (F-Gefahren: Druck (Zusammenstöße, Orkane), Brand (Explosionen), wie z.B.
- Katastrophen der Luftfahrt,
- Katastrophen der Raumfahrt,
- Katastrophen der Seefahrt,
- Katastrophen im Schienenverkehr,
- Katastrophen im Straßenverkehr,
- Talsperren-Katastrophen
Häufig werden Naturkatastrophen von "technischen Katastrophen" unterschieden, d.h. Naturereignisse, denen Menschen ausgesetzt sind und die zum Ersticken, Ertrinken, Verdursten, Verhungern, Erfrieren, Verbrennen und Vergleichbarem führen (wie Meteoreinschläge, Vulkanausbrüche, Lawinen, Erd- und Seebeben, Hochwasser, Waldbrände u.a.m.). Aber auch Naturkatastrophen sind in ihren Auswirkungen stets sozial bzw. kulturell beeinflusst (sogar Man Made Disasters) - wenn Menschen die Vulkanabhänge nicht besiedelt hätten, wäre ein Ausbruch oft keine "Katastrophe". Diejenigen sog. "technischen Katastrophen", die eine verheerende ökologische Beeinträchtung bedeuten, bezeichnet man auch als Umweltkatastrophen.
Literatur
- (Erdbeben von Lissabon 1755), mit Beiträgen von Wolf R. Dombrowsky, Odo Marquard, Franz Mauelshagen, Andreas Maurer, Wolfgang Sofsky u.a., Neue Zürcher Zeitung, 29./30.10.2005, S.61-65
- Lars Clausen/Elke M. Geenen/Elisio Macamo (Hg.): Entsetzliche soziale Prozesse. Theorie und Empirie der Katastrophen, Münster (LIT-Verlag) 2003, ISBN 382586832X
- Zweiter Gefahrenbericht der Schutzkommission beim Bundesminister des Innern, Bonn (Bundesverwaltungsamt - Zentralstelle für Zivilschutz) 2001
- Ned Halley: Das große Buch der Katastrophen, Nürnberg 2000, ISBN 3788604999
- Das große Buch der Katastrophen, Wien 1998, ISBN 3850018830
- Die großen Katastrophen und Unglücksfälle, Gütersloh 1997, ISBN 357714551X
- Charles Perrow: Normale Katastrophen, Frankfurt 1992, ISBN 3593341255
- Karcev Chazanovskij: Warum irrten die Experten?, Berlin 1990, ISBN 3341005455
Siehe auch
- Debakel, Unheil, Anastrophe
- Katastrophenschutz, Zivilschutz, Bundesamt für Bevölkerungsschutz und Katastrophenhilfe, Schutzkommission beim Bundesminister des Innern, Deutsches Komitee Katastrophenvorsorge
- Katastrophenvorbeugung, Katastrophenvorsorge, Risikoanalyse als Instrument der Katastrophenvorsorge, Notvorrat, Vorbereitung auf den Katastrophenfall
- Warnung, Frühwarnung bei Naturkatastrophen, Alarm
- Triage
- Katastrophensoziologie, Katastrophenforschungsstelle der Universität Kiel, FAKKEL, LIDPAR, Emergentes Organisations-Netzwerk, Noah-Effekt
- Katastrophismus
Weblinks
- [http://www.denis.bund.de/ das deutsche Notfallvorsorge-Informationssystem ]
- [http://www.katastrophenschutz-ev.de/ Katastrophenschutz e.V. - Verein zur Optimierung des Katastrophenschutzes und Rettungswesens]
- [http://www.diakonie-katastrophenhilfe.de/ Diakonie Katastrophenhilfe]
- [http://www.katastrophenforschung.de/ Deutsches Portal zur Katastrophenforschung]
- [http://www.kfs.uni-kiel.de/ Katastrophenforschungsstelle der Universität Kiel]
- [http://www.katastrophennetz.de/ Katastrophenforschung - Deutschsprachiges Katastrophennetzwerk mit Mailingliste]
- [http://www.hilfsorganisationen.de/MENUE/Katastrophen/ Hilfsorganisationen - Unterkategorie des Portals]
- [http://www.dkkv.org Deutsches Komitee Katastrophenvorsorge]
- Zum Hurrikan Katrina: [http://katrinahelp.info/wiki/index.php/Main_Page Extra-Wiki zur Katastrophenhilfe in Louisiana und Mississipi] (nur englisch)
Katastrophe in der Tragödie
In älterer literaturwissenschaftlicher Terminologie ist für die "Katastrophe" der V. Akt bestimmt.
Kategorie:Katastrophenschutz
ja:災害
DatenwiederherstellungDatenwiederherstellung oder auch Datenrettung (engl. Data Recovery) wird der Vorgang genannt, mit dem man gelöschte bzw. beschädigte Daten auf einem Datenträger wie zum Beispiel einer Festplatte oder einem Bandlaufwerk wieder lesbar macht. Manchmal handelt es sich dabei nicht nur um beschädigte Datenstrukturen, sondern auch um defekte Speichermedien, die soweit beschädigt sein können, dass die Daten nicht mehr ohne weitergehende technische Maßnahmen gelesen werden können.
Die Gründe für Datenverlust können vielfältig sein: Daten können durch Katastrophen wie zum Beispiel einem Brand, einer Explosion oder Wasserschaden verloren gehen. Datenträger versagen durch Überalterung oder technische Defekte. Sehr oft wird der Verlust auch durch Unachtsamkeit wie versehentliches Löschen oder Formatieren verursacht. Auch durch Angriffe von Computerviren und Computerwürmern können Daten verloren gehen.
Die einfachste Möglichkeit, Daten zurückzuholen, ist die Wiederherstellung der Daten aus dem Papierkorb des Systems, wenn sie dort noch vorhanden sind. Wenn sie dort auch gelöscht wurden, ist die nächste Möglichkeit das Einspielen eines Backups, das aus diesem Grunde regelmäßig und häufig gemacht werden sollte.
Ist kein Backup vorhanden, kann man bei unbeschädigten Datenträgern die Daten mit geeigneten, zum Teil frei erhältlichen Programmen wieder sichtbar machen. Allerdings gelingt damit in den seltensten Fällen die komplette Wiederherstellung. Bei sehr wichtigen Daten sollten jedoch alle Eigenversuche unterbleiben, insbesondere Schreibzugriffe auf den beschädigten Datenträger.
Wenn auch das nicht mehr funktioniert, kann man sich nur noch an spezialisierte Firmen wenden. Diese können in Reinräumen (staubfreie Labors) auch Speichermedien wie Festplatten und Magnetbänder zerlegen und danach die Daten rekonstruieren. Das lohnt sich aber nur, wenn die Daten sehr wichtig und nicht anders zu ersetzen sind. Der Vorgang der Datenwiederherstellung wird dann sehr aufwendig und damit auch teuer.
Weblinks
- [http://www.bsi.de Offizielle Homepage des BSI]
- [http://www.pcreview.co.uk/article-4549.php Artikel über Datenwiederherstellung im PC Review Magazin (englisch)]
- [http://dmoz.org/Computers/Hardware/Storage/Data_Recovery/ Software zur Datenwiederherstellung im Open Directory Project]
- [http://www.softguide.de/it-services/datensicherung_datenrettung.htm Seriöse Anbieter von Datenrettungsservice]
Kategorie:Speichertechnologie
Kategorie:Datenschutz
Kategorie:IT-Sicherheit
Kategorie:IT-Management
ms:Pulih data
DatenbankEine Datenbank ist die elektronische Form eines Karteikastens bzw. eines Systems zusammengehöriger Karteikästen. Es handelt sich um eine Sammlung von Daten, die aus der Sicht des Benutzers zusammengehören, z. B. eine Personaldatenbank oder eine Lagerinventardatenbank.
Die Datenbank wird üblicherweise von einem Datenbankverwaltungssystem (engl. database management system, DBMS) verwaltet. Ein DBMS zusammen mit einer oder mehreren Datenbanken nennt man Datenbanksystem (DBS). Es gibt hierarchische, relationale (RDBMS), multidimensionale und objektorientierte Datenbanken.
In der Praxis wird der Begriff "Datenbank" mehrdeutig verwendet. Er kann sowohl die gesamte Anwendung (DBMS, zugehörige Programme und Dateninhalte) im Sinne einer "Daten-Bank" bezeichnen (engl. databank), als auch den reinen Datenspeicher als technische Daten-Basis (engl. database). Ferner verwenden die einzelnen DBMS-Hersteller geringfügig voneinander abweichende Begrifflichkeiten dafür, was man genau unter einer Datenbank versteht: entweder alle Daten, die von einer DBMS-Installation bzw. -Instanz verwaltet werden, oder nur die jeweils inhaltlich zusammengehörigen Daten.
Das grundlegende Element einer Datenbank ist der Datensatz. Jeder Datensatz besteht wiederum aus einer festen Anzahl von Datenelementen, den Attributen. Vergleicht man eine Datenbank mit einem Karteikasten-System, so entspricht ein Datensatz einer Karteikarte. Die Attribute sind dann Einträge innerhalb der Karte.
Datensätze werden in den meisten Datenbanken in einer Tabelle gespeichert. Mehrere Tabellen können wiederum in einer inhaltlichen Beziehung zueinander stehen. So kann eine Tabelle, die Kundendaten speichert, in Zusammenhang mit einer Tabelle von gekauften Produkten stehen. Eine Firma kann so ermitteln, welcher Kunde welche Produkte gekauft hat.
Verwendung von Datenbanken
Datenbanken sind heute ein zentraler Bestandteil fast jedes Softwaresystems. Sie verwalten Lagerbestände eines Unternehmens, Patienteninformationen in Krankenhäusern, Telefondaten in der Auskunft, Finanztransaktionen in der Bank. Damit stellen sie einen kritischen Teil jedes Unternehmens und jeder Behörde dar. Von der Verfügbarkeit, Vollständigkeit und Richtigkeit der Daten hängt die Aktionsfähigkeit eines Unternehmens ab. Die vollständige Automatisierung von Lagerbeständen macht eine manuelle Verwaltung heute unmöglich. Der Verlust einer Lagerdatenbank kann somit das Unternehmen in sehr kurzer Zeit finanziell ruinieren, da georderte Produkte nicht ausgeliefert werden können oder gar die Aufträge selbst verloren sind. Die Datensicherheit ist daher ein wichtiger und gesetzlich vorgeschriebener Bestandteil der IT eines Unternehmens oder einer Behörde.
Datenbankmanagementsysteme übernehmen somit eine wichtige Funktion eines Softwaresystems. Sie garantieren den schnellen und dauerhaften Zugriff auf die Daten sowie den Schutz gegen unerlaubten Zugriff und Systemfehler. Aus diesem Grunde sind Datenbankmanagementsysteme selbst hochkomplexe Softwaresysteme.
Beispiel von Datenbanktabellen
Die folgenden beiden Tabellen könnten so bei einem Händler verwendet werden:
Beide Tabellen stehen in einer Beziehung zu einander. Jeder Titel gehört zu einer in CD gespeicherten CD. Die Zuordnung geschieht dabei über das Attribut CD_ID.
Geschichte
Die erste Generation von Datenbanken bestand aus Lochkarten. Ein Nachteil war, dass die Lochkarten hintereinander (sequentiell) gelesen werden mussten, was zur Folge hatte, dass alle Informationen, die vor der gesuchten standen, ausgelesen und verarbeitet werden mussten. Eine ähnliche Verarbeitungsform hatten Magnetbänder, auf denen nur sequentielle Daten gespeichert werden konnten.
Die zweite Generation der Datenbanken wurde ca. 1960 entwickelt. Zu diesem Zeitpunkt begann man, die Daten auf Festplatten zu halten. Deren Eigenschaft des wahlfreien Zugriffs führte zu einem erheblichen Performance-Vorteil. Weiterhin erlaubte der Mehrbenutzerbetrieb vielen Benutzern den gleichzeitigen Zugriff auf die Datenbank.
Zwischen 1965 und 1975 wurde die dritte Generation der Datenbanken entwickelt. In dieser Zeit entstanden das Hierarchische Datenbankmodell und die Netzwerkdatenbank.
Im Gegensatz zu hierarchischen Datenbanken können in Netzwerkdatenbanken die Datensätze auf mehreren Wegen verknüpft sein und nicht nur entlang einfacher Eltern-Kind-Beziehungen. Eine heute noch häufig eingesetzte Netzwerkdatenbank ist IDMS der Firma Computer Associates.
Einen wesentlichen Fortschritt erzielte in den 1960er und 1970er Jahren Edgar F. Codd mit seiner Forschungsarbeit am IBM Almaden Research Center in San Jose. Codd entwickelte die Grundlagen der ersten experimentellen relationalen Datenbank System R. Die Firma Oracle entwickelte das erste kommerzielle Datenbankmanagementsystem.
Relationale Datenbanken sind heute am weitesten verbreitet. In ihnen werden Daten (Texte, Zahlen und Binärdaten) in Tabellen abgespeichert. Die Bezeichnung relational entstammt dem zugrunde liegenden mathematischen Modell, auf dem diese Datenbanken beruhen, der relationalen Algebra.
Eine neuere Entwicklung sind objektorientierte Datenbanken (OODBMS). Bei relationalen Datenbanken geht es zuerst um die Struktur, in der die jeweiligen Daten gespeichert werden sollen. Objektorientierte Datenbanken dagegen folgen der objektorientierten Programmiermethode, d. h. es kommen erst die Daten, an denen sich die Datenbankstruktur dann orientiert. Eine hervorgehobene Eigenschaft von OODBMS ist die Möglichkeit, die Objekte der OO-Programmierungswelt mit wenig Programmieraufwand persistent zu machen, also zwischen Programmläufen abzuspeichern. Ein Beispiel für ein objektorientiertes Datenbankverwaltungssystem ist Caché von Intersystems.
Datenbankmodelle
Es gibt verschiedene Typen von Datenbanken. Im einfachsten Falle kann eine einfache Liste von Datensätzen eine Datenbank sein. Solche Daten werden als zeichenseparierte Datendatei (engl.: comma-separated value file oder kurz CSV file) bezeichnet. Dabei wird jeder Datensatz in einer Zeile gespeichert. Jede Zeile enthält die Attribute, die meist durch Kommata, oft aber auch (dem Namen widersprechend) Tabulatoren getrennt werden.
Diese Vorgehensweise hat jedoch eine Reihe von schwerwiegenden Nachteilen. So ist zum Beispiel nicht vorhersehbar, was beim gleichzeitigen Zugriff mehrerer Benutzer auf diese Datei geschieht. Ausserdem gestaltet sich die Suche in den Daten als sehr aufwändig und muss immer wieder aufs neue erfunden werden. Wird die Datei sehr gross, so wirkt sich vor allem die mangelnde Fähigkeit zur Erstellung eines Indexes negativ auf die Ausführungsgeschwindigkeit aus. Die Datei wird stets mit einer linearen Suche komplett gelesen.
Zu diesem Zwecke wurden Datenbank-Management-Systeme (DBMS) entwickelt, deren Aufgabe die Lösung aller Probleme der Datenverwaltung ist. Hierzu wurden verschiedene Konzepte entwickelt. Die wichtigsten sind:
- Relationalen Datenbankmodell (RDBMS)
- Objektorientiertes Datenbankmodell
- XML-Datenbankmodell
Weiterhin gibt es einige weniger gebräuchliche Sonderfälle:
- Deduktive Datenbanken
- Multidimensionale Datenbanken
- Indexsequentielle Datenbanken (ISAM)
- Hierarchisches Datenbankmodell
- Netzwerkdatenbankmodell
- Verteiltes Datenbankmanagementsystem
- Postrelationales Datenbankmodell (Caché)
- Dokumentorientiertes Datenbankmodell (Lotus Notes)
Siehe auch
- Datenbanksysteme, alphabetische Liste
- Datenbankanwendung
- Informationssystem
- Datenbankmodell/Datenmodell bzw. ER-Modell
- Normalisierung (Datenbank)
- Tuning (Datenbank)
Literatur
- Ramez Elmasri, Shamkant B. Navathe: Grundlagen von Datenbanksystemen, Pearson Studium, ISBN 3-8273-7021-3
- Tobias Eggendorfer: Datenbanksysteme für Wirtschaftsinformatiker - Eine Einführung, Books on Demand, ISBN 3-8334-2493-1
- Helmut Eirund, Ullrich Kohl: Datenbanken, leicht gemacht. Ein Arbeitsbuch für Nicht-Informatiker, Teubner Verlag, ISBN 3-519-02644-9
- Alfons Kemper, André Eickler: Datenbanksysteme, Oldenbourg Verlag, ISBN 3-486-25706-4
- Gottfried Vossen: Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme, Oldenbourg Verlag, ISBN 3-486-25339-5
- Andreas Heuer, Gunter Saake: Datenbanken: Konzepte und Sprachen, MITP Verlag, ISBN 3-8266-0619-1
- Andreas Heuer, Gunter Saake, Kai-Uwe Sattler: Datenbanken: Implementierungstechniken, MITP Verlag, ISBN 3-8266-1438-0
- Carl A. Zehnder: Informationssysteme und Datenbanken, VDF Hochschulverlag, ISBN 3-7281-3002-8
- Markus Schneider: Implementierungskonzepte für Datenbanksysteme, Springer, ISBN 3-540-41962-4
- Josef L. Staud: Datenmodellierung und Datenbankentwurf - Ein Vergleich aktueller Methoden, Springer, ISBN 3-540-20577-2
- Matthias Schubert: Datenbanken - Theorie, Entwurf und Programmierung relationaler Datenbanken, Teubner, ISBN 3-519-00505-0
- DBLP: Bibliographisches Verzeichnis mit dem Schwerpunkt Datenbanksysteme und Logik Programmierung.
- Rolland, F. D.: Datenbanksysteme im Klartext, Pearson Studium, ISBN 3-8273-7066-3
Weblinks
- [http://www.kreissl.info/diggs/db_inhalt.php Einführung in Datenbankmanagementsysteme - Online Tutorial]
- [http://itse-guide.de/artikel/1 Grundlagen Datenbanken]
- [http://www.madeasy.de/2/datbank.htm Datenbanken - Das Wichtigste]
- [http://www.meddb.info/ Medizinische und Molekularbiologische Datenbanken]
- [http://dbwiki.de/ Datenbank-Entwickler Wiki]
- [http://opendb.de/ Portal zu Open Source Datenbanken]
ja:データベース
ko:데이터베이스
th:ฐานข้อมูล
RAID
Ein RAID-System dient zur Organisation mehrerer physikalischer Festplatten eines Computers zu einem besonders leistungsfähigen logischen Laufwerk.
RAID war ursprünglich die Abkürzung für Redundant Array of Inexpensive Disks (Redundante Ansammlung preiswerter Festplatten). Heute wird sie auch oft mit Redundant Array of Independent Disks (Redundante Ansammlung unabhängiger Festplatten) gedeutet, was geringfügig der ursprünglichen Bedeutung widerspricht.
Der Betrieb eines RAID-System setzt mindestens zwei Festplatten voraus. Die Festplatten werden gemeinsam betrieben und bilden einen Verbund, der unter mindestens einem Aspekt betrachtet leistungsfähiger ist als die einzelnen Festplatten. Mit RAID Systemen kann man folgende Vorteile erreichen:
- Erhöhung der Datensicherheit (Redundanz)
- Steigerung der Transferraten (Performance)
- Aufbau großer logischer Laufwerke
- Austausch von Festplatten und Erhöhung der Speicherkapazität während des Systembetriebes
- Kostenreduktion durch Einsatz mehrerer preiswerter Festplatten
- schnelle Steigerung der Systemleistungsfähigkeit
Die genaue Art des Zusammenwirkens der Festplatten wird durch den RAID-Level spezifiziert. Die gebräuchlichsten RAID-Level sind RAID 0, RAID 1 und RAID 5. Sie werden unten beschrieben.
Aus Sicht des Benutzers oder eines Anwendungsprogramms unterscheidet sich ein logisches RAID Laufwerk nicht von einer einzelnen Festplatte.
Aufbau und Anschluss - Hardware RAID, Software RAID
Hardware-RAID
Von Hardware-RAID spricht man, wenn das Zusammenwirken der Festplatten von einem speziell dafür entwickelten Hardware-Baustein, dem RAID-Controller, organisiert wird.
Der Hardware-RAID-Controller befindet sich physikalisch in der Nähe der Festplatten. Er kann im Gehäuse des Computers enthalten sein. Häufiger befindet er sich aber in einem eigenen Gehäuse, einem Storage Array, in dem auch die Festplatten untergebracht sind. Vermehrt werden in den letzten Jahren auch RAID-Controller auf Mainboards für den Heimcomputer- bzw. Personal Computer-Bereich verbaut. Üblicherweise sind diese häufig auf RAID 0 und RAID 1 beschränkt.
Um die Karten im Consumer-Bereich so erschwinglich wie möglich zu machen, überlässt man hier jedoch oft die RAID-Logic der CPU, was sie dann noch schlechter aussehen lässt als eine echte Software-RAID-Lösung. Ebenfalls mit dem Nachteil, an den Controller gebunden zu sein und bei einer Fehlfunktion desselben alle Daten mitzuverlieren. Diese Controller (hier ähnlich wie Win-Modems) werden im Linux-Jargon oft auch als Fake-Raid bezeichnet.
Software-RAID
Von Software-RAID spricht man, wenn das Zusammenwirken der Festplatten komplett softwareseitig organisiert wird; etwa können viele moderne Betriebssysteme, wie Microsoft Windows XP oder Linux, so einige der gängigsten RAID-Level zur Verfügung stellen. Die einzelnen Festplatten sind in diesem Fall über einfache Festplattencontroller am Computer angeschlossen.
Der Vorteil von Software-RAID ist die kostengünstige Einrichtung. Allerdings kann die Abhängigkeit von einem bestimmten Betriebssystem bzw. einer bestimmten Plattform auch ein Nachteil sein, und nicht zuletzt wird der Hauptprozessor (CPU) des Computers bei Festplattenzugriffen relativ stark belastet.
Die betreffende Softwarekomponente wird als Volume Management Software bezeichnet.
Anschluss der Festplatten am Computer
Die Festplatten können auf verschiedene Arten am Computer angeschlossen sein. Üblich sind die Schnittstellen SCSI, ATA/ATAPI und Serial ATA.
Geschichte
1987 veröffentlichten D. A. Patterson, G. Gibson und R. H. Katz von der University of California, Berkeley, USA einen Vorschlag, um die langsamen Plattenzugriffe zu beschleunigen und die MTBF (Mean time between failures) zu erhöhen. Dazu sollten die Daten auf vielen kleineren (billigeren) Platten anstatt auf wenigen großen (teuren) abgelegt werden. Deshalb hieß die frühere Schreibweise auch "Arrays of Inexpensive Disks" (heute Independent), als Gegenzug zu den damaligen SLEDs (Single Large Expensive Disk). Die Varianten Raid-0 und Raid-6 wurden erst später von der Industrie geprägt. Seit 1992 erfolgt eine Standardisierung durch das RAB (RAID Advisory Board), bestehend aus etwa 50 Herstellern.
Die gebräuchlichen RAID-Level im Einzelnen
RAID 0: Striping - Beschleunigung ohne Redundanz
1992
RAID 0 bietet gesteigerte Transferraten, indem mehrere Festplatten zusammengeschlossen und Schreiboperationen auf allen parallel durchgeführt werden (engl. striping, was bedeutet "in Streifen zerlegen", abgeleitet von stripe - der "Streifen"). Die Performance-Steigerung (insbesondere bei sequentiellen Zugriffen) beruht darauf, dass die zu schreibenden Daten zunächst auf die Caches der verschiedenen Platten verteilt werden und jede einzelne Platte so weniger zu tun hat. Die Größe der Datenblöcke wird als striping-Granularität bezeichnet. Umgekehrt wird auch der Lesevorgang beschleunigt. Fällt jedoch eine der Festplatten durch einen Defekt aus, kann der RAID-Controller ohne deren Teildaten die ursprüngliche Datei nicht mehr rekonstruieren. Streng genommen ist dies gar kein RAID, da es keine Redundanz gibt.
Die Wahrscheinlichkeit von Datenverlust ist bei RAID 0 mit zwei Festplatten fast doppelt so groß wie bei einem gewöhnlichen Computer mit nur einer Festplatte, da sich die Defektwahrscheinlichkeit entsprechend der Festplattenanzahl vervielfacht, der Defekt einer einzigen Festplatte aber schon zum Totalausfall führt. RAID 0 ist daher nur in Computersystemen zu empfehlen, bei denen Datensicherheit kaum von Bedeutung ist.
RAID 1: Mirroring - Spiegelung
Redundanz
Ein RAID 1 Array besteht aus zwei oder mehr Festplatten, die dieselben Daten enthalten (engl. mirroring oder duplexing, s.u.). In der Regel sind das zwei Festplatten, es ist aber auch möglich, mehr im Array zu haben. RAID 1 bietet die volle Redundanz der gespeicherten Daten, während die Kapazität des Arrays höchstens so groß ist, wie die kleinste beteiligte Festplatte.
Fällt eine der gespiegelten Platten aus, können die anderen weiterhin die Daten liefern. Besonders für Realtime-Anwendungen ist das unverzichtbar. RAID 1 bietet eine hohe Ausfallsicherheit. Zum Totalverlust der Daten führt erst der Ausfall aller Platten.
Wenn alle Festplatten am selben Controller angeschlossen sind, wird dies als Mirroring bezeichnet. Es kann immer nur ein Zugriff pro Controller ausgeführt werden, was zur Folge hat, dass die Redundanz eines Sektors nicht sofort gegeben ist, sondern erst, nachdem auf mindestens zwei Festplatten geschrieben wurde. Ein Anschluss der Festplatten an verschiedenen Controllern wird als Duplexing bezeichnet.
RAID 1 kann eine erhöhte Performance beim Lesen bewirken, weil Daten von einer Festplatte angefordert werden können, während die anderen noch beschäftigt sind.
RAID 5: Performance + Parität
Redundanz
RAID 5 bietet sowohl gesteigerte Performance (wobei die Leistung beim Lesen größer ist als beim Schreiben) als auch Redundanz und ist damit die beliebteste RAID-Variante. Darüber hinaus ist es die kostengünstigste Möglichkeit, Daten auf mehr als 2 Festplatten mit Redundanz zu speichern. Es werden mindestens 3 Platten benötigt.
Bei n Platten sind (n-1)/n der Gesamtkapazität nutzbar; das restliche 1/n wird für die Paritätsdaten (Redundanz) benötigt. Zum Vergleich: bei RAID 1 lassen sich nur die Hälfte der realen Kapazität verwenden. Folglich steigt die Nutz-Kapazität eines RAID 5 Arrays mit der Anzahl der verwendeten Festplatten. Mit 6 Platten zu 120GB kann so ein Array mit theoretischem Nutzwert von 600GB erstellt werden, wohingegen mit 3 Platten zu 250GB nur 500GB nutzbar sind, obwohl deren summierte Einzelkapazität höher wäre.
Die Nutzdaten werden wie bei RAID 0 auf alle Festplatten verteilt. Die Paritätsinformationen werden jedoch nicht wie bei RAID 4 auf einer Platte konzentriert, sondern ebenfalls verteilt. Die Berechnung der Parität erfordert leistungsfähige RAID-Controller und führt beim Schreiben zu leichter bis erheblicher Verminderung der Datentransferrate im Vergleich zu RAID 0. Da die Paritätsinformationen beim Lesen nicht benötigt werden, stehen alle Platten zum parallelen Zugriff zur Verfügung.
Bei RAID 5 ist die Datensicherheit des Arrays beim Ausfall von maximal einer Platte gewährleistet. Allerdings lässt nach Ausfall einer Festplatte oder während des Rebuilds auf die Hotspare-Platte (bzw. nach Austausch der defekten Festplatte) die Performance deutlich nach. Der Rebuild dauert länger als bei RAID 1, da bei RAID 5 zusätzlich Parity Informationen rekonstruiert werden müssen. Je mehr Festplatten in einem RAID 5 Verbund sind, desto länger dauert der Rebuild bzw. desto schlechter ist die Performance während eines Defekts einer Festplatte.
Weniger gebräuchliche oder bedeutungslos gewordene RAID Level
NRAID: Festplattenverbund
Bei NRAID werden – wie bei RAID 0 – mehrere Festplatten zusammengeschlossen. Im Gegensatz zu RAID 0 bietet NRAID aber keinen Performance-Gewinn. Dafür kann man Festplatten unterschiedlicher Größe ohne Speicherverlust miteinander kombinieren (Beispiel: eine 10 GB-Festplatte und eine 30 GB-Festplatte ergeben in einem NRAID eine virtuelle 40 GB Festplatte, während in einem RAID 0 nur 20 GB (2 x 10 GB) angesprochen werden könnten). Der Ausfall einer Platte führt zu Datenverlust, jedoch wäre es möglich einen Teil der Daten wieder zu restaurieren, solange sie komplett auf der funktionierenden Platte liegen. NRAID ist weder einer der nummerierten RAID-Levels, noch bietet es Redundanz. Man kann es aber durchaus als entfernten Verwandten von RAID 0 betrachten. NRAID macht aus mehreren Festplatten eine einzige Partition einer, die der Summe der Kapazitäten aller verwendeten Platten entspricht. Dies ist auch als linear mode bekannt. Heutzutage sind Controller, die mit der Eigenschaft JBOD verkauft werden, in der Lage, dies zu tun.
RAID 2
RAID 2 spielt in der Praxis keine Rolle mehr. Das Verfahren wurde nur bei Großrechnern verwendet. Die Daten werden hierbei in Bitfolgen fester Größe zerlegt und mittels eines Hamming-Codes auf größere Bitfolgen abgebildet (8 Bit für Daten noch 2 Bit für den ECC-Code). Die einzelnen Bits des Hamming-Codeworts werden dann über einzelne Platten aufgeteilt, was prinzipiell einen hohen Durchsatz erlaubt. Ein Nachteil ist jedoch, dass die Anzahl der Platten ein Vielfaches der Hamming-Codewortlänge sein muss.
Ein RAID 2 Verbund benötigt mindestens zehn Festplatten.
RAID 3: Striping mit Paritätsinformationen auf separater Festplatte
RAID 3 ist der Vorläufer des RAID 5. Im RAID 3 wird die Redundanz auf einer zusätzlichen Festplatte gespeichert. Als Redundanz bezeichnet man hier die bitweise Addition der einzelnen Bits der anderen Festplatten. Die bitweise Addition berechnet Summen von Einzelbits, die den Wert 0 und 1 enthalten können, und befolgt die Rechenregeln des mathematischen Zahlkörpers, welcher nur die Elemente 0 und 1 enthält, und bei dem die folgenden Rechenregeln gelten: 1+1=0, 0+1=1, 1+0=1, 0+0=0, und Subtraktion = Addition. In der Mikroelektronik ist dies identisch mit der XOR-Verknüpfung.
Der Gewinn durch ein RAID 3 ist folgender: Angenommen der RAID 3-Verbund besteht aus n datentragenden Festplatten und einer dedizierten Parity-Disk mit Hausnummer n+1. Bei einem Ausfall einer der ersten n Festplatten werden, nach Austausch dieser Festplatte, alle Daten auf die neue n-te Festplatte zurück synchronisiert, ausgehend von den Parity-Informationen der n+1-ten Festplatte und den übrigen, unversehrten n-1 Daten-Festplatten. Der Ausfall der Parity-Disk selbst wird, nach Ersetzen der Festplatte, repariert durch einfache Neuberechnung der Parity-Bits.
RAID 3 ist inzwischen vom Markt verschwunden und wurde weitgehend durch RAID 5 ersetzt, bei dem die Parität gleichmäßig über alle Disks verteilt wird. Die dedizierte Paritätenfestplatte stellte einen Flaschenhals dar (performance bottleneck). Vor dem Übergang zu RAID 5 wurde RAID 3 zudem partiell durch RAID 4 verbessert, bei dem Ein-/Ausgabe-Operationen mit größeren Blockgrößen aus Performance-Gründen standardisiert wurden.
Zusätzlich sei hier bemerkt, dass ein RAID 3-Verbund aus lediglich zwei Festplatten identisch ist mit einem RAID 1 aus zwei Festplatten - per Definition.
RAID 4
Es werden ebenfalls Paritätsinformationen berechnet, die auf eine dedizierte Festplatte geschrieben werden. Allerdings sind die Einheiten, die geschrieben werden, größere Chunks und nicht einzelne Bytes, was die Gemeinsamkeit zu RAID 5 ausmacht.
Ein Vorteil von RAID 4 besteht darin, dass bei einem Ausfall einer Datenplatte eine "vorgenullte" Datenplatte eingesetzt werden kann. Dadurch wird eine zeit- und rechenintensive Wiederherstellung vermieden und das RAID-4-System kann ohne Einschränkungen weiterbetrieben werden.
Ein Nachteil bei RAID 4 besteht darin, dass die Parity-Platte bei allen Schreib- und Leseoperationen beteiligt ist. Dadurch ist die maximal mögliche Performance durch die Performance der Parity-Disk begrenzt. Da bei jeder Operation immer eine der Daten-Disks und die Parity-Disk verwendet werden, fällt die Parity-Disk häufiger aus.
Wegen der fest definierten Paritätsplatte wird statt RAID 4 fast immer RAID 5 bevorzugt.
Eine Ausnahme bildet ein Systemdesign, bei dem die Lese- und Schreiboperationen auf ein NVRAM erfolgen. Das NVRAM bildet einen Puffer, der die Performance kurzfristig erhöht und die Lese- und Schreiboperationen sammelt und in Abschnitten auf das RAID 4 Plattensystem schreibt. Dadurch werden die Nachteile von RAID 4 vermieden.
RAID 6: Redundanz über zwei zusätzliche Festplatten
RAID 6 funktioniert ähnlich wie RAID 5, verkraftet aber den Ausfall von bis zu zwei Festplatten. Hier werden nicht ein, sondern zwei Fehlerkorrekturwerte berechnet und so über die Platten verteilt, dass Daten und Paritäten blockweise auf unterschiedlichen Platten liegen. Das bedeutet eine Anzahl von n+2 Festplatten brutto für einen Dateninhalt von n Festplatten netto, was allerdings schon bei wenigen Netto-Festplatten eine Kosten-Ersparnis gegenüber einfacher Spiegelung (siehe RAID 1) darstellt. Jedoch ist der Rechenaufwand bei den zugrundeliegenden XOR-Prozessen erheblich höher als bei RAID 5. Bei RAID 5 werden für ein Parity-Bit die Daten aus einer Daten-Zeile addiert (und bei erforderlicher Resynchronisation die Daten aus einer Daten-Zeile per Addition zurück resynchronisiert). Dagegen muss bei RAID 6 das Parity-Bit über mehrere Daten-Zeilen berechnet werden - die Resynchronisation, insbesondere bei zwei ausgefallen Festplatten, erfordert einen Kalkül über Matrizen und Umkehrmatrizen aus der linearen Algebra.
Ein RAID 6 Verbund benötigt mindestens vier Festplatten.
RAID 7
RAID 7 ist eine kaum verwendete Variante und basiert auf RAID 5. Allerdings läuft im Controller ein lokales Echtzeitbetriebssystem, welches die Lese- und Schreiboperationen steuert. RAID 7 unterstützt zusätzlich die Verwendung mehrerer Paritätsinformationen gemäß RAID 6.
RAIDn
Bei RAIDn handelt es sich um eine Entwicklung der Inostor Corp., einer Tochter von Tandberg Data. RAIDn hebt die bisher starre Definition der RAID Level auf.
Dieses RAID wird definiert durch die Gesamtzahl der Festplatten (n) sowie die Anzahl der Festplatten, die ohne Datenverlust ausfallen dürfen (m). Als Schreibweise hat sich RAID(n,m) oder RAID n+m eingebürgert.
Aus diesen Definitionen können die Kenndaten des RAID wie folgt berechnet werden:
- Lesegeschwindigkeit = n - Lesegeschwindigkeit der Einzelplatte
- Schreibgeschwindigkeit = (n - m) - Schreibgeschwindigkeit der Einzelplatte
- Kapazität = (n - m) - Kapazität der Einzelplatte
Einige spezielle Definitionen wurden wie folgt festgelegt:
- m = 0 entspricht RAID 0
- m = 1 entspricht RAID 5
- m = n/2 entspricht RAID 10
Kombinations-RAIDS (RAID 01, 10, 03, 30, 15, 51, 55 ...)
Obschon die RAID-Level 0, 1 und 5 die weitaus größte Verwendung finden, existieren nebst den Levels 0 bis 7 noch "RAID-Kombinationen". Hier wird ein RAID zu einem zweiten RAID nochmal zusammengefasst. Beispielsweise können mehrere Platten zu einem parallelen RAID 0 zusammengefasst werden, und aus mehreren dieser RAID-0-Arrays z. B. ein RAID-5-Array gebildet werden. Man bezeichnet diese Kombinationen dann z. B. als RAID 05 (0+5). Umgekehrt würde ein Zusammenschluss von mehreren RAID-5-Arrays zu einem RAID-0-Array als RAID 50 (oder RAID 5+0) bezeichnet werden. Auch RAID 1 und RAID 5 Kombinationen sind möglich (RAID 15 und RAID 51), die beliebtesten Kombinationen sind allerdings das RAID 01, bei dem je zwei Platten parallel arbeiten und dabei von zwei anderen Platten gespiegelt werden (insgesamt 4 Platten), oder RAID 10, bei dem zwei Platten gespiegelt werden, und dabei um zwei weitere gespiegelte Platten zu einem Ganzen ergänzt werden.
RAID 01
Ein RAID 01 Verbund ist ein RAID 1 von mehreren RAID 0. Es werden dabei die Eigenschaften der beiden RAIDs kombiniert: Sicherheit und gesteigerte Performance.
Ein RAID 01 Verbund benötigt mindestens vier Festplatten.
RAID 10
Ein RAID 10 Verbund ist ein RAID 0 über mehrere RAID 1. Es werden dabei die Eigenschaften der beiden RAIDs kombiniert: Sicherheit und gesteigerte Performance.
Ein RAID 10 Verbund benötigt mindestens vier Festplatten.
RAID 10 bietet gegenüber RAID 01 eine bessere Ausfallsicherheit und schnellere Rekonstruktion nach einem Plattenausfall, da nur ein Teil der Daten rekonstruiert werden muss.
RAID 1.5
Die Firma Highpoint entwickelte zusätzlich noch das RAID 1.5, nicht zu verwechseln mit RAID 15. Gedacht für Privatanwender kombiniert es die Vorteile von RAID 0 und RAID 1 und sieht sich deshalb als eine Zwischenstufe der RAID-Levels 1 und 2, deswegen auch die Bezeichnungswahl mit Kommastelle. Hauptvorteil ist die gleichzeitige Steigerung der Sicherheit und Geschwindigkeit bei nur 2 Festplatten, was durch keinen anderen "echten" RAID-Level realisierbar wäre. Allerdings scheint auch diese Lösung in der Praxis eher untauglich zu sein.
Siehe auch: [http://www.de.tomshardware.com/storage/20030619].
RAID 03
Ein RAID 03 Verbund benötigt mindestens sechs Festplatten..
RAID 30
RAID 30 wurde ursprünglich von AMI entwickelt. Es stellt eine gestripte Variante von RAID 3 dar.
Ein RAID 30 Verbund benötigt mindestens sechs Festplatten.
RAID 05
Ein RAID 05 Verbund besteht aus einem RAID 5 Array, das aus mehreren gestripten RAID 0 besteht.
Ein RAID 05 Verbund benötigt mindestens sechs Festplatten.
Beispielsweise zwei Raid 0 Hardware Stripes über ein Raid 5 Block
findet kaum Verwendung, da der Performancegewinn im vergleich zu RAID 5 marginal ist.
RAID 50
Ein RAID 50 Verbund besteht aus einem RAID 0 Array, das aus mehreren gestripten RAID 5 besteht.
Ein RAID 50 Verbund benötigt mindestens sechs Festplatten.
Beispielsweise zwei RAID 5 Controller mit jeweils 3 Platten pro Controller zusammengeschaltet mit einem Software Stripe RAID 0. Sehr hohe Schreib/Lese Performance da die Rechenarbeit auf zwei XOR units verteilt wird.
Wird bei Datenbanken verwendet wo Redundanz und Schreibperformance im Vordergrund steht.
RAID 15
Das RAID 15 Array wird gebildet, indem man einen gestripten Satz mit Parität mit mehrfachen widergespiegelten Paaren als Bestandteile verwendet; sie ist im Konzept ähnlich wie RAID 10, außer dass das Striping mit einer Parität erfolgt.
Bei einem acht Festplatten RAID 15 können bis zu drei beliebige gleichzeitig ausfallen.
Ein RAID 15 Verbund benötigt mindestens sechs Festplatten.
Die Performance ist gut, aber nicht sehr hoch. Die Kosten sind mit den anderen RAID Systemen nicht direkt vergleichbar.
RAID 51
Der RAID 51 Verbund wird ähnlich wie RAID 15 gebildet, indem man die gesamte Reihe eines RAID 5 spiegelt und ist ähnlich zu RAID 01 ausgenommen beim Paritäts Schutz, dass die Sätze RAID 5 anstelle von RAID 0 sind.
Bei einem acht Festplatten RAID 51 können bis zu drei beliebige gleichzeitig ausfallen. Darüber hinaus können fünf Festplatten ausfallen solange keine aus dem gespiegelten RAID 5 Verbund betroffen sind.
Ein RAID 51 Verbund benötigt mindestens sechs Festplatten.
Die Performance ist gut, aber nicht sehr hoch. Die Kosten sind mit den anderen RAID Systemen nicht direkt vergleichbar.
RAID 55
Der RAID 55 Verbund wird ähnlich wie RAID 51 gebildet, indem mehrere RAID 5 Systeme zu einem RAID 5 zusammen geschaltet werden. Im Gegensatz zu RAID 51 ist der Overhead geringer und es ist möglich, schneller die Daten zu lesen.
Die Performance ist sehr gut, aber nicht sehr hoch. Die Kosten sind mit den anderen RAID Systemen nicht direkt vergleichbar.
Bei einem neun Festplatten RAID 55 können bis zu drei beliebige gleichzeitig ausfallen. Darüber hinaus können fünf Festplatten ausfallen.
Ein RAID 55 Verbund benötigt mindestens neun Festplatten.
Matrix RAID
In der Intel ICH6R-Southbridge ist seit etwa Mitte 2004 erstmals eine neue Technologie integriert, die als "Matrix-RAID" bezeichnet wird. Sie soll die Vorteile von RAID 0 und RAID 1 auf nur 2 Festplatten vereinen. Jede der beiden Platten wird vom Controller zu diesem Zweck in 2 Bereiche aufgeteilt. Ein Bereich wird dann auf die andere Festplatte gespiegelt, während im verbleibenden Bereich die Daten auf beide Platten aufgeteilt werden. Man kann dann z.B. im ersten Bereich sein "unwichtiges" Betriebssystem und Programme installieren, um von RAID 0 zu profitieren, während man im zweiten Bereich dann seine wichtigen Daten abspeichern kann, und auf die Redundanz von RAID 1 vertrauen kann. Im Falle eines Plattencrashes müsste man dann nur sein Betriebssystem und Programme neu aufspielen, während die wichtigen Daten im anderen Festplattenbereich erhalten bleiben. Ob sich diese Technologie in anbetracht der sinkenden Festplattenpreise gegen RAID 0+1 oder RAID 5 durchsetzen kann, bleibt abzuwarten. In jedem Fall stellt sie aber eine kostengünstige Alternativlösung, vor allem für Einsteiger, dar.
Andere Begriffe
JBOD
JBOD bedeutet Just a Bunch Of Disks, also Nur ein Bündel Platten.
Der Begriff wird verwendet in Abgrenzung zu RAID Systemen, um anzugeben, wenn Festplatten nicht im Verbund, sondern einzeln betrieben werden. Viele Hardware RAID Controller sind in der Lage, die angeschlossenen Festplatten dem Betriebssystem einzeln zu Verfügung zu stellen; die RAID Funktionen des Controllers werden dabei abgeschaltet und er arbeitet als einfacher Festplatten-Controller.
Ein JBOD kann auch unabhängig vom Controller eine irgendwie an den Computer angeschlossene Anzahl Festplatten bezeichnen. Mithilfe einer Volume Management Software kann ein solches JBOD zu einem Software-RAID zusammengeschaltet werden.
Stripe Size
Stripe size bezeichnet die Größe, des aus einem oder mehreren Datenblöcken bestehenden zusammenhängenden Datenbereichs als kleinste adressierbare Einheit zur Verteilung von Daten auf RAID-Speichermedien. Bei einer Vergrößerung der Stripe-Size wächst der maximale Durchsatz, gleichzeitig erhöht sich aber die Zugriffszeit. Auch Striping-Granularität. Heute üblich sind Stripe-Größen von 64kbyte bis 256kbyte.
Hot Swapping
Hot Swapping ist die Möglichkeit, Festplatten im laufenden Betrieb austauschen zu können. Dazu muss der Bus-Controller Hot Plugging unterstützen (i.d.R. nur SCSI oder SATA).
Hot-Spare-Laufwerk
Das Hot-Spare-Laufwerk ist ein unbenutztes Reservelaufwerk. Fällt ein Laufwerk innerhalb des RAID-Verbundes aus, wird es durch das Reservelaufwerk ersetzt. Dadurch bleibt die Redundanz erhalten.
RAIDIOS (RAID I/O Steering)
Offener Standard von Intel zur Verwendung der vorhandenen Anschlüsse. Es wird nur der fehlende IO-Controller (mit 0 Kanälen) nachgerüstet. Kostengünstige und ökonomische Variante.
Siehe auch
- Portal:Informatik
- Storage Area Network
Weblinks
- [http://www.itse-guide.de/artikel/10 Weiterführende Informationen zu den RAID-Level]
- [http://faq.storagereview.com/SingleDriveVsRaid0 Vergleich: Single vs. Raid0] (engl.)
- [http://www.tecchannel.de/hardware/708/index.html RAID Informationen von tecchannel.de]
- [http://www-2.cs.cmu.edu/~garth/RAIDpaper/Patterson88.pdf Original-Paper von Patterson, Gibson, Katz (engl.)]
- [http://www.storitback.de/service/raidlevel.html Vergleich der RAID-Level und weiteres.]
- [http://www.inostor.com/products/products_RAIDn_index.htm Informationen zum RAIDn von Inostor (engl.)]
Kategorie:Speichertechnologie
ja:RAID
Technischer DatenschutzMaßnahmen zum Technischen Datenschutz sind all solche, die unter Verwendung von Methoden zur Gewährleistung der Datensicherheit dem Datenschutz dienen.
Man geht von verschiedenen Angriffszenarien aus, denen 4 hauptsächliche Schutzmaßnahmen entgegengestellt werden:
- Zugangsschutz, die Verhinderung von Zugang zu Daten, welche auf einem Rechner gespeichert sind, sowohl lokal (Anmeldepflicht am Rechner) als auch für entfernte Systeme (Remote-Login). Eine Massnahme ist zum Beispiel ein MAC-Filter.
- Zugriffsschutz, Nutzung von Dateizugriffsrechten des Betriebssystems zu privilegierten Daten
- Zutrittsschutz, die (physische) Absicherung von Räumen, insbesondere Rechenzentren
All diese Maßnahmen sind nicht allein für sich wirksam, sondern wirken nur im Verbund. Externe Gefahren wie Social Engineering können nur durch ein Gesamtkonzept minimiert werden, welches Mitarbeiterschulungen, regelmäßige Kontrollen der Systeme und ähnliches beinhaltet.
Kategorie:Datenschutz (Technik)
BandlaufwerkBandlaufwerk oder Streamer ist die Bezeichnung für ein externes Speichermedium zur zusätzlichen und selteneren Speicherung von Daten, z. B. für Datensicherungen. Ein in einer Kassette (Cartridge) enthaltenes Kunststoffband mit magnetisierbarer Oberfläche ist das eigentliche Speichermedium. Die Kapazität von Bändern hängt vom verwendeten Standard (AIT, QIC, DAT, DCC, DDS, SLR, DLT, LTO, VXA, Video8 usw.) ab und reicht von ca. 120 MB bis hinein in den dreistelligen GB-Bereich.
Zu den Vorteilen derartiger Speichermedien gehören
- hohe Kapazität,
- schnelle Übertragung großer Datenmengen,
- lange Lebensdauer (bis zu 30 Jahre),
- geringer Platzbedarf.
Zu den Nachteilen gehören:
- Empfindlichkeit gegen Staub, Feuchtigkeit, magnetische Umwelteinflüsse.
- Sehr teuer.
- Neue Daten lassen sich nur an die alten Daten an einer ganz bestimmten Stelle auf dem Band speichern.
- Üblicherweise lange Zugriffszeit im Minutenbereich auf gewünschte Daten (Suchzeit; kein Direktzugriff).
Kategorie:Speicherlaufwerk
GenerationenprinzipDas Generationenprinzip, oder auch Großvater-Vater-Sohn-Prinzip genannt, stellt in der EDV eine Strategie der Datensicherung dar.
Oftmals kommt es vor, dass der Verlust von Daten erst Tage später bemerkt wird. So kann es unter Umständen sehr leicht geschehen, dass bei einer täglichen Sicherung die gewünschten Informationen gar nicht mehr auf der Sicherungskopie enthalten und somit unwiderruflich verloren sind. Aus diesem Grund ist man dazu übergegangen, Sicherungen verschiedener zeitlicher Abstufungen zu erstellen, um verschiedene Versionen für eine mögliche Wiederherstellung zur Verfügung zu haben.
Üblicherweise werden für eine Datensicherung nach dem Großvater-Vater-Sohn-Prinzip 22 Bänder benötigt. 13 dieser Bänder dienen als Monatssicherung (Großvater-Bänder). 5 weitere stellen die wöchentliche Sicherung über einen Monat sicher (Vater-Bänder) und die restlichen vier verbleibenden die Tagessicherung von Montag bis Donnerstag.
Der Ablauf stellt sich wie folgt dar (hierbei einmal angenommen, dass die Datensicherung auf ein Band passt):
Am Montag, zu Beginn eines Monats, erfolgt die erste Tagessicherung durch Band 1. Ebenso verfährt man mit Band 2-4 für die Tage Dienstag bis Donnerstag. Am Freitag erfolgt ebenfalls eine Tagessicherung auf Band 5. Dieses wird bis zum Ende des Monats nicht mehr beschrieben. Zu diesem Zeitpunkt existiert bereits eine komplette Wochensicherung mit Versionen zu jedem einzelnen Wochentag.
Mit Beginn der zweiten Woche legt man nun am Montag wieder Band 1 ein und überschreibt die darauf befindlichen Daten durch eine neue aktuelle Tagessicherung. Selbiges gilt wieder für die Bänder 2-4 für die Tage Dienstag bis Donnerstag. Am Freitag der zweiten Woche erfolgt die Tagessicherung jedoch auf einem neuen Band 6. Dieses wird ebenso wie Band 5 bis zum Ende des Monats nicht mehr genutzt. Mit Ende der zweiten Woche stellt die Datensicherung ein Backup der ersten Woche und tägliche Versionen der zweiten Woche zur Verfügung. Dieses Verfahren wiederholt sich auch für die kommenden zwei Wochen. Band 7 dient der Sicherung der dritten Woche usw.
Am letzten Freitag im Monat erfolgt eine Monatssicherung. Dieses Band wird für den Rest des Jahres nicht mehr zur Datensicherung genutzt. Die Bänder 1 bis 4 stehen auch im zweiten Monat der täglichen Sicherung von Montag - Donnerstag zur Verfügung. Auch die Bänder der Wochensicherung können nun wieder überschrieben werden, da der aktuelle Stand des ersten Monats auf ein separates Band gesichert wurde. Das Schema wiederholt sich für alle weiteren Monate. Nach Ablauf von 52 Wochen werden auch die letzten vier Wochen auf das 13. Großvater-Band gesichert. Zu diesem Zeitpunkt steht für jeden Monat eine Sicherung zur Verfügung. Für den letzten Monat kann sogar auf vier verschieden aktuelle Wochensicherungen zurückgegriffen werden und für die letzte Woche stehen die Tagessicherungen auf den Bändern 1 bis 4 zum Backup bereit.
Siehe auch
- Datensicherung
- Datensicherheit
- Datenschutz
- Speichermedium
Kategorie:Datenschutz (Technik)
Elektronische ArchivierungElektronische Archivierung steht für die unveränderbare, langzeitige Aufbewahrung elektronischer Information. Für die elektronische Archivierung werden in der Regel spezielle Archivsysteme eingesetzt. Der Begriff Elektronische Archivierung fasst unterschiedliche Komponenten zusammen, die im angloamerikanischen Sprachgebrauch separat als "Records Management", "Storage" und "Preservation" bezeichnet werden. Der wissenschaftliche Begriff eines Archivs und der Archivierung ist inhaltlich nicht identisch mit dem Begriff, der von der Dokumentenmanagementbranche verwendet wird.
Elektronische Archivierung
Der Begriff der elektronischen Archivierung wird sehr unterschiedlich benutzt. Während heute Unternehmen schon Aufbewahrungsfristen von 10 Jahren für handelsrechtlich und steuerlich relevante Daten und Dokumente als nur sehr schwierig umsetzbar sehen, wird in historischen Archiven von einer sicheren, geordneten und jederzeit zugreifbaren Aufbewahrung von Informationen mit Speicherzeiträumen von 100, 200 oder gar 300 Jahre gesprochen. Angesichts der sich ständig verändernden Technologien, immer neuer Software, Formate und Standards, eine gigantische Herausforderung für die Informationsgesellschaft.
Archivierung ist kein Selbstzweck. Die Aufbewahrung, Erschließung und Bereitstellung von Information ist eine unabdingbare Voraussetzung für die Arbeitsfähigkeit moderner Unternehmen und Verwaltungen. Mit dem exponentiellen Wachstum elektronischer Information wachsen die Probleme der langzeitigen Aufbewahrung obwohl moderne Softwaretechnologien wesentlich besser geeignet sind, Informationen zu verwalten, als dies herkömmlich mit Papier, Aktenordnern und Regalen möglich war. Immer mehr Information entsteht digital und die Ausgabe als Papier ist nur noch eine mögliche Repräsentation des ursprünglichen elektronischen Dokuments. Durch den Einsatz elektronischer Signaturen erhalten elektronische Dokumente den gleichen Rechtscharakter wie ursprünglich manuell unterzeichnete Schriftstücke. Solche digitalen Dokumente existieren rechtskräftig nur noch in elektronischer Form. Diese Entwicklungen zwingen inzwischen jedes Unternehmen sich verstärkt mit dem Thema elektronische Archivierung auseinander zu setzen.
Definitionen
In Deutschland haben sich für die elektronische Archivierung zwei Definitionen eingebürgert:
Elektronische Langzeitarchivierung
:Man spricht von Langzeitarchivierung, wenn die Informationen mindestens 10 Jahre und länger aufbewahrt und zugreifbar gehalten werden.
Der Begriff Langzeitarchivierung ist im Prinzip ein "weißer Schimmel", ein Pleonasmus, da Archivierung den Langzeitaspekt bereits impliziert.
Revisionssichere elektronische Archivierung
:Man spricht von revisionssicherer Archivierung, wenn die Archivsystemlösung den Anforderungen des Handelsgesetzbuches §§ 239, 257 HGB sowie der Abgabenordnung und den GoBS an die sichere, ordnungsgemäße Aufbewahrung von kaufmännischen Dokumenten entspricht und die Aufbewahrungsfristen von sechs bis zehn Jahren erfüllt.
Das HGB (HGB) und die Abgabenordnung (AO) geben hier die Grundlagen für die Speicherung, unabhängig ob in herkömmlichen Papierarchiven oder elektronischen Systemen, vor:
: - Ordnungsmäßigkeit
: - Vollständigkeit
: - Sicherheit des Gesamtverfahrens
: - Schutz vor Veränderung und Verfälschung
: - Sicherung vor Verlust
: - Nutzung nur durch Berechtigte
: - Einhaltung der Aufbewahrungsfristen
: - Dokumentation des Verfahrens
: - Nachvollziehbarkeit
: - Prüfbarkeit
Diese Kriterien sind fachlich definiert und bedürfen der Interpretation, wenn es um die Umsetzung in technischen Systemen geht.
Die Anforderungen sind in dem Code of Practice "Grundsätze der elektronischen Archivierung" des VOI Verband Organisations- und Informationssysteme e.V. 1996 zusammengefasst worden. Die Definition für revisionssichere Archivierung stammt von Ulrich Kampffmeyer bereits aus dem Jahr 1992. International ist die Funktionalität und der Umfang von elektronischen Archiven in der ISO Norm 17421 und der von Records Management Systemen in der ISO 15489 definiert. In Deutschland kann unter dem Aspekt der Sicherheit und Prüfung von Archivsystemen das BSI Grundschutzhandbuch (Kapitel 9.5) herangezogen werden.
Zehn Merksätze zur revisionssicheren Archivierung
Die folgenden 10 Merksätze zur revisionssicheren elektronischen Archivierung stammen von [http://www.voi.de VOI] Verband Organisations- und Informationssysteme e. V.:
# Jedes Dokument muss unveränderbar archiviert werden
# Es darf kein Dokument auf dem Weg ins Archiv oder im Archiv selbst verloren gehen
# Jedes Dokument muss mit geeigneten Retrievaltechniken wieder auffindbar sein
# Es muss genau das Dokument wiedergefunden werden, das gesucht worden ist
# Kein Dokument darf während seiner vorgesehenen Lebenszeit zerstört werden können
# Jedes Dokument muss in genau der gleichen Form, wie es erfasst wurde, wieder angezeigt und gedruckt werden können
# Jedes Dokument muss zeitnah wiedergefunden werden können
# Alle Aktionen im Archiv, die Veränderungen in der Organisation und Struktur bewirken, sind derart zu protokollieren, dass die Wiederherstellung des ursprünglichen Zustandes möglich ist
# Elektronische Archive sind so auszulegen, dass eine Migration auf neue Plattformen, Medien, Softwareversionen und Komponenten ohne Informationsverlust möglich ist
# Das System muss dem Anwender die Möglichkeit bieten, die gesetzlichen Bestimmungen (BDSG, HGB/AO etc.) sowie die betrieblichen Bestimmungen des Anwenders hinsichtlich Datensicherheit und Datenschutz über die Lebensdauer des Archivs sicherzustellen
Umsetzung der Anforderungen in elektronischen Archivsystemen
Zur Erfüllung dieser Vorgaben wurden Archivsysteme bestehend aus Datenbanken, Archivsoftware und Speichersystemen geschaffen, die in Deutschland von zahlreichen Herstellern und Systemintegratoren angeboten werden. Diese Systeme basieren meistens auf dem Ansatz über eine Referenzdatenbank mit den Verwaltungs- und Indexkriterien auf einen externen Speicher zu verweisen, in dem die Informationsobjekte gehalten werden. Diese sogenannte Referenz-Datenbank-Architektur war notwendig, um große Mengen von Informationen von den zwar schnellen aber teueren Online-Speichern in separate Archivspeicher auszulagern. Die Datenbank erlaubt über den Index dabei jederzeit das Dokument wieder zu finden und mit einem entsprechenden Anzeigeprogramm dem Anwender bereitzustellen. In den Frühzeiten dieser Technologie handelte es sich meistens um sehr geschlossene, eigenständige Systeme, die praktisch zu „Inseln“ in der IT-Landschaft führten. Heute gliedern sich Archivsysteme als nachgeordnete Dienste in die IT-Infrastruktur ein, werden direkt von Bürokommunikations- und Fachanwendungen bedient und stellen diesen Anwendungen auch die benötigten Informationen zur Verarbeitung und Anzeige wieder zur Verfügung. Für den Anwender ist es dabei unerheblich, wo die benötigte Information gespeichert ist, Archivspeichersysteme und die Speicherorte der Dokumente sind für ihn unerheblich. Die Diskussion um das „richtige“ Speichermedium für die elektronische Archivierung führen meistens nur die IT-Fachleute, Projektmitarbeiter und Rechtsabteilungen wenn es um die Auswahl und Einführung eines elektronischen Archivsystems geht.
Funktionale Anforderungen an ein elektronisches Archivsystem
Elektronische Archivsysteme zeichnen sich durch folgende eigenständige Merkmale aus:
: - programmgestützter, direkter Zugriff auf einzelne Informationsobjekte, landläufig auch Dokumente genannt, oder Informationskollektionen, z.B. Listen, Container mit mehreren Objekten etc.
: - datenbankgestütze Verwaltung der Informationsobjekte auf Basis von Metadaten und gegebenenfalls Volltexterschließung der Inhalte der archivierten Informationsobjekte
: - Unterstützung verschiedener Indizierungs- und Recherchestrategien, um auf die gesuchte Information direkt zugreifen zu können
: - Einheitliche und gemeinsame Speicherung beliebiger Informationsobjekte, vom gescannten Faksimile über Word-Dateien bis hin zu komplexen XML-Strukturen, Listen oder ganzen Datenbankinhalten
: - Verwaltung von Speichersystemen mit nur einmal beschreibbaren Medien einschließlich des Zugriffs auf Medien die sich nicht mehr im Speichersystem direkt befinden
: - Sicherstellung der Verfügbarkeit der gespeicherten Informationen über einen längeren Zeitraum, der Jahrzehnte betragen kann
: - Bereitstellung von Informationsobjekten unabhängig von der sie ursprünglich erzeugenden Anwendung auf verschiedenen Clienten und mit Übergabe an andere Programme
: - Unterstützung von „Klassen-Konzepten“ zur Vereinfachung der Erfassung durch Vererbung von Merkmalen und Strukturierung der Informationsbasis
: - Konverter zur Erzeugung von langfristig stabilen Archivformaten und Viewer zur Anzeige von Informationsobjekten, für die die ursprünglich erzeugende Anwendung nicht mehr zur Verfügung steht
: - Absicherung der gespeicherten Informationsobjekte gegen unberechtigten Zugriff und gegen Veränderbarkeit der gespeicherten Information
: - Übergreifende Verwaltung unterschiedlicher Speichersysteme, um z.B. durch Zwischenspeicher (Caches) schnellen Zugriff und zügige Bereitstellung der Informationen zu gewährleisten
: - Standardisierte Schnittstellen, um elektronische Archive als Dienste in beliebige Anwendungen integrieren zu können
: - Eigenständige Wiederherstellungsfunktionalität (Recovery), um inkonsistent gewordene oder gestörte Systeme aus sich heraus verlustfrei wieder aufbauen zu können
: - Sichere Protokollierung von allen Veränderungen an Strukturen und Informationsobjekten, die die Konsistenz und Wiederauffindbarkeit gefährden können und dokumentieren, wie die Informationen im Archivsystem verarbeitet wurden
: - Unterstützung von Standards für die spezielle Aufzeichnung von Informationen auf Speichern mit WORM-Verfahren, für gespeicherte Dokumente und für die Informationsobjekte beschreibende Metadaten um eine langfristige Verfügbarkeit und die Migrationssicherheit zu gewährleisten
: - Unterstützung von automatisierten, nachvollziehbaren und verlustfreien Migrationsverfahren
All diese Eigenschaften sollten deutlich machen, dass es nicht um hierarchisches Speichermanagement oder herkömmliche Datensicherung geht. Elektronische Archivsysteme sind eine Klasse für sich, die als nachgeordnete Dienste in jede IT-Infrastruktur gehören.
Speichertechnologien für die elektronische Archivierung
Bei den elektronischen Speichertechnologien muss man heute eine Trennung zwischen der Verwaltungs- und Ansteuerungssoftware einerseits und den eigentlichen Speichermedien andererseits machen. Herkömmliche magnetische Speichermedien gelten als nicht geeignet für die elektronische Archivierung, da die gespeicherten Informationen jederzeit geändert und überschrieben werden können. Dies betrifft im besonderen Maße Festplatten, die von Betriebssystemen dynamisch verwaltet werden. Magnetische Einflüsse, „Head-Crashs“ und andere Risiken wiesen den Festplatten die Rolle der reinen Onlinespeicher zu. Bei Magnetbändern kam neben der Löschbarkeit hinzu, dass diese hohen Belastungen und Abnutzungen sowie magnetischen Überlagerungen bei zu langer Aufbewahrung unterliegen. In den 80er Jahren wurden daher spezielle digital-optische Speichermedien entwickelt, die in ihrem Laufwerk mit einem Laser berührungsfrei nur einmal beschrieben werden können. Diese Speichertechnologie bezeichnet man als WORM „Write Once, Read Multiple Times“. Die Speichermedien selbst waren durch ihre physikalischen Eigenschaften gegen Veränderungen geschützt und boten eine wesentliche höhere Lebensdauer als die bis dahin bekannten magnetischen Medien.
In diese Kategorie von Speichermedien fallen heute folgende Typen:
CD-WORM
WORM
:Nur einmal beschreibbare Compact Disk Medien mit ca. 650 MegaByte Speicherkapazität. Die Speicheroberfläche im Mediums wird beim Schreiben irreversibel verändert. CD-Medien sind durch die ISO 9660 standardisiert und kostengünstig. Die Qualität mancher billiger Medien ist aber für eine Langzeitarchivierung als nicht ausreichend zu erachten. Für Laufwerke und Medien gibt es zahlreiche Anbieter. Die Ansteuerung der Laufwerke wird von den Betriebssystemen direkt unterstützt.
DVD-WORM
:Ähnlich wie die CD wird bei der DVD-WORM die Speicheroberflächen irreversibel im Medium verändert. DVD sind derzeit noch nicht einheitlich genormt und bieten unterschiedliche Speicherkapazitäten zwischen 4 und 17 GigaByte. Beim Einsatz für die Archivierung ist daher darauf zu achten, das Laufwerk und Medien den Anforderungen der langzeitigen Verfügbarkeit gerecht werden. Es gibt auch hier zahlreiche Anbieter und die meisten Laufwerke werden auch direkt von den gängigen Betriebssystemen unterstützt.
5¼“ WORM
:Bei diesen Medien und Laufwerken handelt es sich um die traditionelle Technologie, die speziell für die elektronische Archivierung entwickelt wurde. Die Medien befinden sich in einer Schutzhülle und sind daher gegen Umwelteinflüsse besser gesichert, als CD und DVD, die für den Consumer-Markt entwickelt wurden. Die Medien werden mit einem Laser beschrieben und bieten eine äußerst hohe Verfälschungssicherheit. Der derzeitige Stand der Technik sind sogenannte UDO-Medien, die einen blauen Laser verwenden und eine Speicherkapazität von 50 GigaByte bieten. Zukünftig ist mit noch deutlich höheren Kapazitäten je Medium zu rechnen. Nachteilig ist, dass Medien der vorangegangenen Generationen von 5¼“-Medien in den neuen Laufwerken nicht verwendet werden können. Von diesen sind noch mehrere verschiedene Technologien am Markt verfügbar. Für den Anschluss von 5 ¼“-Laufwerken ist spezielle Treibersoftware notwendig.
Für die Verwaltung und Nutzung der Medien sind sogenannte Jukeboxen, Plattenwechselautomaten, gebräuchlich. Diese stellen softwaregestützt die benötigten Informationen von Medien bereit. Die Software ermöglicht es in der Regel auch, Medien mit zu verwalten, die sich nicht mehr in der Jukebox befinden und auf Anforderung manuell zugeführt werden müssen. Die Software zur Ansteuerung von Jukeboxen wird direkt in die Archivsoftware integriert aber auch als unabhängige Ansteuerungssoftware angeboten. Zum Anschluss von Jukeboxen bedient man sich in der Regel eigener Server, die auch die Verwaltung und das Caching übernehmen. Inzwischen können solche Systeme aber auch als NAS Network attached Storage oder integriert in SAN Storage Area Networks genutzt werden. Die Software ermöglicht dabei respektable Zugriffs- und Bereitstellungszeiten, die im Regelfall ein ausreichendes Antwortzeitverhalten garantieren.
Neben diese klassischen Archivspeicher, die auf rotierenden, digital-optischen Wechselmedien basieren, treten inzwischen zwei weitere Technologien:
CAS Content Adressed Storage
:Hierbei handelt es sich um Festplattensysteme, die durch spezielle Software die gleichen Eigenschaften wie ein herkömmliches WORM-Medium erreichen. Ein Überschreiben oder Ändern der Information auf dem Speichersystem wird durch die Kodierung bei der Speicherung und die spezielle Adressierung verhindert. Bei diesen Speichern handelt es sich um abgeschlossene Subsysteme, die allerdings nahezu wie herkömmliche Festplattensysteme direkt in die IT-Umgebung integriert werden können. Sie bieten Speicherkapazitäten mit hoher Performance im TeraByte-Bereich.
WORM-Tapes
:WORM-Tapes sind Magnetbänder, die durch mehrere kombinierte Eigenschaften ebenfalls die Anforderungen an ein herkömmliches WORM-Medium erfüllen. Hierzu gehören spezielle Bandmedien sowie geschützte Kasetten und besondere Laufwerke, die die Einmalbeschreibbarkeit sicherstellen. Besonders in Rechenzentren, in denen Bandroboter und Librarysysteme bereits vorhanden sind, stellen die WORM-Tapes eine einfach zu integrierende Komponente für die Langzeitarchivierung dar. Die vorhandene Steuersoftware kann mit den Medien umgehen und auch entsprechendes Umkopieren und Sichern automatisieren.
Besonders für größere Unternehmen und Verwaltungen mit Rechenzentren stellen Festplatten- oder WORM-Tape-Archive eine Option dar, da sie sich einfach in den laufenden Betrieb integrieren lassen.
Strategien zur Sicherstellung der Verfügbarkeit archivierter Information
Standardisierung
:Wesentliche Voraussetzung für die langfristige Verfügbarmachung elektronischer Information ist die Einhaltung von Standards. Zu berücksichtigen sind Aufzeichnungsformate, Metadaten, Medien und die Dateiformate der Informationsobjekte selbst. Schon bei der Erzeugung von Daten sollte die langfristige Speicherung berücksichtigt werden. Langzeitig stabile Formate sollten bevorzugt verwendet werden. Eigenschaften eines solchen Formats sollten eine weite Verbreitung, eine offene Spezifikation (Norm) oder die spezielle Entwicklung als Format zur langfristigen Datenspeicherung sein. Beispiele sind XML-Dateien, TIFF und PDF-Archive.
Migration
:Eine Methode zur Sicherstellung der Verfügbarkeit ist die Migration von Information in eine neue Systemumgebung. Sie stellt unter Umständen ein Risiko dar, wenn die Informationen nicht nachweislich unverändert, vollständig und weiterhin uneingeschränkt wieder findbar von einer Systemlösung auf eine andere migriert werden. Originalität und Authentizität können durch eine Migration in Frage gestellt werden. Anderseits zwingt der technologische Wandel die Anwender auf neue Speicher- und Verwaltungskomponenten rechtzeitig zu wechseln, um die Information verfügbar zu halten. Die Migration ist daher bereits bei der Ersteinrichtung eines Archiv- und Speichersystems zu planen, um ohne Risiko und Aufwand den Wechsel vollziehen zu können. Kontrollierte, verlustfreie, „kontinuierliche Migration“ ist zur Zeit die wichtigste Lösung, Information über Jahrzehnte und Jahrhunderte verfügbar zu halten. Das Thema Migration wurde durch die Veränderungen und die Konsolidierung des Dokumentenmanagement-Marktes mit dem Verschwinden von zahlreichen Anbietern häufig diskutiert. Der Wegfall einzelner Produkte zwingt zur Migration auf andere Formate, manchmal mit Hilfe eines eigenen Migrationsprogramms. Wer ein Archivsystem einführt, muss sich daher von Anbeginn an mit dem Thema Migrationsplanung beschäftigen.
Emulation
:In der wissenschaftlichen Welt wird noch ein zweites Modell ähnlich stark diskutiert: Emulation. Emulation heißt, die Eigenschaften eines älteren Systems so zu simulieren, dass damit auch Daten dieses Systems mit neueren Computern und Betriebssystemen wieder genutzt werden können. Beispiele gibt es einige, zum Beispiel bei Computerspielen oder Apple-Computern. Diese Lösungsstrategie wird im Bereich der langfristigen Datenspeicherung aber noch nicht in größerem Ausmaß eingesetzt. Nachteile sind, dass der Aufwand künftiger Emulationsschritte nicht planbar ist und bei einem zu großen Paradigmenwechsel eines Tages vielleicht gar nicht mehr durchführbar ist. Diese Nachteile gelten in ähnlicher Form auch für nicht rechtzeitig durchgeführte Migrationen.
Kapselung
:Als Vorbereitung für Emulation eignet sich insbesondere das Kapselung-Verfahren. Dabei werden zusätzlich mit der zu bewahrenden Datei oder dem Informationsobjekt auch noch die Software, mit der man es visualisieren und reproduzieren kann, sowie die zugehörigen Metadaten in einer "Kapsel" gespeichert. Damit sind alle für die Nutzung notwendigen Informationen in Zukunft sofort zusammenhängend gespeichert. Durch diese Methode können die zu speichernden Objekte sehr groß werden, ohne dass jedoch vollständig sichergestellt ist, dass die mitarchivierte Software auch in zukünftigen Betriebssystemumgebungen lauffähig ist.
Konversion zur Laufzeit
:Lassen sich die Formate der zu speichernden Informationsobjekte nicht kontrollieren und nicht auf wenige Langzeitformate einschränken, sind Konverter und Viewer systemseitig ständig vorzuhalten, die ältere Formate in anzeigbare Formate beim Aufruf der Objekte wandeln. Dies führt mittelfristig zu einer Vielzahl von bereitzuhaltenden Konvertern und Viewern, für die eine eigenständige Verwaltung erforderlich ist, um zu einem älteren Informationsobjekt den jeweils passenden, aktuellen Konverter aufrufen zu können. Die Konversion zur Laufzeit unterscheidet sich von der Emulation dadurch, dass nicht eine ältere Umgebung aufgerufen, sondern das Objekt für die aktuelle Umgebung gewandelt wird. Spezielle Eigenschaften von Formaten, elektronische Signaturen und Digital-Rights-Management-Komponenten können hierbei, ebenso wie bei den anderen Verfahren, zu Problemen führen.
Rechtliche und regulative Vorgaben für die elektronische Archivierung
Das Thema Archivierung und Langzeitspeicherung hat in den letzten Jahren besonders durch rechtliche und regulative Vorgaben an Bedeutung gewonnen. Die Gleichbehandlung von digitalen Dokumenten mit elektronischer Signatur wie herkömmlichen Papierdokumente, der Sarbanes-Oxley Act und andere Compliance-Anforderungen in den USA, die Diskussion um die Archivierung steuerrelevanter Daten entsprechend den GDPdU in Deutschland machen revisionssichere Archiv- und Speichersysteme erforderlich. Im Rahmen der Diskussion der gesetzlichen Anforderungen stellte sich häufig die Frage nach dem „richtigen“ Speichermedium. Traditionelle WORM-Medien, die physisch nur einmal beschreibbar sind, erhoben den Anspruch die einzig richtigen Speichermedien zu sein. Die Hersteller von Festplattensystemen und WORM-Tapes konterten. Grundsätzlich gilt jedoch, dass Gesetze und Verordnungen medienneutral sind (oder sein sollten), da angesichts der langfristigen Aufbewahrungszeiträume auch Technologiewechsel berücksichtigt werden müssen. Das richtige Medium gibt es daher nicht. Das gesamte Verfahren der Archivierung muss geschlossen und sicher sein. Dies geht über die Frage der Laufwerke und Medien hinaus und bezieht auch die organisatorischen Prozesse mit ein.
Weiterentwicklung
Speichermedien
Entscheidend für den Einsatz von Archiv-Speichertechnologien ist inzwischen die Software geworden. Sie sichert unabhängig vom Medium die Unveränderbarkeit der Information, sie ermöglicht den schnellen Zugriff und sie verwaltet gigantische Speichermengen. Bisher waren elektronische Archive eine spezielle Domäne der Archivsystemanbieter. Nunmehr wird aber die Speichertechnologie selbst immer intelligenter. Systemmanagement- und S | | |