Home About us Products Services Contact us Bookmark
:: wikimiki.org ::
Online-Publikation

Online-Publikation

Als Netzpublikationen oder Online-Publikationen bezeichnet man Elektronische Publikationen, die nicht auf einem physikalischem Datenträger, sondern online über das Internet angeboten werden. Beispiele für Netzpublikationen sind E-Mail-Newsletter, Elektronische Zeitschriften, Wikis, Weblogs (Internet Tagebuch), E-Books oder auch Datenbanken und allgemein Webseiten. Es darf sich jedoch nicht um reine Ansammlungen von Dateien, sondern muss sich um logische und konsistente Einheiten handeln, die sich mit Metadaten (Autor, Titel, Veröffentlichungsdatum...) beschreiben lassen. Unabhängig davon lassen sich auch andere im Internet verfügbare Daten als publiziert bezeichnen. Dokumente werden im Internet meist in Form einer PDF-Datei veröffentlicht. Aufgrund der Flüchtigkeit des Mediums und dem schnellen technischen Wandel stellt die Langzeitarchivierung noch ein Problem dar. Grundsätzlich lassen Ansätze sich unterscheiden, bei denen die Netzpublikationen von den Verlegern aktiv in einem Archiv abgelegt oder abgeliefert werden (wie beispielsweise an der deutschen Bibliothek), und solche, bei denen versucht wird, das Netz bzw. Teile davon mit Hilfe von Suchmaschinen automatisch sammeln zu lassen (wie im Internetarchiv, siehe http://www.archive.org). Da mit den URIs die Ressource der Netzpublikationen identifiziert wird, nicht aber die Netzpublikation selbst, und der langfristige Bestand einer URI in im allgemeinen nicht sichergestellt werden kann, stellt sich die Herausforderung die Netzpublikation selbst (eindeutig und dauerhaft) zu identifizieren. Aufbauend auf dem ISBN-System der klassischen Buchpublikationen haben sich dabei der vornehmlich kommerziell genutzte Digital Object Identifier (DOI) sowie der nichtkommerzielle Society Reference Catalogue (SRef) etabliert, desgleichen der PURL und die URN als weitere "persistent identifier". Ein weiteres Problem, das sich bei Netzpublikationen stärker als bei herkömlichen Publikationen stellt, ist, dass sich ihre Herausgeber und Urheber nicht immer einfach feststellen lassen. Kommerzielle Webseiten müssen deshalb beispielsweise ein Impressum aufweisen. Bei privaten Publikationen möchte der Autor oft anonym oder quasi-anonym bleiben (z.B. Salam Pax) oder es handelt sich um Gemeinschaftswerke wie Artikel der Wikipedia. Für die Nutzung kommerzieller Netzpublikationen, wie beispielsweise Elektronische Zeitschriften und Datenbanken wird in der Regel ein Benutzerkonto (Account) benötigt, über den anfallende Kosten abgerechnet werden. Die Zugangskontrolle kann über Passwort und die Beschränkung von IP-Adressen erreicht werden.

Siehe auch


- Elektronische Zeitschrift
- Elektronische Medien
- Elektronische Publikation
- Digital Object Identifier

Weblinks


- http://www.epublications.de/ - DFG-Projekt Perspektiven für den Bezug elektronischer Informationsressourcen in der Bundesrepublik Deutschland
- [http://www.heise.de/tp/r4/inhalt/on.html Rubrik „Medien - online“] bei der Netzzeitschrift Telepolis Kategorie:Medien

Elektronische Publikationen

Als Elektronische Publikationen bezeichnet man Publikationen in Form von Elektronischen Medien, z.B. Computerspiele, digitale Nachschlagewerke und Online-Publikationen. Als gemeinsames Merkmal von elektronischen Publikationen lässt sich feststellen, dass zu ihrer Nutzung ein Computer benötigt wird. Andere Publikationsformen wie Filme (DVD) und Musik (CDs, digitales Radio...), werden in der Regel nicht direkt als elektronische Publikationen bezeichnet, falls nicht die Verknüpfung verschiedener Medienformen (Multimedia) integraler Bestandteil ist. Elektronische Publikationen werden entweder auf einem physikalischen Datenträger (Diskette, CD-ROM, DVD...) oder als über das Internet verfügbare Online-Publikation vertrieben. Auch Mischformen, bei denen zusätzliche Inhalte und Nutzungsformen über das Internet angeboten werden, kommen vor. Im Gegensatz zu herkömmlichen Printmedien u.A. weisen elektronische Publikationen in der Regel einen medienspezifischen Mehrwert in Form von Suchmöglichkeit, Interaktivität, Multimedia, Hypertext und Kopierbarkeit auf. Da die Produktion von elektronischen Publikationen sehr kostspielig sein kann und ihre Rezeption an Lesegeräte gebunden ist, haben sie sich (beispielsweise als e-Books) bisher nur in bestimmten Bereichen durchsetzen können. Auch die Möglichkeit des einfachen Kopierens ("Raubkopie") von digitaler Information ist für Verlage ein Problem.

Bereiche

Elektronische Publikationen haben sich bislang vorrangig in folgenden Bereichen durchsetzen können
- digitale Nachschlagewerke
- Lernsoftware, Infotaiment, Edutaiment (E-Learning), siehe auch Lernmedien.
- elektronische Zeitschriften und andere Periodika (elektronische Zeitschriften)
- Computerspiele
- Software

Langzeiterhaltung elektronischer Publikationen

Die Langzeiterhaltung elektronischer Publikation ist aufgrund der schnellen Entwicklung und Flüchtigkeit von Speichermedien und Software ein großes Problem. Im Gegensatz zu Printmedien und Mikroform besitzen digitale Speichermedien in der Regel nur eine begrenzte Haltbarkeit von etwa bis zu 50 Jahren. Doch auch die durch das regelmäßige Überspielen auf neue Datenträger realisierbaren Archivierung der Daten garantiert noch keine Langzeitverfügbarkeit. Während beschriebenes Papier auch nach mehreren 100 bis 1000 Jahren lesbar ist, kann eine elektronische Publikation schon nach 10 Jahren nicht mehr benutzbar sein, da die benötigten Computersysteme und Datenformate veraltet sind. Eine wesentliche Aufgabe der Langzeiterhaltung elektronische Publikationen ist deshalb die Konvertierung in neue Datenformate und die Emulation veralteter Computersysteme. Hilfreich sind dabei offene, medienneutrale Datenformate wie XML.

Sammlung

Zur Sammlung und Archivierung elektronischer Publikationen werden Dokumentenserver aufgebaut. Im Rahmen ihres Sammelauftrages ist die Deutsche Bibliothek auch bestrebt, elektronische Publikationen zu sammeln und für die Nachwelt zu erhalten. Einen Anfang machen in elektronischer Form vorliegende Dissertationen, für die im Rahmen des DFG-Projektes DissOnline Strategien entwickelt wurden und die ab 1998 in der deutschen Nationalbibliografie verzeichnet werden.
- http://deposit.ddb.de/ - Archivserver der Deutschen Bibliothek
- http://deposit.ddb.de/netzpub/web_langzeiterhaltung_ep.htm - Langzeiterhaltung elektronischer Publikationen
- http://www.kb.nl/coop/nedlib/ - NEDLIB (1998-2000) Mehrere andere Nationalbibliotheken und andere Einrichtungen experimentieren zur Zeit mit automatischen "Harvesting"-Verfahren zu Archivierung von Ausschnitten des Internets, spezielle des World Wide Web. Am bekanntesten ist das Internet Archive. Eine solche Sammlung kann jedoch immer nur aus Schnappschüssen ohne weitere Erschließung bestehen.

siehe auch

Elektronische Zeitschrift, Netzpublikation, Digital Object Identifier Kategorie:Medien

Internet

Das Internet (Abkürzung für engl. Interconnected Networks, oder lat. inter, zwischen – also das (Über-)Netzwerk) ist ein weltweites Netzwerk voneinander unabhängiger Netzwerke. Es dient der Kommunikation und dem Austausch von Informationen. Jeder Rechner eines Netzwerkes kann dabei prinzipiell mit jedem anderen Rechner kommunizieren. Die Kommunikation der einzelnen Rechner erfolgt über definierte Protokolle zum Datenaustausch. Umgangssprachlich wird „Internet“ häufig als Synonym für das World Wide Web verwendet, das jedoch nur einer von vielen Diensten des Internets ist.

Geschichte

Dieser Abschnitt ist eine kurze Zusammenfassung. Siehe auch Geschichte des Internets. Das Internet ging aus dem Ende der 1960er Jahre entstandenen ARPANET hervor, einem Projekt der Advanced Research Project Agency (ARPA) des US-Verteidigungsministeriums. Es wurde benutzt, um Universitäten und Forschungseinrichtungen zu vernetzen um die knappen Rechenkapazitäten sinnvoll zu nutzen, erst in den USA, später dann auch weltweit. Die anfängliche Verbreitung des Internets ist eng mit der Entwicklung des Betriebssystems Unix verbunden. Nachdem das ARPANET 1982 TCP/IP adaptierte, begann sich auch der Name Internet durchzusetzen. Nach einer weit verbreiteten Legende bestand das ursprüngliche Ziel des Projektes vor dem Hintergrund des Kalten Krieges in der Schaffung eines verteilten Kommunikationssystems, um im Falle eines Atomkrieges eine störungsfreie Kommunikation zu ermöglichen [http://www.zeit.de/2001/28/200128_stimmts_internet_xml [Drösser]]. In Wirklichkeit wurden aber vorwiegend zivile Projekte gefördert, auch wenn die ersten Knoten von der Advanced Research Projects Agency finanziert wurden. Rasanten Auftrieb erhielt das Internet seit Anfang der 1990er durch das World Wide Web, kurz WWW, als der erste grafikfähige Webbrowser namens Mosaic veröffentlicht und zum kostenlosen Download angeboten wurde. Das WWW wurde im CERN (bei Genf) von Tim Berners-Lee entwickelt. Schließlich konnten auch Laien auf das Netz zugreifen, was mit der wachsenden Zahl von Nutzern zu vielen kommerziellen Angeboten im Netz führte. Der Webbrowser wird deswegen auch als die Killerapplikation des Internet bezeichnet. Das Internet ist ein wesentlicher Katalysator der Digitalen Revolution. Neue Techniken verändern das Internet und ziehen neue Benutzerkreise an: IP-Telefonie, Groupware wie Wikis, Blogs, Breitbandzugänge (zum Beispiel für Vlogs und Video on Demand), Peer-to-Peer-Vernetzung (vor allem für File Sharing) und Online-Spiele (z.B. Rollenspiele, Egoshooter, ...). Eine ausführliche Fassung der Geschichte (in Textform) gibt es im Artikel Geschichte des Internets. Eine chronologische Auflistung der Ereignisse findet man im Artikel Chronologie des Internets.

Aufbau und Struktur

Chronologie des Internets, LAN)]] Das Internet besteht unter anderem aus:
- Firmennetzwerken, über welche die Computer einer Firma verbunden sind,
- Providernetzwerken, an die die Rechner der Kunden eines Internet-Providers angeschlossen sind und
- Universitätsnetzwerken. An Internet-Knoten werden die verschiedenen Netzwerke über leistungsstarke Verbindungen (Backbones) miteinander vernetzt. Ein solcher Internet-Knoten kann prinzipiell beliebig viele Netzwerke miteinander verbinden. Am DE-CIX in Frankfurt am Main, dem größten Internet-Knoten Deutschlands, sind es beispielsweise mehr als hundert Netzwerke. Da das ARPANET als dezentrales Netzwerk möglichst ausfallsicher sein sollte, wurde schon bei der Planung beachtet, dass es keinen Zentralrechner, keinen zentralen Internet-Knoten sowie keinen Ort geben sollte, an dem alle Verbindungen zusammenlaufen. Diese geplante Dezentralität wurde jedoch auf der administrativen Ebene des Internet nicht durchgängig eingehalten. Die Internet Corporation for Assigned Names and Numbers (ICANN), die zuständige Organisation für die Pflege der Zuordnung von IP-Adressen auf Domain-Namen, untersteht wenigstens indirekt dem Einfluss des US-Wirtschaftsministeriums und unterhält Root-Server in zahlreichen Ländern. Um den Einfluss der Vereinigten Staaten auf das Domain Name System einzugrenzen, wurde das freie Open Root Server Network aufgebaut. Die netzartige Struktur sowie die Heterogenität des Internets sorgen für eine sehr hohe Ausfallsicherheit. Für die Kommunikation zwischen zwei Nutzern des Internets existieren meistens mehrere mögliche Kommunikationswege. Erst bei der tatsächlichen Datenübertragung wird entschieden, welcher Weg benutzt wird. Dabei können zwei hintereinander versandte Datenpakete beziehungsweise eine Anfrage und die Antwort je nach Auslastung auch verschiedene Kommunikationswege durchlaufen. Deshalb hat der Ausfall einer physikalischen Verbindung im Internet meistens keine schwerwiegenden Auswirkungen, sondern kann durch die Verwendung alternativer Kommunikationswege ausgeglichen werden. Privatpersonen greifen auf das Internet entweder über einen Schmalband- (zum Beispiel per Modem oder ISDN) oder Breitband-Zugang (zum Beispiel DSL oder Kabelmodem) eines Internet-Providers zu, siehe auch Internet by Call. Firmen oder staatliche Einrichtungen sind häufig per Standleitung mit dem Internet verbunden. Die einzelnen Arbeitsplatzrechner erhalten dabei meistens eine private IP-Adresse, die per NAT maskiert wird. Auf diese Rechner kann aus dem Internet nicht direkt zugegriffen werden, was meistens zwar aus Sicherheitsgründen erwünscht ist (siehe auch: Firewall), aber auch einige Nachteile hat.

Technik

Das Internet fußt auf der einheitlichen TCP/IP-Protokollfamilie, welche die Adressierung und den Datenaustausch zwischen verschiedenen Computern und Netzwerken standardisiert. Ein großer Vorteil ist, dass die Kommunikation völlig unabhängig von den verwendeten Betriebssystemen und Netzwerktechnologien geschehen kann. Das Domain Name System (DNS) ist ein wichtiger Teil der Internet-Infrastruktur. Um einen bestimmten Computer ansprechen zu können, identifiziert ihn das IP-Protokoll mit einer eindeutigen IP-Adresse. Dabei handelt es sich bei der heute üblichen Version IPv4 um 4 Byte (Zahlen im Bereich von 0 bis 255), die durch einen Punkt getrennt angegeben werden, beispielsweise 214.235.81.190. Man kann sich diese Zahl als eine Art Telefonnummer mit dem DNS als Telefonbuch vorstellen. Das DNS ist eine verteilte Datenbank, die einen Übersetzungsmechanismus zur Verfügung stellt: Ein für Menschen gut merkbarer Domänenname (zum Beispiel „wikipedia.de“) kann in eine IP-Adresse übersetzt werden und umgekehrt. Dies geschieht – vom Nutzer unbemerkt – immer dann, wenn er etwa im Webbrowser auf einen neuen Link klickt oder direkt eine Webadresse eingibt. Der Browser fragt zuerst einen ihm bekannten DNS-Server nach der IP-Adresse und verbindet sich dann mit dieser Adresse, um die Inhalte abzurufen. Die Internetstandards und Protokolle des Internets werden in RFCs beschrieben und festgelegt.

Dienste

Das Internet selbst stellt lediglich die Infrastruktur zur Verfügung. Ein Nutzen für die Anwender entsteht erst dadurch, dass basierend auf der Struktur des Internets dem Anwender verschiedene Dienste zur Verfügung stehen. So hat der Dienst des World Wide Webs dem Internet Anfang der 1990er-Jahre erst zum Durchbruch verholfen. Auch heute noch kommen immer neue Dienste hinzu. Die wichtigsten und bekanntesten Dienste sind in der folgenden Tabelle kurz beschrieben. Für ausführlichere Erläuterungen siehe die jeweiligen Artikel.
- Die Anteile der wichtigsten Dienste am globalen Datenverkehr im Jahr 2004, laut einer Studie, die auf Stichproben von 27 international tätigen Carriern beruhte.

Chat-Dienste

Chatdienste dienen der Echtzeitkommunikation in Schriftform über das Internet.

Internetkompetenz

In den 1990er Jahren reagierten die Erziehungsinstanzen angesichts der Verbreitung des Internets als Informationsquelle und Kommunikationsmittel defensiv. Als deutlich wurde, dass es sich nicht um eine Modeerscheinung handelt, wurden in Schulen und Universitäten Programme angeboten, um Jugendliche auf einen kompetenten Umgang mit dem Medium Internet vorzubereiten. Die Förderung umfasst folgende Ziele:
- Die Jugendlichen sollen aus der Fülle an Informationen (Datenbanken, Homepages) diejenigen heraussuchen können, die sie brauchen und deren Zuverlässigkeit prüfen.
- Die Jugendlichen sollen kompetent interagieren und mit einer hohen Menge unstrukturierter Impulse (z.B. Mails) produktiv umgehen können.
- Die Jugendlichen sollen selbst qualitativ hochwertige Inhalte erstellen und ins Netz setzen können (z.B. Homepages).

Internetzusammenbrüche

Im Bereich der Katastrophenforschung werden flächendeckende Missbräuche oder Ausfälle des Internets sehr ernst genommen (D-Gefahren). Ein Zusammenbruch des Internets oder einzelner Teile hätte weitreichende Folgen.

Internetsucht und Computersucht

Mit der steigenden Verbreitung des Internets mehren sich (besonders in den USA) die Fälle von angeblicher "Internetsucht". Das heißt, dass die Betroffenen ihren Internetkonsum nicht mehr steuern können und trotz Problemen (beispielsweise Schlafmangel, Eheprobleme, finanzielle Probleme) weiter online sind. Dies kann weitreichende Folgen haben, wie zum Beispiel Verschuldung und berufliche Probleme. Aber auch gesundheitliche Schäden wie etwa Bewegungsmangel und falsche Ernährung sind möglich. Die Existenz einer "Computersucht" im Sinne einer "Abhängigkeit" von Computerspielen (ob online oder nicht) ist umstritten.

Literatur


- Holger Bleich: [http://www.heise.de/ct/05/07/088/ Bosse der Fasern. Die Infrastruktur des Internet]. In: c't 7/2005, S. 88-93 (21. März 2005)
- Ch. Meinel, H. Sack: [http://www.minet.uni-jena.de/~sack/WWWBuch/ WWW- Kommunikation, Internetworking, Web-Technologien]. Springer-Verlag, Berlin, Heidelberg, New York, 2004.

Siehe auch


- Medienwissenschaft & Medientheorie
- Netzkultur
- Internetrecht
- Internet Archive
- Internetworking
- Anonymität im Internet
- Internetsucht
- Zensur im Internet
- Weblog
- Internet2
- Internet Society
- Internetstandard

Weblinks


- [http://www.br-online.de/br-intern/medienforschung/onlinenutzung/pdf/Eimeren2004.pdf Internetverbreitung in Deutschland: Potenzial vorerst ausgeschöpft?] - Online-Studie von ARD und ZDF (PDF, 514KB)
- [http://www.netplanet.org/ netplanet - Verstehen Sie mal das Internet] Deutschsprachige Wissensquelle rund um das Internet
- [http://www.iglossar.de Internet Glossar]
- [http://www.wdrmaus.de/sachgeschichten/internet/ Die Sendung mit der Maus: Der Datenweg durchs Internet]
- [http://www.nonliner-atlas.de/ (N)ONLINER Atlas, Deutschlands größte Studie zur Nutzung und Nicht-Nutzung des Internets]
-
- [http://www.internettrafficreport.com/ Internet Traffic Report - Globale Statistik des Internets] ! fiu-vro:Internet ja:インターネット ko:인터넷 ms:Internet simple:Internet th:อินเทอร์เน็ต

E-Mail

E-Mail (v. engl. electronic mail, „elektronische(r) Post/Brief“), kurzw. auch Mail, bezeichnet eine auf elektronischem Weg in Computernetzwerken übertragene, briefartige Nachricht. Eindeutschungen wie E-Brief oder E-Post, scherzhaft auch "Strompost", treffen bislang auf wenig Akzeptanz. Unklar ist schließlich das zugeordnete grammatikalische Geschlecht. Während sich in Österreich und Deutschland vorwiegend die feminine Form durchgesetzt hat (die Mail), dominiert in der Schweiz das Neutrum (das Mail). E-Mail wird – noch vor dem World Wide Web – als wichtigster und meist genutzter Dienst des Internets angesehen (Stand 2002 [http://www.planetlink.com/articles/email.html]). Über die Hälfte des weltweiten E-Mail-Aufkommens im Internet ist allerdings seit ca. 2002 auf Spam zurückzuführen.

Geschichte

Vor dem Aufkommen von E-Mail wurden Nachrichten als Brief oder Telegramm, später als Fernschreiben und Telefax übermittelt. Ende der 1960er Jahre begann dann der Siegeszug der E-Mail – sie war eine der ersten Anwendungen, welche die Möglichkeiten des ARPANETs nutzte. Die Einführung von E-Mail wurde nicht gezielt geplant, sondern eroberte das Netzwerk auf Grund des Benutzerverhaltens. Dies überraschte die ARPANET-Initiatoren, denn noch 1967 hatte Lawrence Roberts, der spätere Leiter von IPTO gesagt, die Möglichkeit des Austausches von Botschaften unter den Netzwerkteilnehmern sei „not an important motivation for a network of scientific computers“ (dt.: „kein wichtiger Beweggrund, ein Netzwerk wissenschaftlicher Rechner aufzubauen“). Bereits 1971 überstieg das Gesamtvolumen des elektronischen Mailverkehrs das Datenvolumen, das über Telnet und FTP abgewickelt wurde. Als Erfinder der elektronischen Post gilt der Computertechniker Ray Tomlinson. Erste Tests erfolgten 1971, und gegen Ende (November od. Dezember) 1971 hatten die von ihm entwickelten Programme (SNDMSG/READMAIL) Premiere. Der damals beim privaten Forschungsunternehmen BBN (Bolt, Beranek and Newman) in Cambridge, Massachusetts mit dem Aufbau des ARPAnet beschäftigte Erfinder kann aber nach eigenen Angaben nicht mehr genau sagen, was der Inhalt der ersten Botschaft war. Die erste Buchstabenreihe einer amerikanischen Computertastatur „QWERTYUIOP“ sei aber sehr wahrscheinlich. Parallel zum Internet entwickelten sich Beginn der 1980er Jahre in den meisten Netzwerken Systeme, mit denen sich Nachrichten übertragen ließen. Dazu gehörten unter anderem Mailbox-Systeme, X.25, Novell und BTX. Diese Systeme wurden Mitte der 1990er durch die Verbreitung des Internet stark verdrängt. In Deutschland wurden am 2. August 1984 die angeblich ersten Internet-E-Mails empfangen und gesendet: Der Karlsruher Internetpionier Werner Zorn beantwortete den offiziellen Willkommensgruß des US-amerikanischen CSNet, einer herstellerübergreifenden Plattform zur elektronischen Kommunikation von Wissenschaftlern. Heute (2005) werden E-Mails vorwiegend per SMTP über das Internet und in lokalen Netzen übertragen, lediglich X.400, ein offener, weltweiter Standard, wird daneben noch ernsthaft benutzt. Die erste große E-Mail-Diskussionsgruppe, die im ARPANET entstand, war die SF-LOVERS-Liste, in der sich eine Reihe von ARPA-Forschern an öffentlichen Diskussionen über Science Fiction beteiligte (Rheingold, 1994). SF-LOVERS tauchte in den späten 70er Jahren im ARPANET auf. Zunächst wurde versucht, dagegen einzuschreiten, weil derartige Aktivitäten selbst bei liberalster Auslegung mit Forschung wenig zu tun hatten. Für einige Monate wurde die Liste deshalb gesperrt. Schließlich wurden die Verantwortlichen der ARPA aber mit dem Argument überzeugt, dass SF-LOVERS ein wichtiges Pilotprojekt zur Erforschung der Verwaltung und des Betriebs großer Mailinglisten war (Hauben, 1993). Die Systemingenieure mussten das System wiederholt umbauen, damit es das explosionsartig ansteigende Nachrichtenaufkommen bewältigen konnte.

Technische Details

Aufbau einer E-Mail

Wie beschrieben, bestehen E-Mails nur aus Textzeichen. Um Computern die Weiterleitung bzw. die Darstellung zu erleichtern, sind E-Mails intern in zwei Teile geteilt. Zum einen der „Header“, mit dem, für Weiterleitung bzw. Zustellung wesentlichen Teil mit Sender- und Empfängerzeilen, zum anderen der, im englischen message body genannte Teil mit dem eigentlichen Inhalt der Nachricht.

Header - der Kopf der E-Mail

:Hauptartikel: Header (E-Mail) Die Header genannten Kopfzeilen einer E-Mail geben Auskunft über den Weg, den eine E-Mail genommen hat und bieten Hinweise auf Absender, Empfänger, Datum der Erstellung und mehr.

Body - der Inhalt der E-Mail

Der Body einer E-Mail ist durch eine Leerzeile vom Header getrennt und enthält die zu übertragenden Informationen in einem oder mehreren Teilen. Eine E-Mail darf gemäß RFC 2822 Abschnitt 2.3 nur Zeichen des 7-Bit ASCII-Zeichensatzes enthalten. Sollen andere Zeichen oder Daten wie zum Beispiel Bilder übertragen werden, müssen diese zuvor passend kodiert werden. Geregelt wird das durch RFC 2045 ff (siehe auch MIME und base64). Aktuelle Mail-Clients kodieren Text und Dateianhänge (vgl. unten) bei Bedarf automatisch. Neben dem klassischen Klartext werden teilweise auch Nachrichten auch als HTML-Datei versandt – teils ungewollt und unbewußt durch die Voreinstellung des Mail-Clients, teils bewußt, um Textauszeichnungen verwenden zu können. Viele Empfänger lehnen HTML-Mail allerdings ab, da diese bei Verwendung von Javascript oder Nutzung anderer Ressourcen ein Sicherheitsrisiko darstellen. Zudem ist die Interpretation des HTML-Codes stark von der Benutzerumgebung des Empfängers abhängig, wodurch optische Effekte oder Formatierungen häufig nicht so dargestellt werden, wie dies vom Absender gedacht war.

Größe

Die maximale Größe von E-Mails ist nicht prinzipiell begrenzt. In der Realität zeigen sich allerdings Grenzen durch technische oder administrative Beschränkungen der Systeme, welche die E-Mail übertragen oder empfangen. Stand 2005 treten bei E-Mails ab ca. 20 MB Größe regelmäßig Probleme auf. In solchen Fällen erhält der Absender eine Fehlermeldung vom Mailer-Daemon.

Elemente einer E-Mail

Die E-Mail-Adresse

:Hauptartikel: E-Mail-Adresse Eine E-Mailadresse besteht immer aus zwei Teilen: Zum einen der Local-part genannte Teil vor dem @, zum anderen der domain-part hinter dem @. Es ergibt sich also lokaler_teil@domainame, zum Beispiel max.mustermann@wikipedia.org. Der hintere Teil (Domain) fungiert dabei wie Stadt und Postleitzahl: Durch ihn wissen die Rechner, die die E-mail weiterleiten, an welchen Rechner diese zugestellt werden soll. Der lokale Teil hingegen ist quasi das Postfach, in welches die E-mail „eingeworfen“ werden soll. Beide Teile werden durch das At-Zeichen (@) (Aussprache engl. „at“ oder umgangssprachlich „Klammeraffe“ oder „Affenschwanz“) getrennt.

Dateianhänge

Ein Dateianhang (engl.: Attachment ) ist eine Datei, welche im Body (vgl. oben) einer E-Mail verschickt wird. Dies wird durch das MIME-Protokoll ermöglicht, welches die Unterteilung des Bodys und die Kodierung der Datei regelt. Dateianhängen können Computerviren beinhalten, daher sollte sorgsam mit ihnen umgegangen werden. Die Größe eines Attachments ist zwar prinzipiell nicht begrenzt, wird aber in der Realität durch Größenbeschränkungen für die gesamte E-Mail limitiert.

Emoticons Abkürzungen

Im Inhalt von E-Mails finden sich häufig Abkürzungen und Emoticons.

Versand

Verwendete Protokolle


- SMTP ist ein Protokoll zum Mailversand und -Transport.
- POP3 dient zum Abruf von Mails von einem Mailserver.
- IMAP dient dazu, auf Mailboxen zuzugreifen, die auf Mailservern liegen.
- UUCP ist ein Protokoll, mit dem E-Mails gesammelt werden und beim nächsten Verbindungsaufbau verschickt werden. Es hat heute stark an Bedeutung verloren.

Überwachung

:Hauptartikel: E-Mail-Überwachung Inzwischen wird in vielen Ländern der E-Mail-Verkehr vom Staat überwacht. In Deutschland sind seit dem Jahr 2005 Internet Service Provider verpflichtet, entsprechende Hard- und Software vorzuhalten, um einer Überwachungsanordnung sofort Folge leisten zu können, ohne für die daraus erwachsenden Kosten einen finanziellen Ausgleich zu erhalten. Erste Internet Service Provider haben mit damit begründeten Preiserhöhungen begonnen.

Benutzerschnittstelle

Zur Nutzung von E-Mail benötigt man eine Möglichkeit, E-Mails zu erzeugen und zu empfangen. Hierfür gibt es mehrere Möglichkeiten, die im folgenden aufgeführt sind.

E-Mail-Programm

:Hauptartikel: E-Mail-Programm Zur Nutzung von E-Mail kann ein E-Mail-Programm, auch E-Mail-Client oder Mail-User-Agent (MUA) genannt, verwendet werden. Ein solches Programm ist meist auf dem Rechner des Benutzers installiert und kommuniziert mit einem oder mehreren Mail-Servern eines Mail-Providers.

Webmail

:Hauptartikel: Webmail Als alternatives Verfahren zur Verwendung eines E-Mail-Programms hat sich auch die Nutzung von Webmail etabliert. Webmail ermöglicht die Nutzung von E-Mail mithilfe eines Web-Browsers über ein Web-Interface. Bei der Benutzung einer Webmail-Oberfläche werden die E-Mails nicht auf dem eigenen PC bearbeitet, sondern auf einem Web-Server eines Mail-Providers.

Vor- und Nachteile

Das E-Mail-System besitzt einige Vor- und Nachteile, die im folgenden aufgeführt sind.

Authentizität und Schutz des Inhaltes

Die meisten E-Mail-Nachrichten werden im Klartext verschickt, können also prinzipiell auf jedem Rechner, den die Nachricht auf ihrem Weg vom Absender zum Empfänger passiert, gelesen werden. Zieht man eine Analogie zur Briefpost, ist eine E-Mail daher eher mit einer Postkarte vergleichbar als mit einem durch einen Umschlag vor neugierigen Blicken geschützten Brief. Ebenfalls ähnlich wie bei einem Brief oder einer Postkarte und genauso einfach, lassen sich E-Mails mit einer falschen Absenderadresse verschicken, was zum Beispiel bei Spam (UCE/UBE) oft zu beobachten ist. Empfangsadresse, CC- und BCC-Adressen lassen sich gleichermassen fälschen (address spoofing). Die Lösung für diese beide Probleme ist Verschlüsselung und Absenderauthentifizierung. Hierzu existieren (unter anderem) die Verfahren PGP und dessen freie Variante GnuPG, sowie S/MIME (vorwiegend im B2B-Bereich), die jedoch noch nicht besonders weit verbreitet sind. Selbst solche Verschlüsselungsverfahren decken lediglich den Inhalt der E-Mail ab, nicht die Betreff-Zeile oder das E-Mail-Datum. Dadurch können unter Umständen Rückschlüsse auf den Inhalt einer verschlüsselten Mail gezogen werden.

Beweiskraft

E-Mails haben wenig Beweiskraft, da der Sender bei den herkömmlichen Protokollen und Log-Mechanismen keine Möglichkeit hat, zu beweisen, wann er was an wen versendet hat und ob der Empfänger die E-Mail erhalten hat. Durch eine Elektronische Signatur und vor allem durch eine Qualifizierte elektronische Signatur können allerdings im Rechtsverkehr (Zivilrecht, Verwaltungsrecht) Verbindlichkeiten geschaffen werden, die auch vor Gericht Bestand haben. Umgangssprachlich wird dann von einer „Digitalen Unterschrift“ gesprochen. Das verbindliche Setzen eines Zeitstempels wird unter bestimmten Voraussetzung ebenfalls anerkannt. Näheres wird im Signaturgesetz geregelt. Den Empfang der Nachricht kann eine Signatur allerdings nicht beweisen, hierzu ist beispielsweise eine – idealerweise ebenfalls signierte – Antwort notwendig. Einige Dienstleister bieten Lösungen an, die Signatur, Verschlüsselung und Antwort automatisieren (zum Beispiel E-Mail-Frachtdienst genannt).

Laufzeit

E-Mail ist, anders als zum Beispiel Telefon oder IRC, nicht für zeitgleiches (synchrones) Senden und Empfangen entwickelt, sondern es ist wie Briefpost oder Fax, ein asynchrones Kommunikationsmedium – der Sender kann seine Nachricht auch senden, wenn der Empfänger sie nicht sofort entgegennehmen kann. Die Laufzeit der E-Mail kann ein Problem darstellen, da sie – anders als zum Beispiel beim Telefax – nicht vorhersehbar ist und unter ungünstigen Voraussetzungen stark schwanken kann. Die Schwankungen der Laufzeit werden durch eine Vielzahl von Parametern beeinflusst, vor allem durch die Auslastung der beteiligten Mailsysteme sowie der für E-Mail bereitstehenden Übertragungskapazität der, die Mailsysteme verbindenen Leitungen. Ist der Mailserver des Empfängers länger nicht erreichbar oder die Mail wird nur in großen Zeitabständen auf den Server des Empfängers übertragen, kann es durchaus zu Laufzeiten von einigen Tagen kommen.

Absenderauthentifizierung

Im Jahre 2004 gab es verschiedene Versuche, das Spam-Problem in den Griff zu bekommen. Dabei konkurrierten die Verfahren Sender ID von Microsoft, Sender Policy Framework (SPF), DomainKeys von Yahoo! und RMX um die Gunst der Umsetzung. Eine IETF-Arbeitsgruppe versuchte, einen Standard zu definieren. Die Funktionsweise ist dabei bei allen Verfahren ähnlich. Durch einen Zusatzeintrag im DNS sollte es möglich sein, den sendenden Mailserver zu verfizieren. Die IETF-Arbeitsgruppe scheiterte aber letztendlich an ungeklärten Patentansprüchen von Seiten Microsofts. Die verschiedenen Verfahren sollen nun in eigenen Verfahren als RFCs umgesetzt werden.

Siehe auch


- E-Post, Mail-Verteiler, Spam, Vorhaltezeit
- Netiquette, Kommunikette, O.T., TOFU
- Signature, vCard, Idiotenfalle
- Geekcode, MAPI, MIME, MetaEmailSearchAgent

Weblinks


- [http://th-h.de/faq/headerfaq.php E-Mail-Header lesen und verstehen]
- RFC 2142 – Mailbox Names for Common Services, Roles and Functions
- RFC 2368 – The mailto URL scheme
- RFC 2822 – Internet Message Format !E-Mail ja:電子メール ko:전자 우편 simple:Email th:อีเมล

Elektronische Zeitschrift

Eine Elektronische Zeitschrift (auch E-Journal) ist eine Zeitschrift, die als Netzpublikation (seltener auch auf einem Datenträger, dann Diskmag genannt) publiziert wird. Elektronische Zeitschriften spielen vor allem bei den wissenschaftlichen Zeitschriften eine zunehmende Rolle. Als wesentliches Merkmal einer elektronischen Zeitschrift gilt, dass ihre Artikel im Volltext enthalten sind. Eine Zeitschrift, die eine Homepage besitzt, auf der lediglich auf die Printausgabe verwiesen wird, ist daher noch keine elektronische Zeitschrift. Wie bei herkömmlichen Zeitschriften gehören zu einer elektronischen Zeitschrift auch eine Redaktion, ein Herausgeber (in der Regel ein Verlag) und Autoren.

Formen

Da die meisten Leser auch heute noch gedruckte Artikel bevorzugen, handelt es sich bei der Mehrzahl elektronischer Zeitschriften um Onlineversionen einer gedruckten Ausgabe. Reine Online-Zeitschriften sind deutlich seltener, im Bereich der wissenschaftlichen Zeitschriften machen sie etwa 10-15% aus. Aufgrund der entfallenen Druck- und Vertriebskosten können elektronische Zeitschriften kostenlos zugänglich gemacht werden, falls die für ihre Erstellung beteiligten Personen aus anderen Quellen bezahlt werden oder freiwillig arbeiten. Im Gegensatz zu gedruckten Zeitschriften können kommerzielle elektronische Zeitschriften in der Regel nicht gekauft, sondern es kann nur über einen Lizenzvertrag ein Nutzungsrecht erworben werden. Aufgrund der steigenden Zeitschriftenpreise schließen sich viele Bibliotheken zu Konsortien zusammen, die mit den Verlagen Konsortialverträge aushandeln. Bekannte wissenschaftliche Zeitschriftenverlage sind unter anderem der Springer-Verlag und Elsevier.

Neue Publikationsmodelle

Aufgrund der neuen Möglichkeiten des Online-Mediums und der Preispolitik der Verlage (der sogenannten Zeitschriftenkrise) sind in den vergangenen Jahren neue Publikationsformen entstanden. Gefordert wird unter anderem eine Freigabe aller publizierten Artikel nach einem gewissen Zeitraum bis hin zu einer vollständigen Abschaffung der Verlage als Vermittler zwischen Autor und Leser. Die Open-Access-Bewegung (siehe etwa Budapest Open Access Initiative, Berliner Erklärung) fordert, dass die Zeitschriftenliteratur mittels self-archiving und Gründung neuer freier E-Journale zugänglich sein soll. Self-archiving heißt: Auf Eprint-Servern stellen Wissenschaftler ihre Artikel vor ("Preprint") oder nach ("Postprint") einer Zeitschriftenveröffentlichung online zur Verfügung. Verschiedene Geschäftsmodelle erproben Antworten auf die offene Frage, wie die administrativen Kosten der Erstellung einer Zeitschrift verteilt werden sollen.

Siehe auch


- Open Archives Initiative, Open Access, Elektronische Publikationen, Fachzeitschrift
- :Kategorie:Online-Magazin

Literatur


- Keller, Alice: Elektronische Zeitschriften: Entwicklungen in den verschiedenen Wissenschaftszweigen. In: zeitenblicke 2 (2003), Nr. 2, Wohin führt der Weg? Historische Fachzeitschriften im elektronischen Zeitalter (Herausgeber dieser Ausgabe: Gudrun Gersmann und Matthias Schnettger) http://www.zeitenblicke.historicum.net/2003/02/keller.htm
- Eine Sammlung von Online-Literatur (u.a. aus Elektronischen Zeitschriften) zum Elektronischen Publizieren, Online-Zeitschriften und OpenAccess findet sich hier: http://wiki.pruefung.net/Wiki/OpenAccess
- Eine Linkliste zu Publikationen und Vorträgen zum Thema Elektronische Zeitschriften und Konsortien bietet das Bibliotheksservice-Zentrum Baden-Württemberg (BSZ) [http://titan.bsz-bw.de/cms/service/digibib/links/e-journals]

Weblinks


- Die Elektronische Zeitschriftenbibliothek [http://rzblx1.uni-regensburg.de/ezeit/] ist ist ein kooperativer Service von mehr als 200 Bibliotheken mit dem Ziel, ihren Nutzern einen einfachen und komfortablen Zugang zu elektronisch erscheinenden wissenschaftlichen Zeitschriften zu bieten.
- In der Zeitschriftendatenbank [http://www.zdb-opac.de] sind neben gedruckten Zeitschriften auch elektronische Zeitschriften aufgeführt.
- In dem Directory of Open Access Journals [http://www.doaj.org] sind elektronische Zeitschriften aufgeführt, die frei zugänglich sind (siehe auch Open Access).
- Umfangreiche Informationen zu Elektronischen Zeitschriften bietet das Bibliotheksservice-Zentrum Baden-Württemberg (BSZ) [http://titan.bsz-bw.de/cms/service/digibib/links/e-journals]

Beispiele reiner Online-Magazine


- Einseitig.info[http://www.einseitig.info]
- Die Gegenwart[http://www.diegegenwart.de]
- [http://www.lhbr.net LHBR - LetHereBeRock]
- Youthguide[http://www.youthguide.ch] Kategorie:Medien !

Weblog

Ein Weblog [] (engl. Kontamination aus Web und Log), üblicherweise einfach nur Blog [] genannt, ist eine Webseite, die periodisch neue Einträge enthält. Neue Einträge stehen an oberster Stelle, ältere folgen in umgekehrt chronologischer Reihenfolge.

Erklärung

Weblogs, auch genannt Blogs, sind Online-Journale, die sich durch häufige Aktualisierung und viele Verlinkungen auszeichnen. Die meisten Blogs setzen bei einem neuen Artikel einen oder mehrere zentrale Server davon in Kenntnis. Jedes Weblog ist ein für sich eigenes Journal. In einem typischen Weblog hält ein Autor (der Blogger) seine 'Surftour' durch das Internet fest, indem er zu besuchten Webseiten einen Eintrag schreibt. Es gibt aber auch Fach-Weblogs, in denen ein Autor Artikel zu einem bestimmten Thema veröffentlicht. Andere Blogger teilen auf ihrer Webseite Einzelheiten aus ihrem privaten Leben mit. Typischerweise linken Blogger auf andere Webseiten und kommentieren aktuelle Ereignisse. Viele Einträge bestehen aus Einträgen anderer Weblogs oder beziehen sich auf diese, so dass Weblogs untereinander stark vernetzt sind. Die Gesamtheit aller Weblogs bildet die Blogosphäre. Die Blogosphäre bezeichnet sich selbst oft auch als (Klein-)Bloggersdorf. Weblogs sind vergleichbar mit Newslettern oder Kolumnen, jedoch persönlicher - sie selektieren und kommentieren oft einseitig und werden deswegen auch mit Pamphleten des 18. und 19. Jahrhunderts verglichen. Weblogs sind demnach keine Alternative zu (Online-)Zeitungen, sondern eine Ergänzung. Im Idealfall reagieren Weblogs schneller auf Trends oder bieten weiterführende Informationen bzw. Links zu bestimmten Themen. Die meisten Weblogs haben eine Kommentarfunktion, die es den Lesern ermöglicht, einen Eintrag zu kommentieren und so mit dem Autor oder anderen Lesern zu diskutieren. Mit dem stetigen Wachsen der "Blogosphäre" nimmt auch die Vielfalt an unterschiedlichsten Weblog-Formen zu. So gibt es weiterhin die "klassischen" Weblogs, aber auch eine wachsende Zahl persönlicher Tagebücher, die als Weblog geführt werden und sich vor allem deren einfach zu bedienende Technik zu Nutze machen. Etliche Weblogs enthalten eine Mischung aus Kommentaren, Netzfunden und Tagebuch-Einträgen und dienen in erster Linie der Unterhaltung oder der persönlichen Selbstdarstellung im Internet. Andere Weblogs, die Photoblogs (kurz auch Phlog), veröffentlichen hauptsächlich Fotografien oder Handy-Kamerabilder (Moblogs). Schnellere Datenübertragungen und neue Download-Technologien (z. B. BitTorrent) erlauben es auch größere Video-Sequenzen - angekündigt als "Internet-TV" - zugänglich zu machen. Diese Form eines Blogs wird Video-Blog oder kurz Vlog genannt. Charakteristisch für Weblog Publishing Systeme ist, dass es mit ihnen sehr einfach ist, Webseiten zu publizieren. Weblog Publishing Systeme sind einfache Content-Management-Systeme, die ein einfaches Einfügen neuer Inhalte sowie die Veränderung bestehender Inhalte auch für Nutzer ermöglichen, die über keine oder nur geringe Webdesign-Kenntnisse verfügen. Die gestalterische Anpassung an die persönlichen Vorlieben des Nutzers lässt sich bei vielen Weblogs mit Hilfe von Templates vornehmen. Die Installation eigener Weblog-Software ist in vielen Fällen nicht notwendig. Die kostenlose Blogerstellung bei einem der großen Webloganbieter reicht in der Regel vollkommen aus. Manche sehen im Aufkommen von Blogs und deren starker Verbreitung insbesondere in den USA eine neue Form von Graswurzel-Journalismus, welches in Europa leicht in die Tradition des Herstellens von Gegenöffentlichkeit gestellt werden kann. Blogs haben mit Problemen wie Linkspamming und Trackback- oder Pingbackspamming (Blogspam) zu kämpfen. Suchmaschinen oder Alert-Dienste speziell für Weblog-Inhalte sind Technorati, Feedster, Intelliseek's Blogpulse, IceRocket und Google Blog Search. Siehe auch: Netzkultur, Podcasting, Trackback, Pingback, Vlog, WikiLog, Forum, RSS, Wahlblog

Literatur


- Sven Przepiorka: [http://www.tzwaen.com/publikationen/diplomarbeit.php Weblogs und deren technische Umsetzung] (Diplomarbeit) 2003
- Markus K. Westner: [http://westner.levrang.de/cms/front_content.php?idcatart=30&lang=1&client=1 Weblog service providing: Identification of functional requirements and evaluation of existing weblog services in German and English languages] (Masterarbeit) 2004
- Rebecca Blood: The weblog handbook: practical advice on creating and maintaining your blog. 2002. ISBN 0-73820756-X
- Don Alphonso, Kai Pahl (Hrsg): Blogs! Text und Form im Internet. 2004. ISBN 3-89602600-3
- Dirk Olbertz: Das Blog-Buch. 2004. ISBN 3-82726715-3
- Markus Christian Koch, Astrid Haarland: Generation Blogger. 2004. ISBN 3-82661400-3
- Erik Möller: Die heimliche Medienrevolution - Wie Weblogs, Wikis und freie Software die Welt verändern. 2005. ISBN 3-93693116-X
- Stephan Mosel: [http://weblog.plasticthinking.org/item/3779 Praktiken selbstgesteuerten Lernens anhand der Nutzung von web-basierten Personal-Publishing-Systemen] (Diplomarbeit) 2005
- [http://buch.blogtalk.net BlogTalks], hrsg. von [http://randgaenge.net Thomas N. Burg], 2 Bücher im Gefolge der Konferenz [http://blogtalk.net BlogTalk]. Akademisch-pragmatische Herangehensweise, alle Artikel in englisch.
- Ansgar Zerfaß, Dietrich Boelter: Die neuen Meinungsmacher. 2005. ISBN 3-901402-45-4

Weblinks


- [http://www.stefanbucher.net/weblogfaq/ Weblog-FAQ] Weiterführende Sammlung an Fragen und Antworten zum Thema Weblogs
- [http://unblogbar.com/software/ 27 Weblog-Systeme im Vergleich]
- [http://www.bloghaus.net/blogtools/ 20 Programme im Vergleich]
- [http://www.blogbooster.de/ Grund- und Aufbauwissen zu Blogs, Technik, Vermarktung und Blogsphäre]
- [http://www.ojour.de/forschung/index_weblogdossier.php onlinejournalismus.de] Dossier zum Thema Weblogs und Journalismus
- [http://westner.levrang.de/cms/front_content.php?idcat=19 Recherche zum Thema "Weblogs"]
- [http://www.barrierekompass.de/weblog/index.php?itemid=265 Weblogs als Content Management Systeme einsetzen] Artikelserie in zwei Teilen beim Barrierekompass
- [http://www.plasticthinking.org/wiki/WebLog PlasticWiki] Definitionsversuch: Über Weblogs, Weblogs im Radio, Weitere Artikel über Weblogs.
- [http://www.sixtus.net/article/612_0_2_0_C1/ Medienmacht Blogs] Kommunikationsgeflecht und Marketingfaktor, aus der c't. Kategorie:World Wide Web Kategorie:Netzkultur ! ja:ブログ ko:블로그 simple:Blog th:บล็อก zh-min-nan:Bāng-chì

Datenbank

Eine Datenbank ist die elektronische Form eines Karteikastens bzw. eines Systems zusammengehöriger Karteikästen. Es handelt sich um eine Sammlung von Daten, die aus der Sicht des Benutzers zusammengehören, z. B. eine Personaldatenbank oder eine Lagerinventardatenbank. Die Datenbank wird üblicherweise von einem Datenbankverwaltungssystem (engl. database management system, DBMS) verwaltet. Ein DBMS zusammen mit einer oder mehreren Datenbanken nennt man Datenbanksystem (DBS). Es gibt hierarchische, relationale (RDBMS), multidimensionale und objektorientierte Datenbanken. In der Praxis wird der Begriff "Datenbank" mehrdeutig verwendet. Er kann sowohl die gesamte Anwendung (DBMS, zugehörige Programme und Dateninhalte) im Sinne einer "Daten-Bank" bezeichnen (engl. databank), als auch den reinen Datenspeicher als technische Daten-Basis (engl. database). Ferner verwenden die einzelnen DBMS-Hersteller geringfügig voneinander abweichende Begrifflichkeiten dafür, was man genau unter einer Datenbank versteht: entweder alle Daten, die von einer DBMS-Installation bzw. -Instanz verwaltet werden, oder nur die jeweils inhaltlich zusammengehörigen Daten. Das grundlegende Element einer Datenbank ist der Datensatz. Jeder Datensatz besteht wiederum aus einer festen Anzahl von Datenelementen, den Attributen. Vergleicht man eine Datenbank mit einem Karteikasten-System, so entspricht ein Datensatz einer Karteikarte. Die Attribute sind dann Einträge innerhalb der Karte. Datensätze werden in den meisten Datenbanken in einer Tabelle gespeichert. Mehrere Tabellen können wiederum in einer inhaltlichen Beziehung zueinander stehen. So kann eine Tabelle, die Kundendaten speichert, in Zusammenhang mit einer Tabelle von gekauften Produkten stehen. Eine Firma kann so ermitteln, welcher Kunde welche Produkte gekauft hat.

Verwendung von Datenbanken

Datenbanken sind heute ein zentraler Bestandteil fast jedes Softwaresystems. Sie verwalten Lagerbestände eines Unternehmens, Patienteninformationen in Krankenhäusern, Telefondaten in der Auskunft, Finanztransaktionen in der Bank. Damit stellen sie einen kritischen Teil jedes Unternehmens und jeder Behörde dar. Von der Verfügbarkeit, Vollständigkeit und Richtigkeit der Daten hängt die Aktionsfähigkeit eines Unternehmens ab. Die vollständige Automatisierung von Lagerbeständen macht eine manuelle Verwaltung heute unmöglich. Der Verlust einer Lagerdatenbank kann somit das Unternehmen in sehr kurzer Zeit finanziell ruinieren, da georderte Produkte nicht ausgeliefert werden können oder gar die Aufträge selbst verloren sind. Die Datensicherheit ist daher ein wichtiger und gesetzlich vorgeschriebener Bestandteil der IT eines Unternehmens oder einer Behörde. Datenbankmanagementsysteme übernehmen somit eine wichtige Funktion eines Softwaresystems. Sie garantieren den schnellen und dauerhaften Zugriff auf die Daten sowie den Schutz gegen unerlaubten Zugriff und Systemfehler. Aus diesem Grunde sind Datenbankmanagementsysteme selbst hochkomplexe Softwaresysteme.

Beispiel von Datenbanktabellen

Die folgenden beiden Tabellen könnten so bei einem Händler verwendet werden: Beide Tabellen stehen in einer Beziehung zu einander. Jeder Titel gehört zu einer in CD gespeicherten CD. Die Zuordnung geschieht dabei über das Attribut CD_ID.

Geschichte

Die erste Generation von Datenbanken bestand aus Lochkarten. Ein Nachteil war, dass die Lochkarten hintereinander (sequentiell) gelesen werden mussten, was zur Folge hatte, dass alle Informationen, die vor der gesuchten standen, ausgelesen und verarbeitet werden mussten. Eine ähnliche Verarbeitungsform hatten Magnetbänder, auf denen nur sequentielle Daten gespeichert werden konnten. Die zweite Generation der Datenbanken wurde ca. 1960 entwickelt. Zu diesem Zeitpunkt begann man, die Daten auf Festplatten zu halten. Deren Eigenschaft des wahlfreien Zugriffs führte zu einem erheblichen Performance-Vorteil. Weiterhin erlaubte der Mehrbenutzerbetrieb vielen Benutzern den gleichzeitigen Zugriff auf die Datenbank. Zwischen 1965 und 1975 wurde die dritte Generation der Datenbanken entwickelt. In dieser Zeit entstanden das Hierarchische Datenbankmodell und die Netzwerkdatenbank. Im Gegensatz zu hierarchischen Datenbanken können in Netzwerkdatenbanken die Datensätze auf mehreren Wegen verknüpft sein und nicht nur entlang einfacher Eltern-Kind-Beziehungen. Eine heute noch häufig eingesetzte Netzwerkdatenbank ist IDMS der Firma Computer Associates. Einen wesentlichen Fortschritt erzielte in den 1960er und 1970er Jahren Edgar F. Codd mit seiner Forschungsarbeit am IBM Almaden Research Center in San Jose. Codd entwickelte die Grundlagen der ersten experimentellen relationalen Datenbank System R. Die Firma Oracle entwickelte das erste kommerzielle Datenbankmanagementsystem. Relationale Datenbanken sind heute am weitesten verbreitet. In ihnen werden Daten (Texte, Zahlen und Binärdaten) in Tabellen abgespeichert. Die Bezeichnung relational entstammt dem zugrunde liegenden mathematischen Modell, auf dem diese Datenbanken beruhen, der relationalen Algebra. Eine neuere Entwicklung sind objektorientierte Datenbanken (OODBMS). Bei relationalen Datenbanken geht es zuerst um die Struktur, in der die jeweiligen Daten gespeichert werden sollen. Objektorientierte Datenbanken dagegen folgen der objektorientierten Programmiermethode, d. h. es kommen erst die Daten, an denen sich die Datenbankstruktur dann orientiert. Eine hervorgehobene Eigenschaft von OODBMS ist die Möglichkeit, die Objekte der OO-Programmierungswelt mit wenig Programmieraufwand persistent zu machen, also zwischen Programmläufen abzuspeichern. Ein Beispiel für ein objektorientiertes Datenbankverwaltungssystem ist Caché von Intersystems.

Datenbankmodelle

Es gibt verschiedene Typen von Datenbanken. Im einfachsten Falle kann eine einfache Liste von Datensätzen eine Datenbank sein. Solche Daten werden als zeichenseparierte Datendatei (engl.: comma-separated value file oder kurz CSV file) bezeichnet. Dabei wird jeder Datensatz in einer Zeile gespeichert. Jede Zeile enthält die Attribute, die meist durch Kommata, oft aber auch (dem Namen widersprechend) Tabulatoren getrennt werden. Diese Vorgehensweise hat jedoch eine Reihe von schwerwiegenden Nachteilen. So ist zum Beispiel nicht vorhersehbar, was beim gleichzeitigen Zugriff mehrerer Benutzer auf diese Datei geschieht. Ausserdem gestaltet sich die Suche in den Daten als sehr aufwändig und muss immer wieder aufs neue erfunden werden. Wird die Datei sehr gross, so wirkt sich vor allem die mangelnde Fähigkeit zur Erstellung eines Indexes negativ auf die Ausführungsgeschwindigkeit aus. Die Datei wird stets mit einer linearen Suche komplett gelesen. Zu diesem Zwecke wurden Datenbank-Management-Systeme (DBMS) entwickelt, deren Aufgabe die Lösung aller Probleme der Datenverwaltung ist. Hierzu wurden verschiedene Konzepte entwickelt. Die wichtigsten sind:
- Relationalen Datenbankmodell (RDBMS)
- Objektorientiertes Datenbankmodell
- XML-Datenbankmodell Weiterhin gibt es einige weniger gebräuchliche Sonderfälle:
- Deduktive Datenbanken
- Multidimensionale Datenbanken
- Indexsequentielle Datenbanken (ISAM)
- Hierarchisches Datenbankmodell
- Netzwerkdatenbankmodell
- Verteiltes Datenbankmanagementsystem
- Postrelationales Datenbankmodell (Caché)
- Dokumentorientiertes Datenbankmodell (Lotus Notes)

Siehe auch


- Datenbanksysteme, alphabetische Liste
- Datenbankanwendung
- Informationssystem
- Datenbankmodell/Datenmodell bzw. ER-Modell
- Normalisierung (Datenbank)
- Tuning (Datenbank)

Literatur


- Ramez Elmasri, Shamkant B. Navathe: Grundlagen von Datenbanksystemen, Pearson Studium, ISBN 3-8273-7021-3
- Tobias Eggendorfer: Datenbanksysteme für Wirtschaftsinformatiker - Eine Einführung, Books on Demand, ISBN 3-8334-2493-1
- Helmut Eirund, Ullrich Kohl: Datenbanken, leicht gemacht. Ein Arbeitsbuch für Nicht-Informatiker, Teubner Verlag, ISBN 3-519-02644-9
- Alfons Kemper, André Eickler: Datenbanksysteme, Oldenbourg Verlag, ISBN 3-486-25706-4
- Gottfried Vossen: Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme, Oldenbourg Verlag, ISBN 3-486-25339-5
- Andreas Heuer, Gunter Saake: Datenbanken: Konzepte und Sprachen, MITP Verlag, ISBN 3-8266-0619-1
- Andreas Heuer, Gunter Saake, Kai-Uwe Sattler: Datenbanken: Implementierungstechniken, MITP Verlag, ISBN 3-8266-1438-0
- Carl A. Zehnder: Informationssysteme und Datenbanken, VDF Hochschulverlag, ISBN 3-7281-3002-8
- Markus Schneider: Implementierungskonzepte für Datenbanksysteme, Springer, ISBN 3-540-41962-4
- Josef L. Staud: Datenmodellierung und Datenbankentwurf - Ein Vergleich aktueller Methoden, Springer, ISBN 3-540-20577-2
- Matthias Schubert: Datenbanken - Theorie, Entwurf und Programmierung relationaler Datenbanken, Teubner, ISBN 3-519-00505-0
- DBLP: Bibliographisches Verzeichnis mit dem Schwerpunkt Datenbanksysteme und Logik Programmierung.
- Rolland, F. D.: Datenbanksysteme im Klartext, Pearson Studium, ISBN 3-8273-7066-3

Weblinks


- [http://www.kreissl.info/diggs/db_inhalt.php Einführung in Datenbankmanagementsysteme - Online Tutorial]
- [http://itse-guide.de/artikel/1 Grundlagen Datenbanken]
- [http://www.madeasy.de/2/datbank.htm Datenbanken - Das Wichtigste]
- [http://www.meddb.info/ Medizinische und Molekularbiologische Datenbanken]
- [http://dbwiki.de/ Datenbank-Entwickler Wiki]
- [http://opendb.de/ Portal zu Open Source Datenbanken] ja:データベース ko:데이터베이스 th:ฐานข้อมูล

Webseite

Eine Webseite ist ein Dokument im World Wide Web, das mit einem Webbrowser von einem Webserver abgerufen und dargestellt werden kann. Ein umgangssprachliches Synonym ist Internetseite. Im Deutschen werden die Begriffe "Webseite" und "Internetseite" wohl wegen der großen klanglichen Ähnlichkeit zum englischen Begriff Website oft fälschlicherweise auch für die gesamte Webpräsenz einer Firma, Organisation oder Privatperson benutzt. Das wesentliche Merkmal von Webseiten ist, dass sie Verweise (Hyperlinks) auf andere Webseiten enthalten und somit einen Hypertext darstellen. Jede Webseite hat eine Adresse (URL-Adresse), über die sie aufgerufen werden kann. Die Gesamtheit der Webseiten einer Organisation wird als Webpräsenz oder auch Internetpräsenz bezeichnet. Bei einzelnen Projekten einer Organisation oder Privatperson spricht man dabei eher von einer Website. Meistens entspricht sie der Gesamtheit der Seiten, die unter einer Domain erreichbar sind. Webseiten können statische (feste) Inhalte haben oder auch dynamische (d. h. die Inhalte werden bei jedem Aufruf neu generiert). Es kann auch eine Variante der Webseite erstellt und aufrufbar gemacht werden, z. B. eine Seite ohne Frames oder eine Druckversion. Webseiten bestehen zumeist aus strukturiertem Text, in den auch Bilder und andere Multimediaelemente eingebunden sein können. Webseiten werden meist aus dem Internet oder einem Intranet geladen, können aber auch auf einem lokalen Speichermedium, zum Beispiel einer Festplatte, abgelegt sein. Die [http://www.w3.org/History/19921103-hypertext/hypertext/WWW/Link.html erste Webseite] wurde am 13. November 1990 von Tim Berners-Lee auf einem NeXT Rechner verfasst und veröffentlicht – einen Tag, nachdem dieser gemeinsam mit Robert Cailliau ein neugefasstes Konzept für ein weltweites Hypertext-Projekt veröffentlicht hatte. Um Webseiten zu erstellen, kommt hauptsächlich die Beschreibungssprache HTML zur Anwendung, was jedoch langsam von XHTML abgelöst wird. Zusätzliche Technologien wie CSS und JavaScript werden in vielen aktuellen Webdokumenten verwendet, um die Darstellung im Webbrowser weiter zu beeinflussen.

Dynamische Webseiten

Im Gegensatz zu statischen Webseiten, die technisch eine einfache Datei auf dem Webserver darstellen, werden Seiten auch häufig dynamisch im Moment der Anforderung erzeugt. Das ist dann sinnvoll, wenn eine Webseite sehr aktuelle Informationen wie z. B. Börsenkurse oder das Wetter von morgen enthalten sollten. In diesem Fall führt der Webserver ein Programm aus, das vorher spezifisch für diese Aufgabe entwickelt wurde. Es trägt die Daten z. B. aus Datenbanken zusammen und erstellt das HTML-Dokument. Dieses wird dann vom Webserver an den Browser übertragen und beim Benutzer angezeigt. Ein anderer Anwendungsfall ergibt sich aus dem Bedürfnis, auf Eingaben des Benutzers zu reagieren. Diese Eingabe kann z. B. ein Suchbegriff in einer Suchmaschine sein. Die Software der Suchmaschine erstellt anhand des Suchbegriffs eine Liste von passenden Links und erzeugt eine Webseite, die dem Benutzer diese Liste komfortabel darstellt. Die Möglichkeit, Webseiten dynamisch in Abhängigkeit von Benutzereingaben und Datenbankinhalten zu generieren, machte das Web schnell zu einer universellen Plattform für alle Arten von Anwendungen. Die Vorteile liegen in Unabhängigkeit von Betriebssystemen und anderen Eigenschaften der Clients. Grundvoraussetzungen sind lediglich eine Netzwerkverbindung zum Server und ein Webbrowser. Zum Generieren von dynamischen Webseiten kommt jedes Programm in Frage, das sich auf dem Serversystem ausführen lässt. Um die Programmierung zu vereinfachen, wurden jedoch Standards wie das Common Gateway Interface eingeführt, um Webanwendungen auch unabhängig von der Art des Webservers zu machen. Aufgrund des rasant steigenden Bedarfes nach sehr leistungsfähigen Servern zum Betrieb von Web-Anwendungen entwickelten sich Technologien wie PHP, J2EE und .NET.

Siehe auch


- World Wide Web Consortium (W3C)
- Webdesign
- Webdesigner
- Webframework (Liste)
- Webtemplate

Weblinks


- [http://de.selfhtml.org/ de.selfhtml.org - die HTML-Referenz]
- [http://www.drweb.de/ drweb.de - Tipps zum Erstellen von Webseiten]
- [http://www.meine-erste-homepage.com/ meine-erste-homepage.com - Einsteigerportal mit Linksammlung zur Webseiten-Erstellung] Kategorie:World Wide Web ja:ウェブページ simple:Webpage th:เว็บเพจ zh-min-nan:Bāng-ia̍h

Metadaten

Als Metadaten oder Metainformationen bezeichnet man allgemein Daten, die Informationen über andere Daten enthalten. Bei den beschriebenen Daten handelt es sich oft um größere Datensammlungen (Dokumente) wie Bücher, Datenbanken oder Dateien. So werden auch Angaben von Eigenschaften eines Objektes (beispielsweise Personennamen) als Metadaten bezeichnet. Während der Begriff "Metadaten" relativ neu ist, ist sein Prinzip unter anderem jahrhundertelange bibliothekarische Praxis. Fehlen einem Text die Metadaten, so spricht man von Plaintext.

Beispiele

Typische Metadaten zu einem Buch sind beispielsweise der Name des Autors, die Auflage, das Erscheinungsjahr, der Verlag und die ISBN. Zu den Metadaten einer Computerdatei sind unter Anderem der Dateiname, die Zugriffsrechte und das Datum der letzten Änderung zu zählen.

Unterscheidung Daten - Metadaten

Eine allgemeingültige Unterscheidung zwischen Metadaten und normalen Daten existiert allerdings nicht, da die Bezeichnung eine Frage des Standpunkts ist: Für den Leser eines Buches sind der Inhalt die eigentlichen Daten, während der Name des Autors oder Nummer der Auflage Metadaten sind. Für den Herausgeber eines Bücherkatalogs sind diese beiden Eigenschaften aber unmittelbar interessant und dürften deshalb als eigentliche Daten betrachtet werden.

Verwendung von Metadaten

In vielen Fällen findet keine bewusste Trennung zwischen Objekt- und Metaebene statt. Beispielsweise spricht man davon, in einem Katalog ein Buch zu suchen und nicht nur seine Metadaten. Bei der Verwendung von Metadaten wird oft erwartet, dass sie durch direkte Koppelung mit den Nutzdaten untrennbare Bestandteile eines abgeschlossenen, sich selbst beschreibenden Systems sind. Metadaten werden oft dazu eingesetzt, um Informationsressourcen zu beschreiben und dadurch besser auffindbar zu machen und Beziehungen zwischen den Materialien herzustellen. Dies setzt in der Regel erst eine Erschließung mit einem gewissen Standardisierungsgrad (zum Beispiel durch Bibliothekarische Regelwerke) voraus.

Speicherung von Metadaten

Zur Speicherung und Übertragung von Metadaten gibt es eine Reihe von Datenformaten und Datenmodellen (Datenmodelle, wie beispielsweise Dublin Core, lassen sich auch in unterschiedlichen Formaten ausdrücken). Weiteres unter Metadatenformate. Siehe auch: Text Encoding Initiative (TEI), Resource Description Framework (RDF) Zur Speicherung von Metadaten gibt es verschiedene Möglichkeiten: # Im Dokument selbst. So ist in einem Buch stets auch der Autor und das Erscheinungsjahr verzeichnet. In HTML-Dokumenten werden mit Hilfe von Meta-Tags Sprache, Autor, Unternehmen und Schlagwörter angegeben, die beispielsweise von Suchmaschinen ausgewertet werden. # In zugeordneten Nachschlagewerken, zum Beispiel für ein Buch in einer Bibliothek im Bibliothekskatalog. # Bei Computerdateien in den Dateiattributen. Die meisten Dateisysteme erlauben nur genau festgelegte Metadaten in Dateiattributen; andere (z. B. HPFS mittels erweiterter Attribute) erlauben die Assoziation beliebiger Daten mit einer Datei. Auch ist es üblich, die Meta-Information "Dateityp" im Dateinamen unterzubringen; typischerweise in der Extension. Siehe auch: Attribut, Eigenschaft, semantisches Web, Datenverzeichnis, Repositorium,

Interoperable Metadaten

"Operabel" bedeutet in fachsprachlichen Fügungen zunächst "so beschaffen, dass damit gearbeitet, operiert werden kann". Die Vorsilbe "inter" stammt aus dem Lateinischen und bedeutet soviel wie "zwischen" (genauer: sie kennzeichnet in Bildungen mit Substantiven, Adjektiven oder Verben eine Wechselbeziehung zwischen zwei oder mehreren gleichartigen Dingen, die entweder besteht oder sich vollzieht. Auch: "zwischen", "unter", "inmitten". Vgl. DUDEN Wörterbuch). Interoperable Metadaten sind also Metadaten aus potenziell unterschiedlichen Quellen, zwischen denen ("inter") eine Beziehung in der Weise besteht, dass mit ihnen gemeinsam gearbeitet ("operiert") werden kann. Standards für interoperable Metadaten haben die Aufgabe, Metadaten aus unterschiedlichen Quellen nutzbar zu machen. Sie umfassen dazu zunächst folgende Aspekte:
- Semantik
- Datenmodell
- Syntax Die Semantik beschreibt die Bedeutung, die in der Regel von Normierungs-Gremien festgelegt wird (vgl. Dublin Core). Das Datenmodell legt fest, welche Struktur die Metadaten besitzen können. Als "Daten" lassen sich im Zusammenhang mit Metadaten Aussagen auffassen, die über ein zu beschreibendes Objekt (Dokument, Ressource, ...) getroffen werden. Als "Modell"-Komponente des Begriffs Datenmodell lässt sich eine Beschreibung dessen auffassen, wie die Aussagen strukturell beschaffen sind (der Begriff Datenmodell bedeutet damit im Kontext von Metadaten soviel wie "Grammatik" oder "Struktur von Aussagen"). Beispiele für Datenmodelle von Metadaten sind einfache Attribut/Wert-Kombinationen (z.B. HTML Meta-Tags) oder Sätze mit Subjekt, Prädikat und Objekt (z.B. Tripel in RDF). Die Syntax dient schließlich dazu, die entsprechend dem Datenmodell generierten Aussagen zu repräsentieren. Beispiel für ein Repräsentationsformat ist XML (eXtensible Markup Language). Zwischen diesen drei Aspekten besteht nun folgende Beziehung: Die Semantik wird durch Konstrukte des Datenmodells repräsentiert. Das Datenmodell wird wiederum durch syntaktische Konstrukte repräsentiert. Die syntaktischen Konstrukte werden schließlich aus Zeichen eines vereinbarten Zeichensatzes (z.B. Unicode) zusammengesetzt. Diese drei Aspekte lassen sich als hierarchisch übereinander liegende Schichten auffassen, da jede Schicht jeweils auf der darunter befindlichen Schicht aufbaut. Die Schichten sind dabei voneinander unabhängig, d.h. die Verwendung eines bestimmten Standards in einer Schicht erfolgt unabhängig von den anderen Schichten (siehe dazu auch die Schichtenmodelle der Netzwerkkommunikation, z.B. das ISO/OSI-Schichtenmodell). So kann eine bestimmte Semantik durch Konstrukte verschiedener Datenmodelle repräsentiert werden (z.B. Attribut/Wert-Kombination, Tripel), die wiederum durch verschiedenen Syntaxen repräsentiert werden können (z.B. Graphen, XML-Formate). Orthogonal zu diesen Schichten liegt als vierter Aspekt die Identifizierung, die alle drei Schichten betrifft. Um Metadaten verschiedener Quellen sinnvoll verarbeiten zu können, muss (weltweit) eindeutig gekennzeichnet werden, um welche Semantik, welches Datenmodell und welche Syntax es sich handelt. Hierzu ist ein Identifikationsmechanismus erforderlich, wie ihn z.B. die URIs (Uniform Resource Identifier) bereitstellen. URIs Alle vier Aspekte - Semantik, Datenmodell, Syntax und Identifizierung - sind erforderlich, um Standards für interoperable Metadaten zu schaffen. Sie können daher gemeinsam in ein Rahmenwerk (engl. Framework) eingeordnet werden. Wörtlich übersetzt heißt Framework entweder "Gerippe", "Gerüst", "Rahmen" oder "Bezugssystem". Ein Rahmenwerk bietet also eine Art Grundgerüst oder Gerippe, das bereits die wichtigsten Elemente bzw. Komponenten eines Systems und deren Beziehungen beschreibt, jedoch ohne genaue Vorgaben hinsichtlich deren Ausgestaltung zu machen. Es fungiert somit als eine Art "Bezugsrahmen" oder "Bezugssystem", das die sinnvolle Eingliederung neuer Komponenten ermöglicht. Da ein Rahmenwerk Elemente und deren Beziehungen zeigt, kann dies leicht durch die grafische Anordnung von Elementen visualisiert werden. Abb. 1 zeigt ein Rahmenwerk für Metadaten, auf einer Meta-Ebene. Im Gegensatz zu konkreten Ausprägungen von Rahmenwerken, d.h. also der Ausprägungs- oder Instanzenebene, beschreibt ein Rahmenwerk auf der Meta-Ebene ein verallgemeinertes Rahmenwerk - erkennbar an den generischen Bezeichnungen der Bestandteile. Als Beispiel für ein konkretes Rahmenwerk für Metadaten sei RDF (Resource Description Framework) des W3C (World Wide Web Consortium) genannt. RDF enthält alle der oben genannten vier Aspekte mit spezifischen Ausprägungen, wie in Abb. 2 dargestellt. W3C Die Komponenten im Detail:
- Semantik: Domänenspezifische Semantiken können über Namensräume importiert werden, womit die Semantik eines RDF-Vokabulars beliebig erweitert werden kann
- Datenmodell: RDF besitzt ein festgelegtes Datenmodell, das Aussagen über Ressourcen in Form von Tripeln mit Subjekt, Prädikat und Objekt gestattet
- Syntax: Zur Repräsentation solcher Aussagen kann eine beliebige Syntax verwendet werden, z.B. RDF/XML, Graphen, oder die N-Triple-Notation; RDF/XML ist jedoch die normative Syntax
- Identifikation: Als universeller Identifikations-Mechanismus werden URIs verbindlich vorgeschrieben Der Idee eines Rahmenwerkes folgend definiert RDF selbst keine domänenspezifische Semantik, sondern spezifiziert lediglich einen Mechanismus, wie über Namensräume mit Hilfe einer URI weitere Semantiken eingebunden werden können. Verbindlich legt RDF hingegen ein gemeinsames Datenmodell in Form von Tripeln fest sowie die universelle Verwendung von URIs als Identifikationsmechanismus. Diese werden sowohl eingesetzt, um die einzelnen Komponenten eines Tripels (Subjekt, Prädikat, Objekt) zu kennzeichnen, als auch deren Werte und Datentypen. Die konkrete Syntax zur Repräsentation der Tripel kann jedoch, wiederum dem Gedanken eines Rahmenwerkes folgend, frei gewählt werden, wobei RDF/XML als Standard vorgesehen ist. Mit RDF Schema enthält RDF außerdem noch eine Schema-Sprache, um eigene Metadaten-Vokabulare zu definieren. RDF Schema verhält sich zu RDF ähnlich wie XML Schema zu XML. Ein RDF Schema ist gleichzeitig ein gültiges RDF-Dokument, ebenso ist ein XML Schema gleichzeitig ein gültiges XML-Dokument. In beiden Fällen handelt es sich also um spezialisierte Teilmengen einer Auszeichnungssprache. Während XML Schema jedoch syntaktische Einschränkungen beschreibt, z.B. Elementnamen, Häufigkeit des Auftretens etc., beschreibt RDF Schema semantische Einschränkungen, also z.B. dass ein Attribut "hasPublished" nur auf Instanzen der Klasse "Mensch" oder "juristischePerson" angewendet werden darf, nicht jedoch auf Instanzen der Klasse "Tier" - in der Schemasprache formuliert, hat das Attribut "hasPublished" die Domäne "Mensch" oder "juristischePerson". Wie XML dem Grundsatz der Einfachheit und Erweiterbarkeit folgend die Welt der Daten gründlich veränderte, in dem es durch eine einheitliche Syntax, ein genormtes Typsystem und seine Textbasiertheit die Definition problemlos zwischen verschiedenen Systemen und Programmen austauschbarer Datenformate ermöglichte, versucht RDF die Welt der Metadaten durch ein einheitliches Datenmodell zu verändern. Durch den Charakter eines Rahmenwerkes knüpft RDF dabei ebenfalls an bewährte Grundsätze wie Einfachheit und Erweiterbarkeit an.

Metadaten in der Statistik

In statistischen Datenbanken werden diejenigen Daten als Metadaten bezeichnet, die nicht direkt den Inhalt einer Statistik darstellen, z. B. Branchen- oder Berufsbezeichungen, Gemeindeverzeichnisse und andere Kataloge. Zu den statistischen Metadaten zählen auch Beschreibungen der Datenfelder in Umfrageformularen, u.U. auch komplette Formularbeschreibungen. Die eigentlichen statistischen Daten bezeichnet man in Abgrenzung zu den Metadaten als Mikrodaten und Makrodaten.

Metadaten in der Softwareentwicklung

In der Softwareentwicklung bezeichnet man Bestandteile eines Programmquelltextes als Metadaten, die nicht vom eigentlichen Übersetzungswerkzeug, meist einem Compiler, sondern Zusatzwerkzeugen ausgewertet werden. Diese Metadaten werden meist zur Dokumentation oder mit Hilfe von Annotationen zur Codegenerierung eingesetzt. Beispiele für Metadaten in der Softwareentwicklung sind die Annotations in Java oder die von XDoclet oder JavaDoc ausgewerteten Dokumentationskommentare. Eine von der klassischen Programmierung abweichende Form ist die Verwendung von Metadaten in Universal-Software. Hierbei sind die meisten benötigten Anwendungsfunktionen vorkompiliert vorhanden und werden über eine Metadaten-Engine aufgerufen und parametrisiert. Die gewünschte Zielanwendung muss vorher mittels spezifischer Metadaten deklarativ beschrieben werden. Dieser Ansatz wird insbesondere von Data Warehouse- und Business Intelligence - Produkten verfolgt. Einige Hersteller wie Tenfold und Scopeland wenden dieses Prinzip auch auf die Erstellung schreibender Datenbankanwendungen an. Dieser s.g. Universal Application - Ansatz verspricht drastische Kostensenkungen bei der Erstellung von Anwendungssoftware und eine anders nicht zu erreichende Flexibilität der so erstellten Lösungen.

Literatur


- Schmidt, Ingrid: Modellierung von Metadaten. In: Lobin, Henning / Lemnitzer, Lothar: Texttechnologie. Perspektiven und Anwendungen. Tübingen:Stauffenburg 2004, S. 143-164

Weblinks


- [http://www.informatik.hu-berlin.de/~legler/studium/dwh/metadata_termpaper_german.pdf Zu Metadaten im Data Warehouse]
- [http://www2.sub.uni-goettingen.de/intrometa.html zu Definition von Metadaten] Kategorie:Dokumentation ja:メタデータ

PDF

Das Portable Document Format (PDF) ist ein plattformübergreifendes Dateiformat für druckbare Dokumente, das von der Firma Adobe Systems entwickelt und 1993 mit Acrobat 1 veröffentlicht wurde. PDF ist ein proprietäres, aber offengelegtes Dateiformat, das im PDF Reference Manual von Adobe dokumentiert ist. Eine Teilmenge des Formats ist inzwischen als PDF/X und PDF/A von der ISO genormt worden. In der Startphase war der Adobe Reader kostenpflichtig. Erst die kostenfreie Weitergabe der Software ermöglichte die Verbreitung im heutigen Ausmaß. Die aktuelle Version des PDF-Dateiformats ist 1.6 und kann mit Acrobat ab Version 7 verarbeitet werden. PDF-Dateien geben das mit dem Erstellungsprogramm erzeugte Layout in einer vom Drucker und von Voreinstellungen unabhängigen weitgehend orginalgetreuen Darstellung wieder. Ein häufig verwendetes Programm zur Erzeugung von PDF ist Adobe Acrobat Distiller, der aus PostScript-Dateien PDF erstellt. Der Distiller ist verfügbar für Windows und Mac. Diverse Office- und DTP-Anwendungen von Drittherstellern bieten einen direkten PDF-Export an und sind auf vielen Plattformen verfügbar. Mit weiteren Werkzeugen lassen sich – oft über den Druckbefehl, bei größeren Datenmengen aber meist mit einer Programmiersprache aus einer Datenbank heraus – PDF-Dateien einfach und schnell erstellen. Die Erzeugung von PDF-Dateien ist damit auf jeder Plattform möglich. Durch Offenlegung und Normung von PDF können Drittentwickler unabhängig von Adobe PDF-Werkzeuge bereitstellen. PDF basiert zu großen Teilen auf dem PostScript-Format, das ebenfalls offengelegt ist.

Verwendung und Vorteile

Eine PDF-Datei gibt die Dokumente des Ursprungsprogramms einschließlich aller Schriften, Farben, Raster- und Vektorgrafiken präzise wieder. Diese Dokumente können eine oder tausende Seiten Umfang haben, wobei jede auf eine maximale Seitengröße von 508 x 508 cm beschränkt ist. Das PDF-Format basiert auf dem gleichen Grafikmodell wie PostScript. Im Gegensatz zu PostScript ist es aber keine Programmiersprache, sondern eine Dokumentenbeschreibungssprache. PDF erlaubt eine genauere Strukturierung von Dokumenten, als das mit Postscript möglich ist. Schriften (außer Pixelschriften) jeglicher Art und Vektorgrafiken können dabei beliebig ohne Qualitätsverlust vergrößert werden. Große Netzwerkpläne und Datenmodelle lassen sich unter diesen Voraussetzungen auf einer PDF-Seite unterbringen. Aus PDF-Dokumenten lassen sich Textpassagen, Tabellen und Grafiken (und auch Ausschnitte davon) leicht in anderen Anwendungsprogrammen durch Kopieren und Einfügen der jeweiligen Elemente weiterverarbeiten. Text kann nicht nur zur Weiterverarbeitung in anderen Anwendungen, sondern auch zum Durchsuchen oder zur Verwendung mit anderen Ausgabemedien wie beispielsweise Screenreadern extrahiert werden. Durch die Textsuche im einzelnen Dokument oder die Volltextrecherche innerhalb einer PDF-Dokumentensammlung lassen sich sehr einfach Detailinhalte auffinden. Dies funktioniert selbst dann, wenn der Text grafisch verzerrt, z.B. in Kreis- oder Kurvenform dargestellt ist. Eine Besonderheit des PDF-Formats ist der optionale Dokumentenschutz mit 40- oder 128-Bit-Verschlüsselung. Der Ersteller eines Dokuments kann damit gezielt die Rechtevergabe des betreffenden Dokuments bestimmen. So kann verhindert werden, dass Benutzer das Dokument abändern, ausdrucken oder Teilinhalte kopieren können. Zu diesem Zweck ist in jedem Fall ein Besitzerpasswort festzulegen. Soll das Dokument nur einem beschränkten Personenkreis zugänglich sein, kann zusätzlich auch ein Benutzerpasswort vergeben werden, von dem zugleich die Verschlüsselung abgeleitet wird. Durch entsprechende PDF-Werkzeuge lassen sich auch Rechte vergeben, die es ermöglichen, PDF-Dokumente mit Notizen, Kommentaren und Dateianhängen zu versehen oder Formulareinträge abzuspeichern. Ursprünglich konnten diese Merkmale nur mit Adobe Acrobat genutzt werden, seit Version 7 ist es jedoch auch mit dem kostenlosen Adobe Reader möglich, Notizen und Kommentare hinzuzufügen, sofern das entsprechende Dokument vom Verfasser mit den notwendigen Berechtigungen versehen wurde. Ursprünglich war das PDF-Format ein reines Ausgabe- bzw. Druckformat. Später gab es auch Programme, mit denen man fertige PDF-Dateien verändern kann, zum Beispiel mit dem Adobe Designer. Das Format ist nicht mit den internen Dateiformaten von Textverarbeitungsprogrammen vergleichbar und eignet sich, abgesehen von der Notiz- und Kommentarfunktion, nur begrenzt zur Weiterverarbeitung von Dokumenten. Es ist allerdings innerhalb gewisser Grenzen möglich, beispielsweise Tippfehler zu entfernen. Vorteile im Desktop Publishing sind für Grafiker und Designer die Einbindung aller Elemente für die Druckerstellung. PDF-Dokumente können abhängig vom Einzelfall sowohl größer als auch kleiner als die Dateien der Ursprungsanwendung sein. Die Größe eines Dokuments hängt von der Art der enthaltenen Daten, von der Effizienz des Erstellungsprogramms und davon ab, ob Schriftarten eingebettet wurden. Schriften können entweder vollständig, als Untermenge der tatsächlich im Dokument verwendeten Zeichen oder aber überhaupt nicht eingebettet werden. Soll ein Dokument unabhängig davon, ob auf der Zielplattform die verwendeten Schriften installiert sind, zuverlässig darstellbar sein, müssen mindestens die tatsächlich verwendeten Zeichen eingebettet werden. Das PDF-Format wurde im Laufe seiner Entwicklung mehrfach auf spezielle Anforderungen für die Verwendung im Internet angepasst. So musste ein Dokument ursprünglich vollständig verfügbar sein, um dargestellt werden zu können. Inzwischen ist es möglich, PDF-Dokumente zu linearisieren, so dass bereits Teile eines Dokuments während des Ladevorgangs dargestellt werden können. Seit der Version 1.5 der PDF-Spezifikation kann der größte Teil der Dokumentstruktur komprimiert werden. Heute ist es möglich, interaktive PDF-Formulare zu gestalten. In ihnen kann man in bestimmten Eingabefeldern Werte eingeben. Es ist auch möglich, Dokumente als Bild einzuscannen und zusätzlich die entsprechenden Informationen als durchsuchbaren Text im gleichen PDF-Dokument zu erzeugen.

PDF in Betriebssystemen

Das Einsatzgebiet von PDF ist vielfältig. So ist es nicht verwunderlich, dass mit dem Betriebssystem Mac OS X von Apple erstmals PDF als Standardformat für die Bildschirmausgabe verwendet wurde. Die Vorteile liegen auf der Hand: Mit Hilfe von PDF ist erstmals echtes WYSIWYG möglich. Weitere Features sind Textglättung in allen Anwendungen sowie die PDF-Erzeugung aus jeder Anwendung heraus, die einen Druckdialog besitzt. PDF wird auch zur Erzeugung der Druckdaten verwendet, damit ist es möglich, PostScript auf Nicht-Postscript-Druckern auszugeben. Unter Windows wie auch unter GNU/Linux gibt es den kostenlosen Acrobat Reader, um .PDF Dateien anzuschauen. Für Linux gibt es zusätzlich das äusserst schnelle Programm XPDF, welches auf die grundlegendsten Funktionen (Anzeige auf Bildschirm, Durchsuchen des Dokuments, Ausdrucken) reduziert ist, und deshalb viel schneller geladen und gestartet werden kann. Siehe auch: Display Postscript

Boxen im PDF

Die verschiedenen Boxen in einem PDF-Dokument sind vor allem in der Druckindustrie sehr wichtig, da fehlerhafte PDF-Dateien nicht korrekt gedruckt werden können. In der Druckindustrie wird meist der Adobe Acrobat Distiller für die PDF-Erzeugung eingesetzt, da dieser ein standardkomformes PDF-Dokument erzeugt.

MediaBox

Sie definiert die Größe des Ausgabemediums und den Medienrahmen des PDF-Dokumentes. Das Dokument ist noch nicht beschnitten und enthält oft die im PDF-Generator eingestellte PostScript-Seitengröße. Die Media Box muß immer die größte aller Boxen sein, da sie alle andern (nachfolgend erläuterten) Boxen mit einschließen muss.

BleedBox

Eine Bleedbox beinhaltet Informationen über die Anschnittrahmen, die die Größe des Endformates mit einem Beschnitt definiert. In der Druckindustrie wird ein Beschnitt von minimal 3 mm pro Seite benötigt. Ein Anwendungsbeispiel sind Bilder, die angeschnitten werden sollen und somit aus dem Rand des Druckes laufen. Für eine A4 Seite, die an eine Druckerei geliefert werden soll, ergibt sich somit eine Breite von 210 mm + 6 mm und eine Länge von 297 mm + 6 mm (A4 extra mit 216 x 303mm). Dies muß zwingend eingehalten werden um keine Blitzer zu erzeugen, da die Druckmaschine etwas variieren kann.

TrimBox

Die TrimBox ist das Endformat einer PDF-Datei ohne Beschnitt und wird auch Endformatrahmen genannt. In der Software Adobe Acrobat wird diese als Crop-Box oder Maskenrahmen bezeichnet, und beinhaltet ebenfalls das beschnittene Format; bei der Crop-Box sind jedoch noch die Informationen, die sich noch außerhalb der Box befinden, vorhanden und werden lediglich ausgeblendet.

Art Box (auch Bounding Box)

Dies stellt den Objektrahmen dar, das heißt, diese Box ist die kleinstmögliche Box, die alle Objekte einschließt, die sich auf der PDF-Seite befinden. Sie gibt auch die Größe der Grafik beim Import einer Datei (beispielsweise EPS) an.

PDF in der Druckvorstufe

Ziel der Boxinformationen ist es, ein PDF in der Druckvorstufe besser weiterverarbeiten zu können. Heute müssen viele PDF noch manuell nachbearbeitet werden, um sie auch in einer Druckmaschine drucken zu können, da nur wenige Programme die Informationen gut einbinden (beispielsweise InDesign oder QuarkXPress). Als Hilfsmittel in der Druckvorstufe sind unter anderem die Softwareprodukte Asura, Speedflow, PitStop Professional, Prinegy, Prinect Printready und Puzzleflow verbreitet, welche PDF-Dateien für den Druck aufbereiten können.

Programme zu Erstellung von PDF für die Druckvorstufe

Es führen zwei Wege zur Erstellung: Entweder durch die Verwendung eines Druckertreibers auf Postscript-Basis, oder direkte PDF-Erzeugung, bei der die Postscript-Daten unsichtbar sind beziehungsweise nur temporär benötigt werden. Beispiele für ein "druckbares" PDF, wenn alle Einstellungen richtig sind (siehe auch PDF/X):
- Adobe Druckertreiber für eine PS,
- Acrobat Distiller für ein PDF

Programme zum Betrachten von PDF-Dateien


- Freeware-Programme
  - Adobe Reader / Acrobat Reader (Windows, Mac OS, UNIX)
  - [http://www.foxitsoftware.com/pdf/rd_intro.php Foxit PDF Reader] (Windows)
  - [http://www.cs.wisc.edu/~ghost/gsview/ GSview] (Windows, OS/2)
  - [http://www.visagesoft.com/products/pdfreader/index.php eXPert PDF Reader] (Windows)
  - [http://www.cadkas.de/downgerpdf16.php CAD-KAS PDF Reader] (Windows)
  - [http://www.bravaviewer.com/ Brava! Reader]
  - [http://www.apple.com/macosx/features/pdf/ Apple Vorschau (engl. Preview)] (Mac OS X) - integraler Bestandteil des Betriebssystems
- Open-Source-Programme
  - Xpdf (X11)
  - [http://www.gnome.org/projects/evince/ evince] und Gpdf (GNOME, basierend auf Xpdf)
  - Kpdf (KDE, basierend auf Xpdf)
  - [http://www.cs.wisc.edu/~ghost/gv/ Ghostview], gv (X11) in Zusammenarbeit mit Ghostscript
  - GGv (GNOME, basierend auf Ghostscript)
  - KGhostview (KDE, basierend auf Ghostscript)
- Systeminterne Dienstprogramme
  - [http://www.apple.com/macosx/features/pdf/ Vorschau] (Mac OS X) - integraler Bestandteil des Betriebssystems
  - PDFViewer (PC/GEOS und DOS)
- Online-Betrachtung (keinerlei Installation nötig)
  - [http://view.samurajdata.se Online-Viewer] für
- .pdf,
- .ps und
- .doc

Programme zum Erstellen von PDF-Dateien


- Adobe Acrobat Distiller, Adobe Illustrator, Adobe Photoshop, Adobe InDesign, Adobe Elements, Freehand
- Mac OS X (im aktuellen Betriebssystem von Apple kann aus jedem druckfähigen Programm ein PDF erzeugt werden)
- StarOffice und OpenOffice.org können jedes Dokument als PDF speichern
- CorelDRAW, Corel WordPerfect
- QuarkXPress
- KOffice,