Home About us Products Services Contact us Bookmark
:: wikimiki.org ::
BASE (Suchmaschine)

BASE (Suchmaschine)

BASE (Bielefeld Academic Search Engine) ist eine multidisziplinäre Suchmaschine der Universität Bielefeld für wissenschaftliche Internet-Quellen, die von der Universitätsbibliothek Bielefeld basierend auf der Technologie der norwegischen Firma FAST Search & Transfer entwickelt wurde. Die Universitätsbibliothek Bielefeld hat BASE 2004 in Betrieb genommen, im August 2005 erfolgte die Vorstellung einer verbesserten Version. Ziel ist es, die hohe Relevanz der Quellen aus Datenbanken und wissenschaftlichen Web-Seiten mit der Einfachheit der Bedienung einer Suchmaschine zu kombinieren. BASE durchsucht unterschiedliche digitale Sammlungen (Dokumentenserver von Hochschulen, Preprint-Server, Server von Retrodigitalisaten, Projekt Gutenberg usw.), die für die Forschung relevant sind. Die indexierten Dokumente sind zum größten Teil frei im Volltext zugänglich. Derzeit sind über 2,3 Mio. Dokumente aus 130 Quellen erfasst (Stand: 16.8.2005). Die Ergebnisanzeige in BASE unterscheidet sich vom Suchmaschinenstandard durch eine differenzierte Anzeige von Metadaten, wenn solche im Dokument vorhanden. Daneben werden Möglichkeiten zur Sortierung der Trefferliste und zur Suchverfeinerung, auf Metadatenebene nach Autoren und Klassifikation und nach formalen Aspekten wie Dokumentformat angeboten.

Weitere wissenschaftliche Suchmaschinen


- Campus Search
- CiteSeer
- Forschungsportal.Net
- Google Scholar
- OAIster
- Scirus
- Vascoda

Siehe auch


- Deep Web

Weblinks


- [http://digital.ub.uni-bielefeld.de/ BASE-Suchmaske]
- [http://www.base-search.net/about_sources.html Liste der indexierten Quellen]
- [http://www.heise.de/newsticker/meldung/mail/49201 Suchmaschine für das akademische Internet (heise.de)]
- [http://www.ub.uni-bielefeld.de/biblio/projects/mathdem.htm Projektbeschreibung] Kategorie:Suchmaschine

Suchmaschine

Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z. B. dem World Wide Web gespeichert sind. Nach Eingabe eines Suchbegriffs liefert eine Suchmaschine eine Liste von Verweisen auf möglicherweise relevante Dokumente, meist dargestellt mit Titel und einem kurzen Auszug des jeweiligen Dokuments. Dabei können verschiedene Suchverfahren Anwendung finden. Die wesentlichen Bestandteile bzw. Aufgabenbereiche einer Suchmaschine sind
- Erstellung und Pflege eines Indexes (Datenstruktur mit Informationen über Dokumente),
- Verarbeiten von Suchanfragen (Finden und Ordnen von Ergebnissen) sowie
- Aufbereitung der Ergebnisse in einer möglichst sinnvollen Form. In der Regel erfolgt die Datenbeschaffung automatisch, im WWW durch Webcrawler, auf einem einzelnen Computer durch regelmäßiges Einlesen aller Dateien in vom Benutzer spezifizierten Verzeichnissen im lokalen Dateisystem.

Arten von Suchmaschinen

Websuchmaschinen sind die bekannteste Form von Suchmaschinen. Sie durchsuchen das World Wide Web, das meistgenutzte Dateiformat ist hierbei HTML. Metasuchmaschinen schicken Suchanfragen parallel an mehrere normale Suchmaschinen und kombinieren die Einzelergebnisse zu einer Ergebnisseite. Als Vorteil ist die größere (da kombinierte) zugrundeliegende Datenmenge zu nennen. Ein Nachteil ist die lange Dauer der Anfragebearbeitung. Außerdem ist das Ranking durch reine Mehrheitsfindung (welche Seite taucht in den meisten verwendeten Suchmaschinen auf?) von fragwürdigem Wert. Metasuchmaschinen sind vor allem bei selten vorkommenden Suchbegriffen von Vorteil. Als Desktop-Suchmaschine werden neuerdings Programme bezeichnet, welche den lokalen Datenbestand eines einzelnen Computers durchsuchbar machen. Wird die Datenbeschaffung manuell mittels Anmeldung oder durch Lektoren vorgenommen, handelt es sich nicht um eine Suchmaschine sondern um einen Katalog (auch Verzeichnis genannt). In solchen Verzeichnissen wie beispielsweise Yahoo! und dem Open Directory Project sind die Dokumente hierarchisch in einem Inhaltsverzeichnis nach Themen organisiert. So genannte Echtzeit-Suchmaschinen starten den Indexierungsvorgang erst nach einer Anfrage. So sind die gefundenen Seiten zwar stets aktuell, die Qualität der Ergebnisse ist aber aufgrund der fehlenden breiten Datenbasis insbesondere bei weniger gängigen Suchbegriffen schlecht.

Ranking / Suchrang

Die Darstellung der Suchergebnisse geschieht sortiert nach Relevanz (Ranking bzw. Suchrang), wofür jede Suchmaschine ihre eigenen, meist geheim gehaltenen Kriterien heranzieht. Dazu gehören:
- Häufigkeit und Stellung der Suchbegriffe im jeweiligen gefundenen Dokument.
- Einstufung und Anzahl der zitierten Dokumente.
- Häufigkeit von Verweisen anderer Dokumente auf das im Suchergebnis enthaltene Dokument sowie in Verweisen enthaltener Text.
- Einstufung der Qualität der verweisenden Dokumente (ein Link von einem „guten“ Dokument ist mehr wert als der Verweis von einem mittelmäßigen Dokument). Größere Bekanntheit erlangt hat PageRank, eine Komponente des Ranking-Algorithmus der erfolgreichen Suchmaschine Google. Manche Suchmaschinen sortieren Suchergebnisse nicht nur nach Relevanz für die Suchanfrage, sondern lassen gegen Bezahlung auch Einflussnahme auf ihre Ausgabe zu. In den letzten Jahren hat sich allerdings bei den großen Anbietern eine Trennung zwischen Suchergebnissen und als "bezahlte Treffer" markierte eingeblendeter Werbung durchgesetzt. Die "bezahlten Treffer" werden kontextbezogen zur Suchanfrage ausgegeben.

Geschichte

Archie kann als ältester Vorfahre der heute allseits bekannten Suchmaschinen und Webverzeichnisse angesehen werden. Der erste Vorläufer der heutigen Suchmaschinen war eine im Jahr 1991 an der University of Minnesota maßgeblich von Paul Lidner und Mark P. McCahill entwickelte Software namens Gopher. Sie wurde als Campuswide Information System (CWIS) zur Vernetzung der dortigen Informationsserver entwickelt und basiert auf dem Client-Server-Prinzip. Die Struktur von Gopher war für den damaligen Zeitpunkt richtungsweisend; alle Gopher-Seiten wurden katalogisiert und konnten vom Gopher-Sucher Veronica (Very Easy Rodent-Oriented Net-wide Index to Computerized Archives) komplett durchsucht werden. Allerdings verschwand Gopher schon einige Jahre später, vermutlich vor allem wegen der fehlenden Möglichkeit, Bilder und Grafiken einzubinden. Mit der Freigabe des WWW-Standards zur kostenlosen Nutzung 1993 und einer handvoll Webseiten begann die einzigartige Erfolgsgeschichte des weltweiten Datennetzes. Der erste Webcrawler namens The Wanderer wurde im selben Jahr von Mathew Gray programmiert, einem Studenten des Massachusetts Institute of Technology (MIT). The Wanderer durchsuchte und katalogisierte von 1993 bis 1996 halbjährlich das zu dieser Zeit noch sehr übersichtliche Web. Im Juni 1993 wurden insgesamt 130 Websites gezählt. Im Oktober des gleichen Jahres wurde Aliweb (Archie-Like Indexing of the Web) entwickelt, bei dem die Betreiber von Webservern eine Beschreibung ihres Dienstes in einer Datei ablegen mussten, um so ein Teil des durchsuchbaren Index zu werden. Im Dezember 1993 gingen die Suchmaschinen Jumpstation, WorldWideWeb Worm und RBSE Spider ans Netz. Die beiden erstgenannten waren Crawler, die Webseiten nach Titel und URL indexierten. RBSE Spider war die erste Suchmaschine, die ihre Ergebnisse nach einem eigenen Ranking-System sortiert anzeigte. Keine dieser Suchmaschinen bietet heute noch ihre Dienste an. Im April 1994 ging eine weitere Suchmaschine namens WebCrawler online, die ebenfalls eine nach Ranking sortierte Trefferliste vorweisen konnte. 1995 wurde sie an AOL verkauft, ein Jahr später weiter an Excite. Im Mai begann die Arbeit von Michael Mauldins an der Suchmaschine Lycos, die im Juli 1994 online ging. Neben der Worthäufigkeit der Suchbegriffe innerhalb der Webseiten durchsuchte Lycos auch die Nähe der Suchbegriffe untereinander im Dokument. Im selben Jahr riefen David Filo und Jerry Yang, beide damals Studenten des Fachbereichs Elektrotechnik an der Stanford University, eine Sammlung ihrer besten Web-Adressen in einem online verfügbaren Verzeichnisdienst ins Leben – die Geburtsstunde von Yahoo! (für Yet Another Hierarchical Officious Oracle). Das Jahr 1995 sollte eine bedeutende Trendwende für die erst kurze Geschichte der Suchmaschinen werden: In diesem Jahr wurden erstmals Suchmaschinen von kommerziellen Firmen entwickelt. Aus diesen Entwicklungen entstanden Infoseek, Architext (wurde später in Excite umbenannt) und AltaVista. Ein Jahr später wurde Inktomi Corp. gegründet, deren gleichnamige Suchmaschine zur Grundlage von Hotbot und anderen Suchseiten wurde. Führend in dieser Zeit war der Verzeichnisdienst von Yahoo, aber AltaVista (der Name bedeutet „Blick von oben“, ist aber auch ein Wortspiel den Standort Palo Alto betreffend) wurde zunehmend populär. 1996 war das Startjahr von zwei Metasuchmaschinen. MetaCrawler erblickte in den USA das Licht der Welt und - in Deutschland - MetaGer. Bis zur Marktdurchdringung von Google galten Metasuchmaschinen als eine der interessantesten Informationsbeschaffer, da der Suchindex der Suchmaschinen meist nur Teilbereiche des Internets enthielt. Metasuchmaschinen leiten die Abfragen des Nutzers parallel an mehrere Suchmaschinen weiter und fassen die Treffer formatiert zusammen. Ende 1998 veröffentlichten Larry Page und Sergey Brin ihre innovative Suchmaschinen-Technologie in dem Artikel The Anatomy of a Large-Scale Hypertextual Web Search Engine. Diese Arbeit stellte den Startschuss für die bisher erfolgreichste Suchmaschine der Welt dar: Google. Im September 1999 erreichte Google Beta-Status. Die geordnete Benutzeroberfläche, die Geschwindigkeit und die Relevanz der Suchergebnisse bildeten die Eckpfeiler auf dem Weg, die computererfahrenen Nutzer für sich zu gewinnen. Ihnen folgten in den nächsten Jahren bis heute Scharen von neuen Internetbenutzern. Doch Google dominiert den Suchmaschinenmarkt nicht allein, durch spektakuläre Aufkäufe im Frühjahr 2003 sicherte sich Yahoo! den Anschluss in diesem Marktsegment. Seit 2004 gibt es nach einigen Firmenübernahmen nur mehr drei große (bezogen auf die Anzahl erfasster Dokumente) indexbasierte kommerzielle Websuchmaschinen. Neben Google sind dies Yahoo! Search und Microsofts MSN Search.

Herausforderungen


- Mehrdeutigkeit – Suchanfragen sind oft unpräzise. So kann die Suchmaschine nicht selbständig entscheiden, ob beim Begriff Laster nach einem LKW oder einer schlechten Angewohnheit gesucht werden soll. Umgekehrt sollte die Suchmaschine nicht zu stur auf dem eingegebenen Begriff bestehen. Sie sollte auch Synonyme einbeziehen, damit der Suchbegriff Rechner Linux auch Seiten findet, die statt Rechner das Wort Computer enthalten. Weiterhin wird oft Stemming verwendet, dabei werden Wörter auf ihren Grundstamm reduziert. So ist einerseits eine Abfrage nach ähnlichen Wortformen möglich (schöne Blumen findet so auch schöner Blume), außerdem wird die Anzahl der Begriffe im Index reduziert.
- Datenmenge – Das Web wächst schneller als die Suchmaschinen mit der derzeitigen Technik indexieren können. Dabei ist der den Suchmaschinen unbekannte Teil – das sogenannte Deep Web – noch gar nicht eingerechnet.
- Aktualität – Viele Webseiten werden häufig aktualisiert, was die Suchmaschinen zwingt, diese Seiten immer wieder zu besuchen. Dies ist auch notwendig, um zwischenzeitlich aus der Datenbasis entfernte Dokumente zu erkennen und nicht länger als Ergebnis anzubieten. Das regelmäßige Herunterladen der mehreren Milliarden Dokumente, die eine Suchmaschine im Index hat, stellt große Anforderungen an die Netzwerkressourcen (Traffic) des Suchmaschinenbetreibers.
- Spam – Mittels Suchmaschinen-Spamming versuchen manche Website-Betreiber, den Ranking-Algorithmus der Suchmaschinen zu überlisten, um eine bessere Platzierung für gewisse Suchanfragen zu bekommen. Sowohl den Betreibern der Suchmaschine als auch deren Kunden schadet dies, da nun nicht mehr die relevantesten Dokumente zuerst angezeigt werden.
- Technisches – Suche auf sehr großen Datenmengen so umzusetzen, dass die Verfügbarkeit hoch ist (trotz Hardware-Ausfällen und Netzengpässen) und die Antwortzeiten niedrig (obwohl oft pro Suchanfrage das Lesen und Verarbeiten mehrerer 100 MB Index-Daten erforderlich ist), stellt große Anforderungen an den Suchmaschinenbetreiber. Systeme müssen sehr redundant ausgelegt sein, zum einen auf den Computern vor Ort in einem Rechenzentrum, zum anderen sollte es mehr als ein Rechenzentrum geben, welches die komplette Suchmaschinenfunktionalität anbietet.
- Rechtliches – Suchmaschinen werden meist international betrieben und bieten somit Benutzern Ergebnisse von Servern, die in anderen Ländern stehen. Da die Gesetzgebungen der verschiedenen Länder unterschiedliche Auffassungen davon haben, welche Inhalte erlaubt sind, geraten Betreiber von Suchmaschinen oft unter Druck, gewisse Seiten von ihren Ergebnissen auszuschließen. Die deutschen Internet-Suchmaschinen wollen jugendgefährdende Seiten durch die Freiwillige Selbstkontrolle aus ihren Trefferlisten streichen.

Siehe auch


- Hubs und Authorities, Google-Bombe, Linkfarm, Web Impact Faktor, Information-Retrieval, Vektorraum-Retrieval, Data Mining, semantisches Web, Open Archives Initiative, Web Mining, Schnitzelmitkartoffelsalat, Nutch, Objektivität, Suchmaschinen-Optimierung

Literatur


- Stefan Karzauninkat: Die Suchfibel Wie findet man Informationen im Internet? Klett, 2002 3. Aufl. ISBN 3-12-238106-0
- Heike Faller: [http://www.zeit.de/2005/41/Suchmaschinen_2?page=all David gegen Google]. In: Die Zeit Nr. 41/2005, 6. Oktober 2005, S. 17ff (Dossier).
- Dirk Lewandowski: "Web Information Retrieval: Technologien zur Suche im Internet" DGI, 2005 ISBN 3-925474-55-2. [http://www.durchdenken.de/lewandowski/web-ir Online-Version des Buchs]"

Weblinks


- http://www.suchfibel.de/ Die Suchfibel - Alles über die Websuche
- http://www.ososo.de/suchmaschinen-faq/ FAQ der Newsgroup de.comm.infosystems.suchmaschinen - Grundlagen zur Funktionsweise und zur Benutzung von Suchmaschinen
- http://www.suchmaschinen-und-recht.de/ Suchmaschinen & Recht: Aktuelle Urteile und Aufsätze zu Suchmaschinen-/SEO-Themen
- http://www.rechercheportal.de Zugriff auf rund 2000 spezialisierte Suchdienste
-
- http://www.at-web.de Nachrichten zum Thema Suchmaschinen
- http://www.suchfibel.de/5technik/images/suchmaschinereien_gross.gif Beziehung der Suchmaschinen zueinander Kategorie:Dokumentation Kategorie:Internet Kategorie:Suchmaschine ja:検索エンジン ko:검색 엔진 ms:Enjin gelintar simple:Search engine th:เครื่องมือค้นหาบนอินเทอร์เน็ต

Universität Bielefeld

Die Universität Bielefeld ist eine 1969 gegründete deutsche Campus-Universität, die einzige in der Region Minden-Ravensberg. Sie ist mit ca. 17.000 Studierenden (im Sommersemester 2005) die größte der sechs Bielefelder Hochschulen. Unter den staatlichen Universitäten in Westfalen liegt sie in Bezug auf Mittel der Deutschen Forschungsgemeinschaft pro Professor auf dem zweiten Platz. Im Uni-Ranking des Magazins "Focus" vom September 2005 belegte die Universität Bielefeld den 10. von insgesamt 86. Plätzen. In den Fachbereichen Erziehungswissenschaft und Soziologie belegte sie sogar den ersten. Die Universität Bielefeld wurde als sogenannte "Reformuniversität" mit stark interdisziplinärem Schwerpunkt gegründet. Das zeigt sich bereits in der Architektur, bei der durch die zentrale Halle alle Fakultäten miteinander auch räumlich verbunden werden. An der Universität Bielefeld gibt es die bundesweit einzige Fakultät für Soziologie, an der u.a. Norbert Elias und Niklas Luhmann arbeiteten. Die Geschichtswissenschaft in Bielefeld hat ebenfalls Weltruf, nicht zuletzt durch die von Hans-Ulrich Wehler mitbegründete "Bielefelder Schule" der Sozialgeschichte und seiner weiteren Arbeiten. Auch die Fakultät für Pädagogik gehört zu den besten in Europa. An diese angeschlossen ist die von Hartmut von Hentig gegründete Laborschule. Ebenfalls zur Universität Bielefeld gehört das Zentrum für interdisziplinäre Forschung (ZiF), das bereits 1968 gegründet wurde und als das erste "Center for Advanced Study" in Deutschland gilt. Die Fakultät für Gesundheitswissenschaften, die nach dem Vorbild amerikanischer "professional schools" aufgebaut ist, also eine interdisziplinären Arbeitsweise anstrebt und Ihre Betonung auf berufsverwertbare Grundlagenforschung legt, wurde 1994 gegründet. Und zuletzt wäre da noch die Technische Fakultät zu nennen, welche sich zum Beispiel durch die Arbeitsgruppe "Wissensbasierte Systeme" um Professor Ipke Wachsmuth auszeichnet. Einer deren momentanen Forschungsobjekte, ein virtueller "Gesprächspartner" namens MAX, kann im Heinz Nixdorf MuseumsForum in Paderborn besichtigt werden.

Überblick

(Quelle: Statistisches Jahrbuch der Universität Bielefeld 2005, Redaktionsschluss: 1. Juli 2005)

Fakultäten

Paderborn Die Universität Bielefeld besteht aus folgenden 13 Fakultäten:
- Fakultät für Biologie
- Fakultät für Chemie
- Fakultät für Geschichtswissenschaft, Philosophie und Theologie
- Fakultät für Gesundheitswissenschaften
- Fakultät für Linguistik und Literaturwissenschaft
- Fakultät für Mathematik
- Fakultät für Pädagogik
- Fakultät für Physik
- Fakultät für Psychologie und Sportwissenschaft
- Fakultät für Rechtswissenschaft
- Fakultät für Soziologie
- Technische Fakultät
- Fakultät für Wirtschaftswissenschaften

Zentrale wissenschaftliche Einrichtungen


- Zentrum für interdisziplinäre Forschung (ZiF)
- Centrum für Biotechnologie (CeBiTec)
- Forschungsschwerpunkt Mathematisierung (FSPM)
- Institut für interdisziplinäre Konflikt- und Gewaltforschung (IKG)
- Institut für mathematische Wirtschaftsforschung (IMW)
- Institut für Wissenschafts- und Technikforschung (IWT)
- Institut für die Simulation komplexer Systeme (ISKOS)
- Interdisziplinäres Zentrum für Frauen- und Geschlechterforschung (IFF)
- Zentrum für Lehrerbildung (ZfL)
- Laborschule des Landes Nordrhein-Westfalen an der Universität Bielefeld
- Oberstufenkolleg des Landes Nordrhein-Westfalen an der Universität Bielefeld

Sonderforschungsbereiche

Ästhetisches Zentrum

Seit Juli 2003 besteht das Ästhetische Zentrum an der Universität (Leitung: Prof. Dr. Klaus-Ove Kahrmann, Projektleiterin: Dr. Heike Piehler, Kulturmanagerin: Rita Hebenstreit). Das Ästhetische Zentrum bildet für die vielfältigen künstlerischen und kulturellen Aktivitäten der Universität einen gemeinsamen institutionellen Rahmen. Es ist zum einen ein Dienstleistungszentrum für das Management einzelner Aufgaben und Projekte, zum anderen ein Forum, in welchem das ästhetische Engagement und die kulturelle Identität der Universität konzeptuell bedacht und weiterentwickelt werden. Die Aktivitäten des Ästhetischen Zentrums dienen der Förderung der kulturellen und ästhetischen Ausdrucksfähigkeit der Studierenden der Universität Bielefeld. Sie werden fakultätsübergreifend für die Studierenden konzipiert und gemeinsam mit diesen entwickelt, bis hin zur öffentlichen Präsentation innerhalb und außerhalb der Universität. Mit Großveranstaltungen wie der „Nacht der Klänge“ – hier wird die Architektur der Universität Bielefeld durch Musik, Klang und Sprache erlebbar gemacht – , der ORIGINALE – ein vielfältiges Kunsterlebnis in der 260m langen zentralen Halle – , dem Ästhetik-Festival – bei dem ein Thema interdisziplinär und allgemein verständlich innerhalb verschiedener Veranstaltungen bearbeitet wird, dem Autokino - mit „kultigen Kurzfilmen“ aus dem [http://www.vorsicht-dreharbeiten.de/ Seminar „Vorsicht Dreharbeiten!“] unter der Leitung von Fabio Magnifico - will das Ästhetische Zentrum maßgeblich zum Renommee der Universität Bielefeld beitragen und ihr ein unübersehbares, prägnantes kulturelles Profil verleihen. Die kulturellen Veranstaltungen an der Universität werden im Kulturkalender, der zweimal pro Semester erscheint, veröffentlicht.

Weblinks


- [http://www.uni-bielefeld.de/ Universität Bielefeld]
- [http://www.asta-bielefeld.de/ AStA der Universität Bielefeld]
- [http://www.radiohertz.de/ hertz 87,9 - Campusradio Bielefeld]
- [http://www.bielefelder-burschenschaft.de/ Studentische Korporation und eingetragene Hochschulgruppe]
- [http://cweb.uni-bielefeld.de/ eLearning-Projekte]
- [http://bis.uni-bielefeld.de/bis/SilverStream/Pages/Public_KVV_Home.html/ wegweisendes, kommentiertes Vorlesungsverzeichnis]
- [http://www.zww.uni-bielefeld.de/home/index,id,89.html/ Projekt Sommercampus der Uni Bielefeld] Bielefeld Kategorie:Bielefeld

Fast Search and Transfer

Die norwegische Firma Fast Search and Transfer (Rekursives Akronym: FAST), mit Hauptsitz in Oslo, ist spezialisiert auf Echtzeit-Suchmaschinentechnik für Unternehmen. Das Unternehmen ist eine Firmenausgründung (1997) der Norges teknisk-naturvitenskapelige universitet (NTNU) Trondheim. FAST verkaufte seine Web Search Unit mit dem Vorzeigeprojekt der Suchmaschine Alltheweb im Februar 2003 für 100 Millionen Dollar an Overture. Overture (incl. AltaVista) wurde daraufhin im Juli 2003 für 1,6 Milliarden Dollar von Yahoo! übernommen. Der Webcrawler von FAST heißt FAST-WebCrawler. FAST stellt die Suchmaschinentechnologie der Wisssenschaftssuchmaschine Scirus. FAST ist im Oslo Stock Exchange mit dem Kürzel FAST gelistet. Kunden sind unter anderen AT&T, Reuters, Dell.

Literatur


- Knut M. Rygh, Fredrik Eeg, Knut A. Espegren, Fast Search And Transfer ASA, Business.no, 14 May 2003, [http://www.business.no/artikkel_fast_search.htm Onlinetext]
- Norbert Lossau, Search Engine Technology and Digital Libraries, D-Lib Magazine, Juni 2004, ISSN 1082-9873, [http://www.dlib.org/dlib/june04/lossau/06lossau.html Onlinetext]
- Zara Kanaeva, Verteilter Contentspeicher, Erfahrungen mit der Suchmaschine Fast, ZIB-Report 04-56 (Dezember 2004), [http://www.zib.de/Publications/Reports/ZR-04-56.pdf PDF]
- Mechtild Stock & Wolfgang G. Stock, Internet-Suchwerkzeuge im Vergleich (III), AltaVista, FAST und Northern Light, PASSWORD 01/2001, [http://www.phil-fak.uni-duesseldorf.de/infowiss/admin/public_dateien/files/1/1078738894password_1.pdf PDF]

Weblinks


- [http://www.fast.no/ Fast.no]
- [http://www.hoovers.com/fast-search/--ID__101264--/free-co-factsheet.xhtml Company Fact Sheet]
- [http://www.verdi.de/0x0ac80f2b_0x002058f6 Yahoo gegen Google]
- [http://www.suchfibel.de/5technik/suchmaschinen_beziehungen.htm Das Beziehungsgeflecht der Suchmaschinen]
- [http://www.at-web.de/fast/overfastvista.htm Overture kauf FAST, 2003]
- [http://hdl.handle.net/2003/21366 Indexierung der HBZ-Verbunddaten mit FAST Data Search (PDF)] Kategorie:Suchmaschinenhersteller Kategorie:Unternehmen (Norwegen) Kategorie:Dokumentation Kategorie:Yahoo!

Preprint

Als Preprints (englisch: vor dem Druck) bezeichnet man Vorabdrucke oder als Kopie weitergegebene Versionen von Artikeln wissenschaftlicher Fachzeitschriften oder von Buchbeiträgen, die zur Veröffentlichung vorgesehen sind. Handelt es sich um digitale Texte, spricht man von Eprints, wobei man als Eprints auch die Postprints bezeichnet, die den publizierten Text umfassen. Inzwischen werden Preprints in den Naturwissenschaften vor allem über Dokumentenserver wie ArXiv verbreitet. Siehe auch: Zeitschriftenkrise, Open Archives Initiative Kategorie:Journalismus Kategorie:Medien Kategorie:Bibliothekswesen Kategorie:Wissenschaftspraxis

Retrodigitalisierung

Als Retrodigitalisierung oder Retrospektive Digitalisierung bezeichnet man die Digitalisierung analoger Publikationen (u.a. Printmedien, Filme, Tonbänder). Retrodigitalisierung wird vor allem in Bibliotheken und Archiven eingesetzt, um durch Zerfall gefährdete Werke für die Nachwelt zu erhalten und für die breitere Nutzung zu erschließen. Neben der Bestandserhaltung kann auch die weltweite Zugänglichmachung von seltenen oder besonders häufig genutzten Werken ein Grund für die Digitalisierung sein. In diesem Fall wird ergänzend gerne zusätzlich eine OCR-Erkennung durchgeführt, um die Arbeit mit den Texten am Computer zu erleichtern und neue Arbeitsweisen zu ermöglichen. Ein bekanntes Beispiel ist die digitalisierte Version der Gutenberg-Bibel. Die DFG förderte und fördert eine Reihe von Projekten in Bibliotheken, die sehr unterschiedliche Bestände (Monografien, Bilder, Zeitungen und Zeitschriften, Lexika etc.) einscannen und durchsuchbar machen. Bisher fehlt es aber an einem einheitlichen Einstieg. Dies führt mit dazu, dass große Teile der Zielgruppen nichts von den Angeboten wissen. Die Digitalisierung von Katalogen zur Erschließung der darin verzeichneten Bestände wird Retrokonversion genannt. Die Retrodigitalisierung ist manchmal mit der Archivierung auf Mikroformen verbunden, da diese eine wesentlich größere Haltbarkeit als digitale Speichermedien besitzen. Zur Langzeitarchivierung von digitalisierten Medien und Elektronischen Publikationen (z.B. Netzpublikationen), müssen geeignete Strategien überlegt werden, um die Daten und Inhalte auch in künftig genutzten Systemen (Hardware und Software) noch darstellen und verwerten zu können. Ein großes österreichisches Retrodigitalisierungs-Projekt ist Austrian Literature Online. Innovationen im Bereich Retrodigitalisierung kommen vor allem aus Amerika. Neben Bibliotheken und Forschungseinrichtungen, die v.a. wissenschaftliche Literatur bearbeiten, setzen nun auch Anbieter wie Google und Amazon Retrodigitalisierung ein und bieten ihre Produkte zum Teil kostenpflichtig an.

Siehe auch


- Gallica

Weblinks


- [http://bcdlib.tc.ca/general-collections-europe.html Umfangreiche Übersicht von Sammlungen digitalisierter Werke]
- [http://www.ub.uni-heidelberg.de/helios/digi/digiallg.html Linksammlung der UB Heidelberg]
- [http://gdz.sub.uni-goettingen.de/de/index.html Göttinger DigitalisierungsZentrum]
- http://www.gutenbergdigital.de/
- [http://archiv.twoday.net/stories/113113/ Deutsche Drucke des 16. Jahrhunderts, als Faksimiles digitalisiert im Internet]
- [http://www.digizeitschriften.de/ DigiZeitschriften e.V. - digitalisierte Zeitschriften verschiedenster Fächer]
- [http://wiki.ib.hu-berlin.de/index.php/Digitalsierungsprojekte Übersicht von Digitalisierungsprojekten]
- [http://www.dfg.de/forschungsfoerderung/wissenschaftliche_infrastruktur/lis/download/retro_digitalisierung_eval_050406.pdf Evaluierungsbericht über die Retrodigitalisierung von Bibliotheksbeständen] ! Kategorie:Medien

Projekt Gutenberg

Es gibt derzeit zwei laufende Projekte, die den Namen Projekt Gutenberg im Titel tragen. Sie dienen zur Erstellung bzw. Erfassung digitaler Kopien älterer Literatur, bei der das Urheberrecht abgelaufen ist, oder neuerer Literatur, die frei zur Verfügung gestellt wird. Zu unterscheiden sind:
- Das freie internationale Projekt Gutenberg: Project Gutenberg
- Das kommerzielle deutsche Projekt Gutenberg-DE: Projekt Gutenberg-DE (die Namenswahl ist absichtlich ähnlich, aber das Projekt steht in keinem offiziellen Zusammenhang mit dem Project Gutenberg)

Metadaten

Als Metadaten oder Metainformationen bezeichnet man allgemein Daten, die Informationen über andere Daten enthalten. Bei den beschriebenen Daten handelt es sich oft um größere Datensammlungen (Dokumente) wie Bücher, Datenbanken oder Dateien. So werden auch Angaben von Eigenschaften eines Objektes (beispielsweise Personennamen) als Metadaten bezeichnet. Während der Begriff "Metadaten" relativ neu ist, ist sein Prinzip unter anderem jahrhundertelange bibliothekarische Praxis. Fehlen einem Text die Metadaten, so spricht man von Plaintext.

Beispiele

Typische Metadaten zu einem Buch sind beispielsweise der Name des Autors, die Auflage, das Erscheinungsjahr, der Verlag und die ISBN. Zu den Metadaten einer Computerdatei sind unter Anderem der Dateiname, die Zugriffsrechte und das Datum der letzten Änderung zu zählen.

Unterscheidung Daten - Metadaten

Eine allgemeingültige Unterscheidung zwischen Metadaten und normalen Daten existiert allerdings nicht, da die Bezeichnung eine Frage des Standpunkts ist: Für den Leser eines Buches sind der Inhalt die eigentlichen Daten, während der Name des Autors oder Nummer der Auflage Metadaten sind. Für den Herausgeber eines Bücherkatalogs sind diese beiden Eigenschaften aber unmittelbar interessant und dürften deshalb als eigentliche Daten betrachtet werden.

Verwendung von Metadaten

In vielen Fällen findet keine bewusste Trennung zwischen Objekt- und Metaebene statt. Beispielsweise spricht man davon, in einem Katalog ein Buch zu suchen und nicht nur seine Metadaten. Bei der Verwendung von Metadaten wird oft erwartet, dass sie durch direkte Koppelung mit den Nutzdaten untrennbare Bestandteile eines abgeschlossenen, sich selbst beschreibenden Systems sind. Metadaten werden oft dazu eingesetzt, um Informationsressourcen zu beschreiben und dadurch besser auffindbar zu machen und Beziehungen zwischen den Materialien herzustellen. Dies setzt in der Regel erst eine Erschließung mit einem gewissen Standardisierungsgrad (zum Beispiel durch Bibliothekarische Regelwerke) voraus.

Speicherung von Metadaten

Zur Speicherung und Übertragung von Metadaten gibt es eine Reihe von Datenformaten und Datenmodellen (Datenmodelle, wie beispielsweise Dublin Core, lassen sich auch in unterschiedlichen Formaten ausdrücken). Weiteres unter Metadatenformate. Siehe auch: Text Encoding Initiative (TEI), Resource Description Framework (RDF) Zur Speicherung von Metadaten gibt es verschiedene Möglichkeiten: # Im Dokument selbst. So ist in einem Buch stets auch der Autor und das Erscheinungsjahr verzeichnet. In HTML-Dokumenten werden mit Hilfe von Meta-Tags Sprache, Autor, Unternehmen und Schlagwörter angegeben, die beispielsweise von Suchmaschinen ausgewertet werden. # In zugeordneten Nachschlagewerken, zum Beispiel für ein Buch in einer Bibliothek im Bibliothekskatalog. # Bei Computerdateien in den Dateiattributen. Die meisten Dateisysteme erlauben nur genau festgelegte Metadaten in Dateiattributen; andere (z. B. HPFS mittels erweiterter Attribute) erlauben die Assoziation beliebiger Daten mit einer Datei. Auch ist es üblich, die Meta-Information "Dateityp" im Dateinamen unterzubringen; typischerweise in der Extension. Siehe auch: Attribut, Eigenschaft, semantisches Web, Datenverzeichnis, Repositorium,

Interoperable Metadaten

"Operabel" bedeutet in fachsprachlichen Fügungen zunächst "so beschaffen, dass damit gearbeitet, operiert werden kann". Die Vorsilbe "inter" stammt aus dem Lateinischen und bedeutet soviel wie "zwischen" (genauer: sie kennzeichnet in Bildungen mit Substantiven, Adjektiven oder Verben eine Wechselbeziehung zwischen zwei oder mehreren gleichartigen Dingen, die entweder besteht oder sich vollzieht. Auch: "zwischen", "unter", "inmitten". Vgl. DUDEN Wörterbuch). Interoperable Metadaten sind also Metadaten aus potenziell unterschiedlichen Quellen, zwischen denen ("inter") eine Beziehung in der Weise besteht, dass mit ihnen gemeinsam gearbeitet ("operiert") werden kann. Standards für interoperable Metadaten haben die Aufgabe, Metadaten aus unterschiedlichen Quellen nutzbar zu machen. Sie umfassen dazu zunächst folgende Aspekte:
- Semantik
- Datenmodell
- Syntax Die Semantik beschreibt die Bedeutung, die in der Regel von Normierungs-Gremien festgelegt wird (vgl. Dublin Core). Das Datenmodell legt fest, welche Struktur die Metadaten besitzen können. Als "Daten" lassen sich im Zusammenhang mit Metadaten Aussagen auffassen, die über ein zu beschreibendes Objekt (Dokument, Ressource, ...) getroffen werden. Als "Modell"-Komponente des Begriffs Datenmodell lässt sich eine Beschreibung dessen auffassen, wie die Aussagen strukturell beschaffen sind (der Begriff Datenmodell bedeutet damit im Kontext von Metadaten soviel wie "Grammatik" oder "Struktur von Aussagen"). Beispiele für Datenmodelle von Metadaten sind einfache Attribut/Wert-Kombinationen (z.B. HTML Meta-Tags) oder Sätze mit Subjekt, Prädikat und Objekt (z.B. Tripel in RDF). Die Syntax dient schließlich dazu, die entsprechend dem Datenmodell generierten Aussagen zu repräsentieren. Beispiel für ein Repräsentationsformat ist XML (eXtensible Markup Language). Zwischen diesen drei Aspekten besteht nun folgende Beziehung: Die Semantik wird durch Konstrukte des Datenmodells repräsentiert. Das Datenmodell wird wiederum durch syntaktische Konstrukte repräsentiert. Die syntaktischen Konstrukte werden schließlich aus Zeichen eines vereinbarten Zeichensatzes (z.B. Unicode) zusammengesetzt. Diese drei Aspekte lassen sich als hierarchisch übereinander liegende Schichten auffassen, da jede Schicht jeweils auf der darunter befindlichen Schicht aufbaut. Die Schichten sind dabei voneinander unabhängig, d.h. die Verwendung eines bestimmten Standards in einer Schicht erfolgt unabhängig von den anderen Schichten (siehe dazu auch die Schichtenmodelle der Netzwerkkommunikation, z.B. das ISO/OSI-Schichtenmodell). So kann eine bestimmte Semantik durch Konstrukte verschiedener Datenmodelle repräsentiert werden (z.B. Attribut/Wert-Kombination, Tripel), die wiederum durch verschiedenen Syntaxen repräsentiert werden können (z.B. Graphen, XML-Formate). Orthogonal zu diesen Schichten liegt als vierter Aspekt die Identifizierung, die alle drei Schichten betrifft. Um Metadaten verschiedener Quellen sinnvoll verarbeiten zu können, muss (weltweit) eindeutig gekennzeichnet werden, um welche Semantik, welches Datenmodell und welche Syntax es sich handelt. Hierzu ist ein Identifikationsmechanismus erforderlich, wie ihn z.B. die URIs (Uniform Resource Identifier) bereitstellen. URIs Alle vier Aspekte - Semantik, Datenmodell, Syntax und Identifizierung - sind erforderlich, um Standards für interoperable Metadaten zu schaffen. Sie können daher gemeinsam in ein Rahmenwerk (engl. Framework) eingeordnet werden. Wörtlich übersetzt heißt Framework entweder "Gerippe", "Gerüst", "Rahmen" oder "Bezugssystem". Ein Rahmenwerk bietet also eine Art Grundgerüst oder Gerippe, das bereits die wichtigsten Elemente bzw. Komponenten eines Systems und deren Beziehungen beschreibt, jedoch ohne genaue Vorgaben hinsichtlich deren Ausgestaltung zu machen. Es fungiert somit als eine Art "Bezugsrahmen" oder "Bezugssystem", das die sinnvolle Eingliederung neuer Komponenten ermöglicht. Da ein Rahmenwerk Elemente und deren Beziehungen zeigt, kann dies leicht durch die grafische Anordnung von Elementen visualisiert werden. Abb. 1 zeigt ein Rahmenwerk für Metadaten, auf einer Meta-Ebene. Im Gegensatz zu konkreten Ausprägungen von Rahmenwerken, d.h. also der Ausprägungs- oder Instanzenebene, beschreibt ein Rahmenwerk auf der Meta-Ebene ein verallgemeinertes Rahmenwerk - erkennbar an den generischen Bezeichnungen der Bestandteile. Als Beispiel für ein konkretes Rahmenwerk für Metadaten sei RDF (Resource Description Framework) des W3C (World Wide Web Consortium) genannt. RDF enthält alle der oben genannten vier Aspekte mit spezifischen Ausprägungen, wie in Abb. 2 dargestellt. W3C Die Komponenten im Detail:
- Semantik: Domänenspezifische Semantiken können über Namensräume importiert werden, womit die Semantik eines RDF-Vokabulars beliebig erweitert werden kann
- Datenmodell: RDF besitzt ein festgelegtes Datenmodell, das Aussagen über Ressourcen in Form von Tripeln mit Subjekt, Prädikat und Objekt gestattet
- Syntax: Zur Repräsentation solcher Aussagen kann eine beliebige Syntax verwendet werden, z.B. RDF/XML, Graphen, oder die N-Triple-Notation; RDF/XML ist jedoch die normative Syntax
- Identifikation: Als universeller Identifikations-Mechanismus werden URIs verbindlich vorgeschrieben Der Idee eines Rahmenwerkes folgend definiert RDF selbst keine domänenspezifische Semantik, sondern spezifiziert lediglich einen Mechanismus, wie über Namensräume mit Hilfe einer URI weitere Semantiken eingebunden werden können. Verbindlich legt RDF hingegen ein gemeinsames Datenmodell in Form von Tripeln fest sowie die universelle Verwendung von URIs als Identifikationsmechanismus. Diese werden sowohl eingesetzt, um die einzelnen Komponenten eines Tripels (Subjekt, Prädikat, Objekt) zu kennzeichnen, als auch deren Werte und Datentypen. Die konkrete Syntax zur Repräsentation der Tripel kann jedoch, wiederum dem Gedanken eines Rahmenwerkes folgend, frei gewählt werden, wobei RDF/XML als Standard vorgesehen ist. Mit RDF Schema enthält RDF außerdem noch eine Schema-Sprache, um eigene Metadaten-Vokabulare zu definieren. RDF Schema verhält sich zu RDF ähnlich wie XML Schema zu XML. Ein RDF Schema ist gleichzeitig ein gültiges RDF-Dokument, ebenso ist ein XML Schema gleichzeitig ein gültiges XML-Dokument. In beiden Fällen handelt es sich also um spezialisierte Teilmengen einer Auszeichnungssprache. Während XML Schema jedoch syntaktische Einschränkungen beschreibt, z.B. Elementnamen, Häufigkeit des Auftretens etc., beschreibt RDF Schema semantische Einschränkungen, also z.B. dass ein Attribut "hasPublished" nur auf Instanzen der Klasse "Mensch" oder "juristischePerson" angewendet werden darf, nicht jedoch auf Instanzen der Klasse "Tier" - in der Schemasprache formuliert, hat das Attribut "hasPublished" die Domäne "Mensch" oder "juristischePerson". Wie XML dem Grundsatz der Einfachheit und Erweiterbarkeit folgend die Welt der Daten gründlich veränderte, in dem es durch eine einheitliche Syntax, ein genormtes Typsystem und seine Textbasiertheit die Definition problemlos zwischen verschiedenen Systemen und Programmen austauschbarer Datenformate ermöglichte, versucht RDF die Welt der Metadaten durch ein einheitliches Datenmodell zu verändern. Durch den Charakter eines Rahmenwerkes knüpft RDF dabei ebenfalls an bewährte Grundsätze wie Einfachheit und Erweiterbarkeit an.

Metadaten in der Statistik

In statistischen Datenbanken werden diejenigen Daten als Metadaten bezeichnet, die nicht direkt den Inhalt einer Statistik darstellen, z. B. Branchen- oder Berufsbezeichungen, Gemeindeverzeichnisse und andere Kataloge. Zu den statistischen Metadaten zählen auch Beschreibungen der Datenfelder in Umfrageformularen, u.U. auch komplette Formularbeschreibungen. Die eigentlichen statistischen Daten bezeichnet man in Abgrenzung zu den Metadaten als Mikrodaten und Makrodaten.

Metadaten in der Softwareentwicklung

In der Softwareentwicklung bezeichnet man Bestandteile eines Programmquelltextes als Metadaten, die nicht vom eigentlichen Übersetzungswerkzeug, meist einem Compiler, sondern Zusatzwerkzeugen ausgewertet werden. Diese Metadaten werden meist zur Dokumentation oder mit Hilfe von Annotationen zur Codegenerierung eingesetzt. Beispiele für Metadaten in der Softwareentwicklung sind die Annotations in Java oder die von XDoclet oder JavaDoc ausgewerteten Dokumentationskommentare. Eine von der klassischen Programmierung abweichende Form ist die Verwendung von Metadaten in Universal-Software. Hierbei sind die meisten benötigten Anwendungsfunktionen vorkompiliert vorhanden und werden über eine Metadaten-Engine aufgerufen und parametrisiert. Die gewünschte Zielanwendung muss vorher mittels spezifischer Metadaten deklarativ beschrieben werden. Dieser Ansatz wird insbesondere von Data Warehouse- und Business Intelligence - Produkten verfolgt. Einige Hersteller wie Tenfold und Scopeland wenden dieses Prinzip auch auf die Erstellung schreibender Datenbankanwendungen an. Dieser s.g. Universal Application - Ansatz verspricht drastische Kostensenkungen bei der Erstellung von Anwendungssoftware und eine anders nicht zu erreichende Flexibilität der so erstellten Lösungen.

Literatur


- Schmidt, Ingrid: Modellierung von Metadaten. In: Lobin, Henning / Lemnitzer, Lothar: Texttechnologie. Perspektiven und Anwendungen. Tübingen:Stauffenburg 2004, S. 143-164

Weblinks


- [http://www.informatik.hu-berlin.de/~legler/studium/dwh/metadata_termpaper_german.pdf Zu Metadaten im Data Warehouse]
- [http://www2.sub.uni-goettingen.de/intrometa.html zu Definition von Metadaten] Kategorie:Dokumentation ja:メタデータ

Forschungsportal.Net

Forschungsportal.Net ist eine Suchmaschine für den wissenschaftlichen Bereich des www. Die Suchmaschine wurde – wie auch die Metasuchmaschine Metager – von der Universität Hannover im Auftrag des Bundesministerium für Bildung und Forschung (BMBF) mit einer Förderung von 600.000 Euro entwickelt, und im September 2002 der Öffentlichkeit präsentiert. Bei der Suche werden ausschließlich Webseiten von staatlich geförderten Wissenschaftsorganisationen und Forschungsinstituten wie etwa von Universitäten, Hochschulen, der Fraunhofer-Gesellschaft, der Max-Planck-Gesellschaft etc. oder auch der Deutschen Bibliothek (Dissertationssuche) berücksichtigt. Die Suchergebnisse werden unter den jeweiligen Institutionen aufgelistet (Clustering). Forschungsportal.Net durchsucht 27.000 Webserver mit 12 Millionen Webseiten. Zusätzlich durchforstet die Suchmaschine auch Websiten von Vorhaben die vom BMBF gefördert werden.

Weitere wissenschaftliche Suchmaschinen


- BASE (Bielefeld Academic Search Engine)
- Campus Search
- CiteSeer
- Google Scholar
- OAIster
- Scirus
- Vascoda Siehe auch: Deep Web

Weblinks


- http://www.forschungsportal.net
- http://bserv3.rrzn.uni-hannover.de/fp/
- [http://www.at-web.de/blog/20050617/forschungsportal-als-suchmaschine-freigegeben.htm Forschungsportal als Suchmaschine freigegeben]
- [http://idw-online.de/pages/de/news60613 Suchen und finden im "invisible net"] Kategorie:Dokumentation Kategorie:Suchmaschine

Google Scholar

Google Scholar ist eine Dienstleistung der Suchmaschine Google. Am 18. November 2004 startete Google die Beta-Version eines neuen Suchdienstes, der speziell der wissenschaftlichen Recherche dienen soll. Schüler, Studenten und Wissenschaftler können mit Hilfe dieser Suchmaschine, die in Zusammenarbeit mit zahlreichen Fachverlagen entstand, auf die Suche nach Quellen gehen. Google Scholar durchsucht zahlreiche wissenschaftliche Server. Google Scholar wurde nicht zuletzt von der Open Access-Community begeistert begrüßt. Der Schwerpunkt liegt auf Fachzeitschriften, wobei auch Volltexte kostenpflichtiger Dokumente kommerzieller Anbieter, von denen der Benutzer ohne Zugangsberechtigung nur ein Abstract zu sehen bekommt, durchsucht werden. Nach dem Prinzip eines Citation Index versucht Google Scholar die in einem Fachbeitrag zitierte Fachliteratur zu erkennen und als solche suchbar zu machen. Beispiel: Gibt man elias zivilisation in das Suchfeld ein, erhält man (Stand: 19.7.2005) an erster Stelle der Trefferliste folgendes Ergebnis: [CITATION] Uber Den Prozess Der Zivilisation
N Elias - 1976 - Frankfurt: Suhrkamp
Cited by 196 - Web Search - Library Search Klickt man Cited by 196 an, erhält man 196 Publikationen, die dieses Werk von Norbert Elias zitieren. Mit Library Search kann der WorldCat abgefragt werden. Das gleiche Werk erscheint in anderen Ausgaben oder nicht erkannten Varianten der gleichen Ausgabe allerdings auch auf vielen weiteren Positionen der Trefferliste. Derzeit befindet sich Google Scholar in der Betaphase. Kritiker bemängeln, dass Google Scholar nur einen kleinen Teil der wissenschaftlichen Publikationen im Netz erfasst und die ihm zugänglichen Verlagsserver jeweils auch nur zum Teil.

Vergleichbare Angebote

Eine Zitaterkennung bietet die freie Suchmaschine CiteSeer. Andere kostenfreie wissenschaftliche Suchmaschinen (ohne Zitaterkennung) sind Scirus und Forschungsportal.Net. Kommerzielle Konkurrenten sind der Science Citation Index (ISI) und Scopus (Elsevier).

Weitere wissenschaftliche Suchmaschinen


- BASE (Bielefeld Academic Search Engine)
- Campus Search
- OAIster
- Vascoda

Siehe auch

Google-Dienstleistungen weitere Dienstleistungen von Google

Literatur


- H. Dollfuß, Google Scholar: Kleiner Fisch oder zukünftiger Hecht im medizinischen Literaturteich?. In: Medizin - Bibliothek - Information 2005; 5(3): 34-37 ([http://www.agmb.de/mbi/2005_3/dollfuss34-37.pdf PDF])
- Peter Jacso, As we may search Comparison of major features of the Web of Science, Scopus, and Google Scholar citation-base , Current Science, Vol. 89, [http://www.ias.ac.in/currsci/nov102005/contents.htm NO. 9], 10 November 2005 ([http://www.ias.ac.in/currsci/nov102005/1537.pdf PDF-Version])

Weblinks


- [http://scholar.google.com/ Google Scholar] (englisch)
- [http://www.ib.hu-berlin.de/~mayr/arbeiten/mayr_walter_iuk05.pdf Google Scholar Studie] PDF Kategorie:Google

OAIster

Der OAIster ist eine Suchmaschine für Metadaten von Dokumenten auf Dokumentenservern, die dem OAI-Standard (OAI: Open Archives Initiative) entsprechen. Sie wird von der University of Michigan betrieben. Mit 5.713.388 Datensätzen aus 514 Institutionen am 29. Juli 2005 ist der OAIster die wichtigste Suchmaschine für Open-Access-Inhalte. Sie ähnelt mit ihren Suchfeldern für Autor, Titel, Sachbetreff (Subject) einem Bibliotheks-OPAC. Da der OAIster auch Inhalte des Deep Web erfasst, gilt er im akademischen Bereich als zunehmend wichtiger werdende Alternative zu Google. Gemäß der Sprachregelung des OAI-Standards handelt es sich bei OAIster um einen OAI Service Provider.

Weitere wissenschaftliche Suchmaschinen


- BASE (Bielefeld Academic Search Engine).
- Campus Search
- CiteSeer
- Forschungsportal.Net
- Google Scholar
- Scirus
- Vascoda

Weblinks


- http://oaister.umdl.umich.edu/ OAIster
- [http://www.openarchives.org/service/listproviders.html Liste anderer registrierter Service-Provider] Kategorie:Suchmaschine

Scirus

Scirus ist die englischsprachige Wissenschafts-Suchmaschine des Elsevier-Verlags (Amsterdam) für hauptsächlich wissenschaftliche, technische und medizinische Publikationen und wurde am 1. April 2001 gestartet. Der Datenbestand der von Scirus recherchierbar ist umfasst etwa 200 Millionen wissenschaftliche Dokumente und Webseiten im Volltext. Auch Literaturangaben werden gesammelt, so dass Scirus gleichzeitig eine Zitationsdatenbank ist. Die Abstracts der gefundenen Publikationen sind in der Regel kostenlos, viele Volltexte sind jedoch kostenpflichtig. Webseiten von speziellen wissenschaftlichen Dienstanbietern (ScienceDirect, Medline, BioMed Central, US-Patentamt) und Universitäten gehören zu den bevorzugt besuchten Seiten von Scirus. Scirus ist die umfangreichste wissenschaftliche Suchmaschine mit gut erweiterbaren Suchmöglichkeiten. Die Suchmaschine arbeitet mit der Technologie von FAST. Scirus ist nach einem altgriechischen Seher aus Dodona benannt.

Weitere wissenschaftliche Suchmaschinen


- BASE (Bielefeld Academic Search Engine).
- Campus Search
- CiteSeer
- Forschungsportal.Net
- Google Scholar
- OAIster
- Vascoda

Literatur


- M. L. Doldi: Änderungsanalyse in den Suchergebnissen einer fachspezifischen Recherche mit den Suchmaschinen Google und Scirus, in Medizin - Bibliothek - Information 2005; 5(3): 38-44 ([http://www.agmb.de/mbi/2005_3/doldi38-44.pdf PDF])
- Kristen Philipkoski, Turning Search Into a Science, Wired, 08 April 2004, [http://www.wired.com/news/technology/0,1282,62979,00.html Onlinetext]
- Scirus indexes patent data of 13 million patents, Asia's Newspaper on Electronic Information Product & Service, Juni 2005, No.53 , [http://www.aardvarknet.info/access/number53/othernews.cfm?othernews=12 Onlinetext]

Weblinks


- http://www.scirus.com
- [http://www.ub.ruhr-uni-bochum.de/DigiBib/Schulung/Scirus.html Wissenschaftliche Suchmaschinen, Scirus, Uni Bochum]
- [http://www.at-web.de/spezial-suchmaschinen/scirus.htm Scirus, wissenschaftliche Suchmaschine, @web-de]
- [http://www.analytik-news.de/Monatstipp/2004/03.html Die Internet-Adresse des Monats (03/04): SCIRUS - For Scientific Information Only, Analytik-News]
- [http://www.prnewswire.co.uk/cgi/news/release?id=130067 Scirus erhält WebAward als "Bestes Verzeichnis oder beste Suchmaschine" von der Web Marketing Association] Kategorie:Dokumentation Kategorie:Suchmaschine

Deep Web

Das Deep Web (auch Hidden Web oder Invisible Web) bzw. Verstecktes Web bezeichnet den Teil des Internet, der bei einer Recherche nicht über normale Suchmaschinen auffindbar ist. Im Gegensatz zum Deep Web werden die über Suchmaschinen zugänglichen Webseiten Visible Web (Sichtbares Web) oder Surface Web (Oberflächenweb) genannt. Das Deep Web besteht zu großen Teilen aus themenspezifischen Datenbanken (Fachdatenbanken) und Webseiten, die erst durch Anfragen dynamisch aus Datenbanken generiert werden. Grob kann das Deep Web unterschieden werden in "Inhalte, die nicht frei zugänglich sind" und "Inhalte, die nicht von Suchmaschinen indiziert werden". Die Größe des Deep Web kann nur geschätzt werden – es wird davon ausgegangen, dass es ein Vielfaches des direkt zugänglichen Webs umfasst. Suchmaschinen werden ständig weiterentwickelt, daher können Webseiten, die gestern noch zum Deep Web gehörten, heute schon Teil des Oberflächenwebs sein.

Eigenschaften

Nach einer Studie (Bergmann 2001) der Firma [http://www.brightplanet.com BrightPlanet] ergeben sich für das Deep Web folgende Eigenschaften: Die Datenmenge des Deep Web sei etwa 400 bis 550 mal größer als die des Surface Web. Allein 60 der größten Deep Web Seiten enthalten etwa 750 Terabyte an Informationen, was die Menge des Surface Web um den Faktor 40 übersteigt. Es existieren angeblich mehr als 200.000 Deep-Websites. So haben laut der Studie Webseiten aus dem Deep Web durchschnittlich 50 % mehr Zugriffe pro Monat, und seien öfter verlinkt als Webseiten aus dem Surface Web. Das Deep Web sei auch die am schnellsten wachsende Kategorie von neuen Informationen im Web. Trotzdem sei der im Internet suchenden Öffentlichkeit die normale Deep Webseite kaum bekannt. Mehr als die Hälfte des Deep Web sei in themenspezifischen Datenbanken angesiedelt. Mehr als 95 % des Deep Web seien gebührenfrei zugänglich. Da Bright Planet mit DQM2 eine kommerzielle Suchhilfe anbietet, ist die stark überschätzte Größenangabe mit großer Vorsicht zu genießen. Die geschätzte Datenmenge des Deep Web muss um einige [http://www.brightplanet.com/technology/deepweb/Table2.asp Daten] bereinigt werden:
- Dubletten aus Bibliothekskatalogen die sich überschneiden
- Datensammlung des National Climatic Data Center (370.000 GByte)
- Daten der NASA (220.000 GByte)
- weitere Datensammlungen (National Oceanographic Data Center & National Geophysical Data Center, Right to know Network, Alexa, ...) Anhand der Anzahl der Datensätze zeigt sich, dass die Studie die Größe des Deep Web um das zehnfache überschätzt. Allein der Informationsanbieter LexisNexis hat mit 4,6 Milliarden Datensätzen mehr als die Hälfte der Anzahl der Datensätze des Suchmaschinenprimus Google. Das Deep Web ist daher sicher weitaus größer als das Oberflächenweb. In einer [http://www.sims.berkeley.edu/research/projects/how-much-info-2003/internet.htm Untersuchung] der University of California, Berkeley aus dem Jahr 2003 wurden folgende Werte als Umfang des Internets ermittelt: Surface Web – 167 Terabyte, Deep Web – 91.850 Terabyte. Die gedruckten Bestände der Library of Congress in Washington, der größten Bibliothek der Welt, umfassen 10 Terabyte.

Arten des Deep Web

Nach Sherman & Price (2001) werden fünf Typen des Invisible Web unterschieden: „Opaque Web“, „Private Web“, „Proprietary Web“, „Invisible Web“ und „Truly invisible Web“.

Opaque Web

Das Opaque Web (engl. undurchsichtig) sind Webseiten, die indiziert werden könnten, zurzeit aber aus Gründen der Performance oder Aufwand-Nutzen-Relation nicht indiziert werden (Suchtiefe, Besuchsfrequenz). Suchmaschinen berücksichtigen nicht alle Verzeichnisebenen und Unterseiten (max. 100 KB) einer Webseite. Beim Erfassen von Webseiten steuern Webcrawler über Links zu den folgenden Webseiten. Webcrawler selbst können nicht navigieren, sich sogar in tiefen Verzeichnisstrukturen verlaufen, Seiten nicht erfassen und nicht zurück zur Startseite finden. Aus diesem Grund berücksichtigen Suchmaschinen oft höchstens fünf oder sechs Verzeichnisebenen. Umfangreiche und somit relevante Dokumente können in tieferen Hierarchieebenen liegen und wegen der beschränkten Erschließungstiefe von Suchmaschinen nicht gefunden werden. Dazu kommen Dateiformate, die nur teilweise erfasst werden können (z.B. PDF, Google indiziert immer nur die ersten 120 KB – etwa 100.000 Textzeichen – einer PDF-Datei). Es besteht eine Abhängigkeit von der Häufigkeit der Indizierung einer Webseite (täglich, monatlich). Außerdem sind ständig aktualisierte Datenbestände, Messdaten, Echtzeit-Daten betroffen. Webseiten ohne Hyperlinks oder Navigationsystem, unverlinkte Webseiten, Einsiedler-URLs oder Orphan-Seiten (engl. Waise) fallen ebenfalls darunter.

Private Web

Das Private Web beschreibt Webseiten, die indiziert werden könnten, aber auf Grund von Zugangsbeschränkungen des Webmasters nicht indiziert werden. Dies können Webseiten im Intranet (interne Webseiten) sein, aber auch passwortgeschützte Daten (Registrierung und evtl. Kennwort und Login), Zugang nur für bestimmte IP-Adressen, Schutz vor einer Indizierung durch den Robots Exclusion Standard oder Schutz vor einer Indizierung durch die Meta-Tag-Werte noindex, nofollow und noimageindex im Quelltext der Webseite.

Proprietary Web

Mit Proprietary Web sind Webseiten gemeint, die indiziert werden könnten, die jedoch nur nach Anerkennung einer Nutzungsbedingung zugänglich sind (kostenlos oder kostenpflichtig). Derartige Webseiten sind üblicherweise erst nach einer Identifizierung (Webbasierte Fachdatenbanken) abrufbar.

Invisible Web

Unter das Invisible Web fallen Webseiten, die indiziert werden könnten, die jedoch aus kaufmännischen oder strategischen Gründen nicht indiziert werden - wie zum Beispiel Datenbanken mit einem Webformular.

Truly Invisible Web

Mit Truly Invisible Web werden Webseiten bezeichnet, die nicht indiziert werden können. Das können Datenbankformate sein, die vor dem WWW entstanden sind (Einige Hosts), Dokumente, die nicht direkt im Browser angezeigt werden können, Nicht-Standardformate genauso wie Dateiformate, die nicht erfasst werden können (zum Beispiel Flash und Grafikformate). Dazu kommen komprimierte Daten, oder Webseiten, die nur über eine Benutzernavigation, die Grafiken (Image Maps) oder Scripte (Frames) benutzt, zu bedienen sind. Außerdem gibt es auch von Suchmaschinen absichtlich vernachlässigte Daten.

Datenbanken

Dynamisch erstellte Webseiten

Suchmaschinen nutzen Webcrawler (Suchroboter), die ununterbrochen im Netz unterwegs sind, um neue Webseiten zu finden. Diese Webcrawler folgen den Hyperlinks der Webseiten. Eine der technischen Grundlagen des World Wide Web und von Hyperlinks ist die Hypertext-Auszeichnungssprache HTML, Hyperlinks sind in HTML verfasst [http://de.selfhtml.org/html/verweise/definieren.htm (SelfHTML, Links)]. Webcrawler bearbeiten fast ausschließlich statische Webseiten in HTML. Datenbanken, deren Seiten erst auf Anfrage dynamisch generiert werden, werden von den link-basierten Webcrawlern der Suchmaschinen noch kaum durchsucht. Die Suchroboter können Datenbankabfragen von Servern mit Datenbankverwaltungssystemen wie MySQL oder Microsoft Access, die mit Programmiersprachen wie PHP, ASP oder CGI-Skripten dynamisch erstellt wurden, oft nicht indizieren. Dynamisch erstellte Webseiten sind zu erkennen an den Sonderzeichen ?, &, %, und = im URL. Der Teil eines dynamischen URLs mit den Suchparametern (nach dem Sonderzeichen) nennt sich Query-String. Als Schnittstelle zum Internet (Gateway) dient dynamischen Datenbanken eine Bedienoberfläche mit einem Such-Formular in HTML. Dieses Suchformular oder diese Suchmaske der Datenbanken wird von Suchmaschinen gefunden. Um auf diese Datenbanken zugreifen zu können, müssten Suchmaschinen für jeden einzelnen Datenbanktypus eine eigene Zugriffsmethode (einen sogenannten Wrapper) einpflegen, was durch einen hohen Entwicklungsaufwand in keinem Kosten-Nutzen Verhältnis stehen würde. Kooperative Datenbankanbieter erlauben Suchmaschinen über JDBC oder andere Mechanismen einen Zugriff auf den Inhalt ihrer Datenbank. Nicht kooperative Datenbanken erlauben den Datenbankzugriff nur über ein Such-Formular. Das Oberflächenweb ist einfach zu definieren, es besteht aus HTML-Seiten, die von Webcrawlern indiziert wurden.

Hosts und Fachdatenbanken

Hosts sind kommerzielle Informationsanbieter, die Fachdatenbanken unterschiedlicher Informationsproduzenten innerhalb einer Oberfläche bündeln. Manche Datenbankanbieter (Hosts) oder Datenbankproduzenten selbst betreiben relationale Datenbanken, deren Daten nicht ohne eine spezielle Zugriffsmöglichkeit (Retrieval-Sprache, Retrieval-Tool) abgerufen werden können. Webcrawler verstehen weder die Struktur noch die Sprache, die benötigt wird, um Informationen aus diesen Datenbanken auszulesen. Viele Hosts sind seit den 1970er Jahren als Online-Dienst tätig und betreiben in ihren Datenbanken teilweise Datenbanksysteme, die lange vor dem WWW entstanden sind. Die Vorteile von Informationen aus Host-Datenbanken sind unter anderem die hohe Qualität, Relevanz, Aktualität, Authentizität, Integrität und Neutralität. Beispiele für Datenbanken: Bibliothekskataloge (OPAC), Börsenkurse, Fahrpläne, Gesetzestexte, Jobbörsen, Nachrichten, Patente, Telefonbücher, Webshops, Wörterbücher.

Recherche im Internet

Suchwerkzeuge [http://www.phil-fak.uni-duesseldorf.de/infowiss/content/mitarbeiter/stock.php Stock] (HHU Düsseldorf) unterscheidet nach den Weltregionen digitaler Informationen, dem Oberflächenweb und dem Deep Web. Im Oberflächenweb kann recherchiert werden mit den Suchwerkzeugen Suchmaschine, Webkatalog, Meta-Suchmaschine und Portal, im Deep Web mit Datenbanken und Hosts. Unter Querweltein-Ergänzungen versteht er Links vom Oberflächenweb ins Deep-Web (z.B. Brückenseiten) oder umgekehrt. Hybrid-Systeme sind Suchwerkzeuge, die quer durch die Internetwelten Recherchen anbieten. [http://www.leuchtturm.fh-koeln.de/10.html Vortrag: Suchmaschinen und Informationsflut, 05/2003] Informationskompetenz Mit Hilfe des Internet ist die Recherche nach Informationen für die Bevölkerung in einem bisher ungekannten Ausmaß möglich. Das Problem besteht darin, in diesem unüberschaubaren, schwer auswertbaren und riesigen Angebot hochwertige Seiten zu finden und auf zufriedenstellende Weise Informationsperlen von Informationsmüll zu trennen. Die informationelle Absicherung wird für viele Nutzer oft durch populäre Suchdienste bestimmt. Obwohl eine Vielzahl von Suchdiensten bereit steht, um Informationen zu erschließen, werden oft nur wenige marktführende Suchmaschinen (Google) und Webverzeichnisse (Yahoo!) verwendet, die als Ergebnis bevorzugt populärwissenschaftliche Webseiten bieten. Es ist zweifelhaft, ob populäre Suchdienste in der Lage sind, Qualität und Umfang der Informationen zu beurteilen, die momentan im Internet abrufbar sind. Qualität von Online-Dokumenten Jeder kann alles im Internet veröffentlichen, eine Qualitätssicherung ist kaum vorhanden. Webseiten, die von Privatpersonen erstellt werden, lassen sich nur schwer auf Zuverlässigkeit überprüfen. Nicht alle Dokumentengattungen besitzen die gleiche Qualität (im Alltag etwa Werbematerial, Tagespresse, Fachzeitschriften oder Bücher). Anhaltspunkt für höherwertige Informationen ist z. B. die Begutachtung durch einen Redakteur oder eine wissenschaftliche Verifizierung (z.B. doppelblinde peer review). Laien sind oftmals nicht in der Lage, Suchergebnisse richtig zu interpretieren. Zum Beispiel konnten in einer [http://www.urac.org/news_release.asp?navid=news&pagename=news_releases&id=1049 Studie] des amerikanischen "Center of Disease Control" Anwender die Ergebnisse einer Suche nach gesundheitsrelevanten Themen im Internet nicht kritisch und zuverlässig beurteilen. Zudem sind viele Informationen falsch, überholt, unvollständig oder bestehen aus Werbung (Gesponserte Links). Internetquellen sollten richtig bewertet ([http://lotse.uni-muenster.de/geschichte/literatur_suchen/suchmaschinen/internetquellen_bewerten-de.php Anleitung]) oder z. B. mit einer dokumentenbasierten Internet-Recherche ([http://mitarbeiter.fh-heilbronn.de/~ellwein/Dokumentbasierte%20Suche.pdf Anleitung, PDF]) gesucht werden. Texte im Internet lassen sich zudem durch Hacker manipulieren, Diskussionsforen oder Chatgruppen besitzen keine Qualitätssicherung, es existieren Webseiten mit skurrilen Berichten, mit Beiträgen zu Außerirdischen, mit (allgemeiner) Paranoia (Waffennarren, Urban Legends), mit (je nach Staat) kriminellen Inhalten – Informationen können durch eine geänderte Rechtsgrundlage und Unterlassung einer Aktualisierung falsch sein – oder Daten können vorsätzlich falsch sein (Zensur, Propaganda, ideologische Berichterstattung). Der Wert vieler Informationen altert, nimmt mit der Zeit ab und wird schon nach wenigen Jahren nahezu unbrauchbar, daneben entstehen immer wieder neue Fachgebiete. In Wikis (z.B. Wikipedia) kann jeder Autor Fehler begehen, seine eigenen Fehler oder die von anderen Autoren jedoch auch ausgleichen. Flüchtigkeit des WWW Die Anzahl aller Webseiten wächst schneller als die Bandbreite, die Suchmaschinen zur Verfügung steht, diese Webseiten zu indizieren. Auch die größten Suchmaschinen haben nur etwa [http://www.nature.com/cgi-taf/DynaPage.taf?file=/nature/journal/v400/n6740/abs/400107a0_fs.html 16%] (1999) der Inhalte des Internets indiziert. Suchmaschinen legen sich eigene Datenbanken an, in denen sie Informationen (Zeichenfolgen als Stichwörter, Ankertexte) der Webseiten ablegen, sie besitzen keinen inhaltlich erschlossenen Volltextindex der Webseiten. Sucher recherchieren also nicht im Internet, sondern in den Datenbanken der Suchmaschinen. Da Webcrawler ständig das Internet durchsuchen, wachsen die Datenbanken der Suchmaschinen ständig und verändern sich. Dieselben Anfragen können so an aufeinander folgenden Tagen unterschiedliche Ergebnisse liefern. Durch neue technische Möglichkeiten werden fortlaufend Struktur, Layout und Webdesign von Webseiten verändert. Relevante Suchergebnisse sind daher nicht immer reproduzierbar und eine identische Recherche führt schlimmstenfalls ins Leere (Toter Link). Im Internet nicht mehr vorhandene Webseiten können mit Glück in der Wayback-Machine aufgerufen werden. Die Halbwertszeit von Hyperlinks beträgt etwa [http://www.netzeitung.de/internet/177731.html 55 Monate] (Netzeitung), die Lebenszeit eines Dokuments im WWW [http://www.nzz.ch/netzstoff/2003/2003.01.13-fe-article8LW7A.html 2,5 Monate] (Neue_Zürcher_Zeitung). Weitere Probleme von Suchmaschinen Von der Veröffentlichung einer Webseite bis zur Aufnahme in den Suchmaschinenindex können Wochen bis Monate vergehen. Aktuell im Internet bereitgestellte Dokumente können Suchmaschinen nicht sofort nachweisen. Zudem gibt es für neue Webseiten kein sinnvolles Ranking. Auch technische Manipulationen (Suchmaschinenoptimierung, Suchmaschinenspam, Linkfarm) und erkaufte Platzierungen beeinflussen die Sortierung der Ergebnislisten (Page-Rank). Der Page-Rank lässt die Nutzerfrage weitgehend außer Acht, und seine vorderen Plätze sind häufig wenig relevant. Ausblick Suchmaschinen machen zunehmend die Inhalte des Deep Web zugänglich und recherchierbar (Produktsuche, Routenplaner, Patente, Wetter). Zudem entwickeln sie sich weg vom bisher maßgeblichen Page-Rank hin zu einer Orientierung an den personalisierten Bedürfnissen des Nutzers (Beispiel [http://eurekster.com Eurekster]). Bei einer Recherche nach aktuellen Fachinformationen ist eine Suche mit Suchmaschinen zurzeit noch unzulänglich. Gute Informationen benötigen die Kenntnis über entsprechende kostenlose Fachdatenbanken und deren Einstiegsadressen – oder kosten Geld (Host). Das Wissen über geeignete Gateways zu Informationsressourcen ist jedoch unter Nutzern wenig verbreitet. Es entwickelt sich zunehmend eine Zahlungsbereitschaft für qualitativ hochwertige Daten.

Siehe auch


- Portal, Wissen, Information, Kommunikation und Medien
- Nachschlagewerke im Internet
- Information-Retrieval
- semantisches Web

Literatur


- Stock, Mechthild und Wolfgang, Recherchieren im Internet, Expert Verlag 2003, ISBN 3-8169-2278-3
- Ellwein, Christian, Suche im Internet für Industrie und Wissenschaft, Oldenbourg-Industrieverl., München 2002 ISBN 3-486-27039-7
- Bergmann, Michael: The Deep Web: Surfacing Hidden Value, The Journal of Electronic Publishing, Jahrgang 7, Nr.1, 2001 [http://www.press.umich.edu/jep/07-01/bergman.html]
- Warnick, W. L. et al.: Searching the Deep Web, D-Lib Magazine, January 2001, Volume 7 Number 1, [http://www.dlib.org/dlib/january01/warnick/01warnick.html]
- Sherman, Chris; Price, Gary; The Invisible Web: Finding Hidden Internet Resources Search Engines Can't See, Cyberage Books 2001, ISBN 0-910965-51-X, [http://www.invisible-web.net Webseite zum Buch, Stand 2001]
- Dirk Lewandowski: "Web Information Retrieval: Technologien zur Suche im Internet" DGI, 2005 ISBN 3-925474-55-2. [http://www.durchdenken.de/lewandowski/web-ir Online-Version des Buchs]" (Kap. 3)

Weblinks


- [http://sh012.k12.sd.us/tie2004/article.htm The invisible web: uncovering sources search engines can't see. Chris Sherman; Gary Price. Full Text: COPYRIGHT 2003 University of Illinois at Urbana-Champaign]
- [http://library.albany.edu/internet/deepweb.html The Deep Web, Universitätsbibliothek Albany, New York]
- [http://library.rider.edu/scholarly/rlackie/Invisible/Inv_Web.html Those Dark Hiding Places]
- [http://www.inf.uni-konstanz.de/%7Egriesbau/files/kommerzialisierung_bis_deep_web.pdf Uni Konstanz, Von der Kommerzialisierung bis zum Deep Web, Problemfelder der Internetsuche, und andere Texte] (PDF-Dokument)
- [http://www.ub.uni-bielefeld.de/biblio/search/help/invisibleweb.htm Was Google nicht findet, Universitätsbibliothek Bielefeld] Kategorie:World_Wide_Web Kategorie:Dokumentation

Sky Marshal

Sky Marshals (Luftsicherheitsbegleiter) sind nichtuniformierte, größtenteils mit Schusswaffen ausgerüstete und speziell geschulte Polizeivollzugsbeamte, die Passagierflüge begleiten und für die Sicherheit der Passagiere, der Besatzung und die des Flugzeuges sorgen. Hauptaufgabe ist die Bekämpfung von Terrorismus im Flugzeug (Bekämpfung von Anschlägen und Flugzeugentführungen). In Deutschland setzt die Bundespolizei nach dem Vorbild der USA Beamte als Luftsicherheitsbegleiter ein. Die Einführung der Sky Marshals in den USA erfolgte als Reaktion auf die Terroranschläge am 11. September 2001 in den USA. Aber schon seit den 1970er Jahren gab es bewaffnete Flugbegleiter auf einzelnen Flügen der Fluggesellschaften Swiss Air, El Al und Sri Lankan Airlines. Weitere EU-Staaten wie Frankreich, Großbritannien, Italien und Spanien haben ebenfalls die Absicht erklärt, Luftsicherheitsbegleiter einzusetzen.

Weblinks


- [http://www.bundespolizei.de/cln_030/nn_484484/DE/Home/02__Aufgaben/Luftsicherheit/luftsicherheit__node.html__nnn=true Luftsicherheitsaufgaben der Bundespolizei]
- [http://bundesrecht.juris.de/bundesrecht/bgsg_1994/__4a.html BPolG § 4a Sicherheitsmaßnahmen an Bord von Luftfahrzeugen] (Rechtsgrundlage) Kategorie:Luftfahrtpersonal Kategorie:Sicherheit Kategorie:Polizei

wycieczki szkolne wegetarianizm media keno apartments in Nice










































:: RELATED NEWS ::
Нефелин
Нефелин је минерал из групе алуминосиликата са молекулском формулом KNa3(AlSiO4)4. Кристална структура - хексагонална
Кнез Милош Обреновић владао је Србијом од 18151839. и од 18581860. године. Био је велики држав
Досијеи икс
: Видите такође Досије икс (књиге) и Досије икс филм Досије икс је била популарна америчка Каолинит је минерал са општом молекулском формулом: Al4[Si4O10](OH)8. Спада у групу алуминосиликата. У с
Алуминијум хидроксид
Алуминијум хидроксид, молекулска формула - Al(OH)3, је најстабилније једињење алуминијума под нормалним условима. Може се наћи
Алуминијум нитрид
Алуминијум нитрид (AlN) је неорганско једињење алуминијума. Састоји се од једног атома алуминијума и једног атома азота . папира. Веома је ефективан у убијању Шпанских пужева.

Добијање

Алуминијум сулфат се може добити растварањем