Was ist eine Suchmaschine?

Eine Suchmaschine ist ein spezielles Programm um nach Dokumenten, in einem Computer oder Computernetzwerk wie dem Internet, zu recherchieren. Die Suchmaschine liefert nach Eingabe eines Suchbegriffs eine Liste von Verweisen auf moegliche relevante Dokumente, die meist mit Titel und einem kurzem Auszug des jeweiligen Dokuments angezeigt werden. Die Aufgabenbereiche und Bestandteile einer Suchmaschine sind unter anderem die Erstellung und Pflege eines Indexes, das Verarbeiten von Suchanfragen sowie die Aufbereitung der Ergebnisse in einer moeglichst sinnigen Form. Die Datenbeschaffung erfolgt normalerweise automatisch, im Internet durch sogenannte Webcrawler Computerprogramme auch Spider oder Robot genannt, die automatisch das World Wide Web durchsuchen und die Webseiten analysieren. Es gibt verschiedene Arten von Suchmaschinen, das meistgenutzte Dateiformat ist hierbei HTML und die bekannteste Art ist die Metasuchmaschine. Eine Metasuchmaschine schickt Suchanfragen parallel an mehrere normale Suchmaschinen und kombiniert die einzelnen Ergebnisse zu einer Ergebnisseite. Als grosser Vorteil wird hierbei die groessere zugrundliegende Datenmenge gesehen. Ein Nachteil ist die lange Dauer der Anfragebearbeitung und ausserdem ist das Ranking durch reine Mehrheitsfindung von fragwuerdigen Wert. Die Metasuchmaschinen sind vor allem bei selten vorkommenden Suchbegriffen von Vorteil.

Wird die Datenbeschaffung manuell mittels Anmeldung oder durch Lektoren vorgenommen, handelt es sich dabei nicht um eine Suchmaschine, sondern um einen Katalog (Verzeichnis). In solchen Verzeichnissen sind die Dokumente hierarchisch in einem Inhaltsverzeichnis nach Themen organisiert, beispielsweise wie bei Yahoo. Die sogenannten Echtzeit-Suchmaschinen starten den Indexierungsvorgang erst nach einer Anfrage, die so gefundenen Seiten sind zwar Top aktuell, allerdings laesst die Qualitaet der Ergebnisse aufgrund der fehlenden breiten Datenbasis oft zu wuenschen uebrig, insbesondere bei weniger gaengigen Suchbegriffen.

Die Darstellung der Suchergebnisse werden nach der Relevanz (Ranking) sortiert, wofuer jede Suchmaschine ihre meist geheim gehaltenen eigenen, Kriterien heranzieht. Dazu zaehlen die Haeufigkeit und Stellung der Suchbegriffe im gefundenen Dokument, die Einstufung und Anzahl der zitierten Dokumente, die Haeufigkeit von Verweisen anderer Dokumente auf das im Suchergebnis enthaltene Dokument sowie der darin enthaltene Text und die Einstufung und Qualitaet der verweisenden Dokumente. Seine groesste Bekanntheit erlangte der PageRank durch den Ranking Algorithmus der Suchmaschine Google. Einige Suchmaschinen sortieren ihre Suchergebnisse nicht nur nach der Relevanz, sondern lassen gegen Bezahlung auch Einflussnahme auf ihre Ausgabe zu. In den vergangenen Jahren hat sich bei den grossen Anbietern eine Trennung zwischen den Suchergebnissen und den als bezahlte Treffer markierte eingeblendete Werbung durchgesetzt. Die bezahlten Treffer werden jetzt meist kontextbezogen zur Suchanfrage ausgegeben. Als aeltester Vorfahre der heute allseits bekannten Suchmaschinen und Webverzeichnissen gilt Archie. Archie ist eine Suchmaschine die speziell fuer das Indexieren von FTP Archiven entwickelt wurde, der Name stammt vom englischen Wort archive (archivieren) ab. Sie wurde bereits im November 1990 als Archie v1.0 in Betrieb genommen.