Die Suchmaschinen Architektur

Die Mehrheit der Besucher von Suchmaschinen verbindet mit dem Begriff "Suchmaschine" meistens nur die Website des Suchdienstes. Die grossen Suchmaschinen haben aber viel mehr Dienstleistungen als nur den Suchdienst. Aber nur schon alleine dieser Bereich ist so komplex, dass es Sinn macht sich das näher anzuschauen. Um eine Suchmaschine besser zu verstehen, sollte man begreifen wie sie funktioniert und aufgebaut ist.

Viele Nutzer gehen davon aus, dass die Suchergebnisse "Live" sind. Bevor aber eine Suchergebnissliste angezeigt wird, ist schon "hinter der Weboberfläche" einiges passiert. Grundsätzlich kann man es in drei Bereiche unterteilen:

  1. Datengewinnnung,
  2. Datenanalyse und Datenverwaltung,
  3. Verarbeitung von Suchanfragen.

Webcrawler-System

Vor der Auswertung müssen die Daten zuerst beschafft und in einem geeignetem Format gespeichert werden. Diese Funktion erledigt der Webcrawler-System, der für das Sammeln, Speichern und Aktualisieren von den Dokumenten zuständig ist. Nur durch regelmässige Vergleiche kann die Aktualität des gespeicherten Webangebotes gesichert werden.

IR-System

Nach dem die gesammelten Dokumente gespeichert sind baut ein sogennanter IR-System (Information-Retrieval-System) eine durchsuchbare Datenstruktur auf. Die so erstellte Dokumenten-Präsentation wird durch bestimmte Methoden auf die Relevanz geprüft. Das Gewicht (Relevanzwert) und die Zuordnung der Schlagwörter (Descriptoren) bezeichnet man dann als Indexierung.

Query-Prozessor

Der Query-Prozessor sucht nach den eingegebenen Suchbegriffen in dem Index des IR-Systems und erstellt durch die Suchmaschinen-Website eine Ergebnisliste, die bei dem Benutzer durch den Browser ausgegeben wird.

googleplus facebook