Dezentrale, kontextbasierte Steuerung der Suche im Internet

Kubek, Mario GND

Die Auswahl von Suchbegriffen, die einerseits ein Informationsbedürfnis passend beschreiben, aber durch die auch relevante Suchergebnisse gewonnen werden können, spielt besonders bei der Suche im Internet eine große Rolle. Durch die riesige Menge an Informationen im Internet ist es jedoch für Nutzer oftmals nicht leicht, gesuchte Informationen tatsächlich zu finden. Die Berücksichtigung des jeweiligen Suchkontextes eines Nutzers bei der Zusammenstellung von Suchergebnissen, d.h. die Nutzung seines erlangten Wissens aus vorangegangen Suchsitzungen, findet zu diesem Zweck aktuell bei der Verwendung von Websuchmaschinen keine Anwendung. Diese versuchen vielmehr durch simple Erweiterung von Suchanfragen mit gängigen, aber nicht immer passenden Begriffen, den Nutzer zu unterstützen. Diese Arbeit stellt mehrere Verfahren vor, den Suchkontext durch Techniken der Verarbeitung von lokal auf Endgeräten des Nutzers gespeicherten, natürlichsprachigen Textdokumenten, insbesondere durch Analyse von Kookkurrenzgraphen, automatisiert zu erheben und geeignete Begriffe aus ihnen zur Verbesserung der Suche im Internet einzusetzen. Die Bestimmung dieser Begriffe erfolgt dabei unter Einbeziehung der semantischen Beziehungen zwischen Wortformen in diesen Texten durch diesbezüglich erweiterte Varianten der Algorithmen PageRank und HITS sowie durch ein Verfahren der lokalen Suchworterweiterung. Es wird nachgewiesen, dass die Verwendung dieser Suchbegriffe die Anzahl der dem Nutzer zurückgegebenen, relevanten Suchergebnisse maßgeblich steigert. Ein vorgestellter, auf PageRank basierender, Clustering-Algorithmus ist in der Lage, lexikale Verkettungen zu erzeugen, deren Begriffe sich zur Verfolgung von Themen im Internet eignen. Zusätzlich wird ein neuartiges, auf HITS basierendes, Verfahren präsentiert, das die Verlinkung von Webdokumenten bezüglich ihrer semantischen Abhängigkeiten untereinander vorschlägt. Auf diese Weise wird eine dokumentübergreifende Themenverfolgung ermöglicht, die über simple Erfassung semantischer Ähnlichkeiten zwischen Dokumenten hinaus geht. Die Arbeit wird abgerundet durch die Vorstellung zweier interaktiver Suchapplikationen, die die zuvor beschriebenen Verfahren implementieren.

Vorschau

Zitieren

Zitierform:

Kubek, Mario: Dezentrale, kontextbasierte Steuerung der Suche im Internet. Hagen 2012. FernUniversität in Hagen.

Zugriffsstatistik

Gesamt

Volltextzugriffe:
Metadatenansicht:

12 Monate

Volltextzugriffe:
Metadatenansicht:

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten

Export

powered by MyCoRe