Expertensuche in semantisch integrierten Datenbeständen
Wissen ist das intellektuelle Kapital eines Unternehmens und der effektive Zugriff darauf entscheidend für die Anpassungsfähigkeit und Innovationskraft. Eine häufig angewandte Lösung für den erfolgreichen Zugriff auf diese Wissensressourcen ist die Umsetzung der Expertensuche in den Daten der verteilten Informationssysteme des Unternehmens. Aktuelle Expertensuchverfahren berücksichtigen zur Berechnung der Relevanz eines Kandidaten zumeist nur die Information aus Datenquellen (u. a. E-Mails oder Publikationen eines Kandidaten), über die eine Verbindung zwischen dem Thema der Frage und einem Kandidaten hergestellt werden kann. Die aus den Datenquellen gewonnene Information, fließt dann gewichtet in die Relevanzbewertung ein. Analysen aus dem Fachbereich Wissensmanagement zeigen jedoch, dass neben dem Themenbezug auch noch weitere Kriterien Einfluss auf die Auswahl eines Experten in einer Expertensuche haben können (u. a. der Bekanntheitsgrad zwischen dem Suchenden und Kandidat). Um eine optimale Gewichtung der unterschiedlichen Bestandteile und Quellen, aus denen sich die Berechnung der Relevanz speist, zu finden, werden in aktuellen Anwendungen zur Suche nach Dokumenten oder zur Suche im Web verschiedene Verfahren aus dem Umfeld des maschinellen Lernens eingesetzt. Jedoch existieren derzeit nur sehr wenige Arbeiten zur Beantwortung der Frage, wie gut sich diese Verfahren eignen um auch in der Expertensuche verschiedene Bestandteile der Relevanzbestimmung optimal zusammenzuführen. Informationssysteme eines Unternehmens können komplex sein und auf einer verteilten Datenhaltung basieren. Zunehmend finden Technologien aus dem Umfeld des Semantic Web Akzeptanz in Unternehmen, um eine einheitliche Zugriffsschnittstelle auf den verteilten Datenbestand zu gewährleisten. Der Zugriff auf eine derartige Zugriffschnittstelle erfolgt dabei über Abfragesprachen, welche lediglich eine alphanumerische Sortierung der Rückgabe erlauben, jedoch keinen Rückschluss auf die Relevanz der gefundenen Objekte zulassen. Für die Suche nach Experten in einem derartig aufbereiteten Datenbestand bedarf es zusätzlicher Berechnungsverfahren, die einen Rückschluss auf den Relevanzwert eines Kandidaten ermöglichen. In dieser Arbeit soll zum einen ein Beitrag geleistet werden, der die Anwendbarkeit lernender Verfahren zur effektiven Aggregation unterschiedlicher Kriterien in der Suche nach Experten zeigt. Zum anderen soll in dieser Arbeit nach Möglichkeiten geforscht werden, wie die Relevanz eines Kandidaten über Zugriffsschnittstellen berechnet werden kann, die auf Technologien aus dem Umfeld des Semantic Web basieren.
Knowledge is the intellectual capital of an organisation. The effective access to it is essential for its adaptability and innovative capacity. An extensively used solution for this challenge is the usage of an expert search application on top of the accessible data sources managed through the organisation information systems. Recent expert search implementation calculate the relevance of a candidate through the analysis of connections that could be established between accessible data sources with relation to the candidate and the topic of the query. On this basis the relevance of a candidate is commonly computed through the summarization of identified connections, under consideration of the importance of different types of used data sources (e. g. e-mail communication or publications of candidates). However, findings in the field of knowledge management demonstrate that beside this closeness of a candidate to the topic of the query, various further criteria take part in the decision for the selection of a candidate, but the effective aggregation of various parts of a relevance assessment stays a complex task. In the context of document search and web search, an emergent solution for the optimal aggregation of different parts of a relevance calculation, is the application of techniques from the field of machine learning. Only few findings exist so far that answer the question how well such techniques could be applied for the effective aggregation of various criterias that are part of the relevance assessment in an expert search task. Information systems of an organisation can be complex and distributed. To overcome the challenges of data silos, technologies in the scope of Semantic Web become more and more accepted as an effective solution to build up interfaces for standardized access to distributed data sources. Access to these interfaces is commonly implemented through query languages that just support data selection but no relevance ranking. Inferring the relevance of candidates in such a standardized access interface needs application of further procedures. Hence, this thesis analyses and discusses the application of machine learning techniques for the effective aggregation of various criterias that are part of an extensive expert search implementation, under consideration of data sources that are accessible through Semantic Web technologies.
Preview
Cite
Access Statistic

Rights
Use and reproduction:
All rights reserved