Dynamic Knowledge Acquisition from Complex Data with Rough Sets

Huang, Yanyong

This dissertation is concerned with knowledge discovery from complex data in dynamic environments, where complex data refer to different types of object features and information sources, and dynamicity implies the variation of the objects, their features and of the feature values over time. Within the framework of rough sets, knowledge refers to the ability to classify data in the form of “IF-THEN” decision rules, which may change with the variation of the complex data in dynamic environments. For four kinds of typical complex data, rough sets-based incremental algorithms for dynamic knowledge acquisition are proposed and discussed: (1) Probabilistic set-valued data have set-values with a probability distribution. Considering addition and deletion of features in probabilistic set-valued data, an extended variable precision rough set model is built based on a novel binary relation, and matrix-based incremental algorithms are developed to build and update IF-THEN rules. (2) Fuzzy data are feature values as indicated by fuzzy memberships. In terms of the simultaneous variation of objects and their features described by fuzzy data, a matrix representation of rough fuzzy sets is presented by defining a relation matrix associated with a novel matrix operator. A corresponding incremental method to update IF-THEN rules is proposed, which can update multiple relation matrix entries. (3) Multi-source hybrid data originate from different information sources and have multiple types of features. Taking the simultaneous variation of objects, features and feature values in multi-source hybrid data into account, a novel multi-source composite rough set model is proposed by integrating multiple binary relations and a matrix-based incremental method to update IF-THEN rules, which can avoid the disclosure of decision rules. (4) Multiple-source interval-valued data are collected from different information sources. Considering addition and deletion of sources for multi-source interval-valued data, incremental fusion mechanisms are discussed and suitable incremental fusion algorithms are developed, which can reduce ambiguities and uncertainties in the data and improve the quality of the knowledge acquired. Theoretical analyses and experiments are conducted to verify the efficiency of the methods proposed. This study is beneficial to analyze the uncertainty problems of complex data due to their variety and veracity, and provides new methodologies for dynamic knowledge acquisition from complex data. Furthermore, the incremental methods presented can improve the processing speed of big data.

Diese Dissertation befasst sich mit der Entdeckung von Wissen aus komplexen Daten in dynamischen Umgebungen, wobei sich komplexe Daten auf Daten mit verschiedenen Arten von Merkmalen und Informationsquellen beziehen und die Dynamik die Variation der Objekte, Merkmale und Merkmalswerte über die Zeit impliziert. Im Rahmen von Grobmengen bezieht sich Wissen auf die Fähigkeit zur Klassifizierung in Form von „IF-THEN“ -Entscheidungsregeln und ändert sich mit der Variation der komplexen Daten in dynamischen Umgebungen. Für vier Arten typischer komplexer Daten werden Grobmengen basierte inkrementelle Algorithmen für die dynamische Wissenserfassung dargestellt und diskutiert: 1. Probabilistische Mengenwertdaten haben Mengenwerte mit Wahrscheinlichkeits- verteilungen. Unter Berücksichtigung des Addierens und Löschens von Merkmalen in den probabilistischen Mengenwertdaten wird ein erweitertes Grobmengenmodell auf der Grundlage einer binären Beziehung erstellt und werden matrixbasierte inkrementelle Algorithmen entwickelt, um die IF-THEN-Regeln zu bilden und aktualisieren. 2. Fuzzy-Daten sind die von den Fuzzy-Mitgliedschaften beschriebenen Merkmalswerte. In Bezug auf die gleichzeitige Variation von Objekten und Merkmalen in Fuzzy-Daten wird eine Matrixdarstellung von groben Fuzzy-Mengen präsentiert, indem eine Relationsmatrix definiert wird, die einem neuen Matrixoperator zugeordnet ist. Eine entsprechende inkrementelle Methode zum Aktualisieren von IF-THEN-Regeln wird vorgeschlagen, mit der mehrere Relationsmatrixeinträge aktualisiert werden können. 3. Hybriddaten aus mehreren Quellen stammen aus verschiedenen Informationsquellen und weisen mehrere Arten von Merkmalen auf. Unter Berücksichtigung der gleichzeitigen Variation von Objekten, Merkmalen und Merkmalwerten in Hybriddaten aus mehreren Quellen wird ein neues zusammengesetztes Grobmengenmodell aus mehreren Quellen vorgeschlagen, bei dem mehrere binäre Beziehungen und eine matrixbasierte inkrementelle Methode zur Aktualisierung der IF-THEN-Regeln integriert werden. die die Offenlegung von Entscheidungsregeln vermeiden können. 4. Intervallwerte aus mehreren Quellen werden aus verschiedenen Informationsquellen erfasst. In Anbetracht des Addierens und Löschens von Quellen für Daten mit mehreren Quellen und Intervallen werden inkrementelle Fusionsmechanismen diskutiert und geeignete inkrementelle Fusionsalgorithmen entwickelt, die Unklarheiten und Unsicherheiten in den Daten verringern und die Qualität des erworbenen Wissens verbessern können. Theoretische Analysen und Experimente werden durchgeführt, um die Effizienz der vorgeschlagenen Methoden zu überprüfen. Diese Studie ist nützlich, um die Unsicherheitsprobleme komplexer Daten aufgrund ihrer Vielfalt und Richtigkeit zu analysieren, und bietet neue Methoden für den dynamischen Wissenserwerb aus komplexen Daten. Darüber hinaus können die vorgestellten inkrementellen Methoden die Verarbeitungsgeschwindigkeit von Big Data verbessern.

Vorschau

Zitieren

Zitierform:

Huang, Yanyong: Dynamic Knowledge Acquisition from Complex Data with Rough Sets. Hagen 2020. FernUniversität in Hagen.

Zugriffsstatistik

Gesamt:
Volltextzugriffe:
Metadatenansicht:
12 Monate:
Volltextzugriffe:
Metadatenansicht:

Grafik öffnen

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten

Export

powered by MyCoRe