2 of 1920

Empowering Users in Visual Big Data Analysis by Applying Artificial Intelligence and Machine Learning

Global data volume is growing exponentially, driven by manifold reasons: Smartphones and mobile connectivity, IoT, social media, and many others. Data availability drives progress in many application domains. Examples comprise pharmaceutical research, traceability of contagious diseases, research related to climate change, and data-driven insurance models. The rise of AI is closely connected to the availability of large data quantities. Although AI has been researched since the 1950s, it has recently gained significant momentum since it improves with more data available. AI and ML already affect everyday interactions with digital devices (e.g. face recognition) and will further penetrate all industrial sectors. Generative AI and Large Language Models already demonstrate how AI utilizes Big Data to solve complex tasks while lowering entry barriers and making it available to the general public.

The growing scientific and economic relevance of Big Data, AI, and ML drives research, e.g. the European Commission-funded projects SMART VORTEX and EDISON. SMART VORTEX focused on defining Big Data-related infrastructure and creating a reference implementation. EDISON followed up on this by investigating the corresponding skill gap on the market and creating a competence framework (e.g. skill profiles and education plans). However, it did not investigate the concept of user-empowering Information Systems that lower entry barriers and reduce induction needs. Bornschlegl continued with the research on these challenges with his dissertation. He introduced IVIS4BigData, a reference model for visual Big Data analysis that enables standardized user stereotypes to participate in analyzing Big Data. None of these projects thoroughly considered AI and ML and their implications. However, AI and ML bear the potential to provide methods for analyzing Big Data and improving Big Data infrastructure and tooling. This requires defining AI and ML representation alongside the Big Data analysis pipeline and overcoming an intensified skill challenge, adding capability requirements for AI and ML. Architecture blueprints for implementing this integration do not exist. Thus, it remains a challenge to investigate AI and ML applications for Big Data-related infrastructure and tooling (SMART VORTEX), their impact on user capabilities (EDISON), and their integration into user-empowering Big Data analysis IS (IVIS4BigData).

To close this gap, this dissertation developed AI2VIS4BigData, a reference model for end user-empowering AI and ML integration into the Big Data analysis pipeline that defines AI and ML representation, categorizes user stereotypes, and provides a service-oriented reference architecture. It was implemented for seven application domains (e.g. meteorology) and thoroughly evaluated, e.g. in workshops and studies.

Die weltweite Datenmenge wächst aufgrund vielfältiger Ursachen wie Smartphones und Mobilfunktechnologie, dem Internet der Dinge und sozialen Netzwerken exponentiell. Die Verfügbarkeit von Daten treibt den Fortschritt in verschiedenen Anwendungsdomänen voran. Beispiele umfassen die Medikamentenforschung, die Überwachung ansteckender Krankheiten, Forschung mit Klimawandel-Bezug sowie datengetriebene Versicherungsmodelle. Die steigende Relevanz von KI ist eng mit der Datenverfügbarkeit verbunden. Auch wenn KI bereits seit den 1950er Jahren erforscht wird, so stieg in den letzten Jahren die Bedeutung von KI mit steigender Datenmenge auf Grund mit einer mit den Daten wachsenden Leistungsfähigkeit. KI und maschinelles Lernen beeinflussen schon heute das digitale Leben von jedem (bspw. durch Gesichtserkennung) und werden zukünftig alle industriellen Bereiche durchdringen. Generative KI und große Sprachmodelle (sog. Large Language Models) demonstrieren bereits, wie KI komplexe Aufgaben lösen und gleichzeitig die Hemmschwelle so senken kann, dass die Allgemeinheit daran partizipiert.

Die wachsende wissenschaftliche und wirtschaftliche Relevanz von Big Data, KI und ML beschleunigt die Forschung bspw. durch die von der Europäischen Kommission geförderten Forschungsprojekte SMART VORTEX und EDISON. Der Schwerpunkt von SMART VORTEX lag auf der Definition von Big Data Infrastruktur und Referenzimplementierungen. EDISON hat mit einer Untersuchung der Bedarfslücke der notwendigen Nutzerfähigkeiten daran angeknüpft und ein Kompetenz-Rahmenwerk (z.B. Fähigkeitsprofile, Bildungspläne) geschaffen. Es hat jedoch keine nutzer-befähigenden Informationssysteme untersucht, die Eintrittshürden absenken und Einarbeitungsbedarfe reduzieren können. Bornschlegl setzte mit seiner Dissertation die Forschung an diesen Herausforderungen fort. Er hat mit IVIS4BigData ein Referenzmodell für visuelle Analyse von Big Data eingeführt, das standardisierten Nutzerstereotypen die Partizipation am Big Data-Analysevorgang ermöglicht. Keines dieser Projekte hat den Einsatz von KI und ML in hohem Maße berücksichtigt. Dabei haben KI und ML das Potenzial, als Big Data-Analysemethode eingesetzt werden zu können oder Big Data-Infrastruktur und -Tooling zu verbessern. Dazu müssen allerdings die Repräsentation von KI und ML entlang der Big Data-Analysepipeline definiert und die zusätzliche Herausforderung an die KI- und ML-Fähigkeiten der Nutzer beherrscht werden. Musterarchitekturen, die für Umsetzungen herangezogen werden könnten, existieren keine. Aus diesem Grund verbleibt es eine Herausforderung, Anwendungen von KI und ML für Big Data-Infrastruktur und -Tooling (SMART VORTEX), deren Auswirkungen auf die Nutzerfähigkeiten (EDISON) sowie deren Einbettung in nutzer-befähigende Informationssysteme (IVIS4BigData) zu untersuchen.

Um diese Lücke zu schließen hat diese Dissertation mit AI2VIS4BigData ein Referenzmodell entwickelt, das nutzerbefähigende Einbettung von KI und ML in die Big Data-Analysepipeline beschreibt und die KI- und ML-Repräsentation definiert, Nutzerstereotype charakterisiert und eine serviceorientierte Referenzarchitektur bereitstellt. Dieses wurde für sieben Anwendungsdomänen (bspw. Meteorologie) umgesetzt und umfangreich, bspw. über Workshops oder Studien evaluiert.

Cite

Citation style:
Could not load citation form.

Access Statistic

Total:
Downloads:
Abtractviews:
Last 12 Month:
Downloads:
Abtractviews:

Rights

Use and reproduction:
All rights reserved