Table Of ContentMarco Pospiech
Aufgabengerechte
Informations-
bereitstellung in
Zeiten von Big Data
Konsequenzen für ein
Informationsmanagement
Schriften zur Business Analytics
und zum Informationsmanagement
Reihe herausgegeben von
Carsten Felden, Freiberg, Deutschland
Die Reihe beschäftigt sich mit dem Themenkomplex der Business Analytics aus
der Sicht der Wirtschaftsinformatik. Im Spannungsfeld der Mensch-A ufgabe-
Technik-Systeme werden einerseits fachliche Fragestellungen adressiert, die
im Kontext der Business Analytics managementorientierter oder innovativer
Lösungsansätze bedürfen. Andererseits werden methodische Ansätze beleuchtet,
um gewonnene Ergebnisse zu neuen Lösungs- und Denkansätzen aufzuzeigen.
Hervorstechendes Merkmal dieser Reihe ist es, dass fachliche Dimensionen mit
algorithmischen und analytischen Dimensionen verknüpft werden, um den Cha-
rakter der Business Analytics angemessen aufzeigen zu können. Daher integriert
diese Reihe auch unterschiedliche Wissensgebiete, um zum wissenschaftlichen
Diskurs beitragen zu können.
Weitere Bände in der Reihe http://www.springer.com/series/15759
Marco Pospiech
Aufgabengerechte
Informations
bereitstellung in
Zeiten von Big Data
Konsequenzen für ein
Informationsmanagement
Marco Pospiech
Freiberg, Deutschland
Dissertation Technische Universität Bergakademie Freiberg, 2019
Die Arbeit wurde am 10.07.2018 von der Fakultät für Wirtschaftswissenschaften der
Technischen Universität Bergakademie Freiberg als Dissertation angenommen.
Schriften zur Business Analytics und zum Informationsmanagement
ISBN 978-3-658-27195-4 ISBN 978-3-658-27196-1 (eBook)
https://doi.org/10.1007/978-3-658-27196-1
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen National-
bibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Springer Gabler
© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die
nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung
des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen,
Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen
etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die
Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des
Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten.
Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informa-
tionen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind.
Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder
implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt
im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten
und Institutionsadressen neutral.
Springer Gabler ist ein Imprint der eingetragenen Gesellschaft Springer Fachmedien Wiesbaden
GmbH und ist ein Teil von Springer Nature
Die Anschrift der Gesellschaft ist: Abraham-Lincoln-Str. 46, 65189 Wiesbaden, Germany
Danksagung
Die vorliegende Dissertation ist im Rahmen meiner Tätigkeit als wissenschaftlicher Mitarbeiter
am Institut für Wirtschaftsinformatik an der TU Bergakademie Freiberg entstanden. Mein be-
sonderer Dank gilt daher Prof. Dr. Carsten Felden, an dessen Förderung und persönlichem Rat
ich mich seit meiner Zeit als studentischer Mitarbeiter erfreue. Er begleitete meine Promotion
von der Themenfindung bis zur Veröffentlichung, unterstützte die Suche nach Praxispartnern,
fand stets Zeit für fachliche Diskussionen und wurde nie müde, gemeinsame Veröffentlichun-
gen und Projekte mit neuen Perspektiven anzureichern. Nicht zuletzt die konstruktive und me-
thodische Atmosphäre an seinem Lehrstuhl erlaubt mir heute den Rückblick auf erfolgreiche
Veröffentlichungen in internationalen Journalen und Konferenzen. Sein Engagement und Qua-
litätsanspruch werden mir stets ein Vorbild sein und mich in meinen zukünftigen Vorhaben
leiten.
Darüber hinaus richtet sich mein Dank an Prof. Dr. Chamoni, der selbstlos das Zweit-
gutachten dieser Arbeit übernahm. Prof. Dr. Andreas Horsch danke ich zudem für den Vorsitz
im Promotionsausschuss, sowie Prof. Dr. Stumpf-Wollersheim und Prof. Dr. Rogler für ihre
Mitwirkung in diesem Gremium. Mein herzlicher Dank gilt allen Promovenden, Kollegen und
Freunden am Institut für Wirtschaftsinformatik. Ohne ihren Zuspruch in Momenten des Zwei-
fels und ohne ihren fachlichen Rat wäre die Arbeit in dieser Form nicht zustande gekommen.
Für die Organisation und Hingabe in allen CC-Treffen und Doktorandenkolloquien bedanke
ich mich zu tiefst bei Claudia Koschtial. Ihre immerwährende Hilfsbereitschaft und Inspiration
hat nicht nur in dieser Arbeit tiefe Spuren hinterlassen. Mit Freude denke ich an die gemeinsame
Zeit mit meinem Mitstreiter Tom Hänel und an die kreativen Impulse beim Ballspiel, in und
außerhalb des Büros. Er stand stets als wissenschaftlicher Sparringspartner bereit, wusste als
Erster von neuen Einfällen, vervollständigte Argumentationen und teilte seine Erfahrungen.
Ferner danke ich Daniel Huhn, Christian Walter und Frank Pfützner für ihre außergewöhnliche
Unterstützung während meiner Promotion. Ohne ihren Einsatz wären der Arbeit viele prakti-
sche Einblicke verwehrt geblieben.
Der letzte Dank gilt meiner Familie und meinen Freunden. Ihr Vertrauen und Rückhalt
bilden das solide Fundament für mich und für diese Arbeit. Hierbei möchte ich Anke Demmer-
ling meinen Dank für das hilfreiche und gewissenhafte Lektorat aussprechen. Undenkbar wäre
diese Arbeit jedoch ohne meine Eltern. Sie vermittelten mir die notwendigen Eigenschaften und
Werte, um ein Werk dieser Art abzuschließen. Sie waren es, die meinen gesamten Bildungsweg
begleiteten, mich liebten, motivierten, führten, förderten und mir dennoch den nötigen Raum
zur Entfaltung gaben. Ihr Verdienst und mein Dank gehen über diese Arbeit hinaus. Nichtsdes-
totrotz sind es die Partner, die die meisten Entbehrungen einer Promotion tragen. Daher richtet
sich mein größter Dank an meine Lebensgefährtin Jennifer Gretzler. Ohne ihre Aufopferungen
und Geduld wäre mir die Fertigstellung dieser Arbeit verwehrt geblieben. Sie war stets meine
erste Anvertraute, durchlebte die Erfolge und Frustrationen der Arbeit mit mir gemeinsam und
verstand es, in feinfühliger Weise erbauende Worte zu schenken. Meine Dankbarkeit für ihre
Liebe und Zuversicht ist unermesslich.
Marco Pospiech
Abstract
Um den drastischen Anstieg an verfügbaren Daten zu versinnbildlichen, hat sich in den letzten
Jahren das Synonym Big Data in der praktischen und wissenschaftlichen Diskussion etabliert.
Unlängst sind neue Technologien entstanden, die große Datenmengen aufnehmen, verarbeiten
oder speichern können. Nichtsdestotrotz führen technische Anstrengungen alleine zu keiner
Wertschöpfung. Vielmehr muss das vergrößerte Informationsangebot den betrieblichen Aufga-
ben effizient bereitgestellt werden. Hierfür sind die Unternehmensumwelt sowie die unterlie-
genden Systeme und Informations- und Kommunikationstechnologien gemeinsam zu betrach-
ten. Das Informationsmanagement (IM) widmet sich diesem Spannungsfeld. Es ist jedoch un-
klar, inwieweit das Phänomen Big Data das IM beeinflusst und eine aufgabengerechte Infor-
mationsbereitstellung verhindert. Ziel dieser Arbeit ist die Identifikation von Konsequenzen in
Zeiten von Big Data für das IM und die Aufdeckung von adäquaten Gestaltungsempfehlungen,
um denen zu begegnen. Da die Unschärfe des Phänomens eine Beobachtung erschwert, leitet
die Abhandlung zunächst ein konsistentes Big Data Begriffsverständnis ab. Dieses beschreibt
die inhärenten Ursache-Wirkung-Beziehungen und ermöglicht die Aufdeckung eines repräsen-
tativen Betrachtungsgegenstands in der Energiepreisvorhersage. Jener dient als Beobachtungs-
objekt, erstreckt sich über alle Ebenen des IM hinweg und wird mittels Prototyping detailliert
erläutert. Als Resultat identifiziert die Arbeit 39 Big Data spezifische Konsequenzen mithilfe
von Experten. Um dennoch eine aufgabengerechte Informationsbereitstellung zu gewährleis-
ten, erfolgt ein umfangreicher Literaturüberblick. Dieser ermittelt 479 Gestaltungsempfehlun-
gen und ordnet diese den jeweiligen Konsequenzen zu. Alle Lösungen werden positiv evaluiert
und drei stammen aus dem eigenen Betrachtungsgegenstand. Infolgedessen deckt die Arbeit
nicht nur existierende Gestaltungsempfehlungen auf, sondern bereichert Praxis und Forschung
um innovative Herangehensweisen, deren Anwendbarkeit sich nicht auf die Energiepreisvor-
hersage begrenzt. Nichtsdestotrotz verzeichnet die Arbeit in den Konsequenzen und Gestal-
tungsempfehlungen eine hohe Spezifität. Eine gemeinsame Anwendung aller Lösungen ist da-
her abzulehnen. Vielmehr profitieren Verantwortliche von einem Maßnahmenkatalog, der eine
zielgerichtete Adressierung von potenziellen Konsequenzen im IM zu Zeiten von Big Data er-
möglicht und somit eine aufgabengerechte Informationsbereitstellung sicherstellt.
Inhaltsverzeichnis
Abbildungsverzeichnis ............................................................................................................. XI
Tabellenverzeichnis ............................................................................................................... XIII
Abkürzungsverzeichnis ........................................................................................................... XV
Symbolsverzeichnis .............................................................................................................. XVII
1 Einleitung .......................................................................................................................... 1
2 Handlungsbedarf in Zeiten von Big Data .......................................................................... 3
2.1 Diskursbereich der Forschungsarbeit ....................................................................... 3
2.1.1 Informationsmanagement ............................................................................. 3
2.1.2 Big Data ...................................................................................................... 21
2.2 Herleitung der Notwendigkeit der Forschung ........................................................ 24
3 Erarbeitung des Forschungsvorgehens ............................................................................ 35
3.1 Positionierung und Forschungsziele nach Becker et al. ......................................... 35
3.2 Positionierung und Forschungsziele der vorliegenden Arbeit ............................... 38
3.3 Forschungsmethodisches Gesamtbild der vorliegenden Arbeit ............................. 40
4 Gang der Arbeit ............................................................................................................... 47
4.1 Stand der Forschung ............................................................................................... 47
4.1.1 Beitrag 1: Big Data – A State-of-the-Art ................................................... 48
4.2 Bestimmung der Begrifflichkeit ............................................................................. 50
4.2.1 Beitrag 2: Deployment of A Descriptive Big Data Model ......................... 51
4.2.2 Beitrag 3: Big Data – A Theory Model ...................................................... 55
4.3 Betrachtungsgegenstand Preisvorhersage im Energiehandel ................................. 60
4.4 Big Data Prototyping .............................................................................................. 65
4.4.1 Betrachtungsgegenstand Informationswirtschaft ....................................... 66
4.4.1.1 Beitrag 4: Towards a Price Forecast Model for the
German Electricity Market Based on Structured and Unstructured Data ........ 97
4.4.1.2 Beitrag 5: Price Trend Forecasting Through Textual Data ................ 99
4.4.1.3 Beitrag 6: Instance Selection by Identifying Relevant
Events Using Domain Knowledge and Minimal Human Involvement .......... 101
4.4.1.4 Beitrag 7: Detecting Similar News Tickers In The Area of
Natural Gas Trading ....................................................................................... 103
4.4.2 Betrachtungsgegenstand Informationssysteme / Informations- und
Kommunikationstechnik .......................................................................... 105
4.4.2.1 Beitrag 8: Automatisierte Vorhersagetechnik .................................. 119
5 Diskussion ..................................................................................................................... 121
5.1 Erkenntnisziel: Konsequenzen von Big Data für das Informationsmanagement . 121
5.2 Gestaltungsziel: Gestaltungsempfehlungen für eine aufgabengerechte
Informationsbereitstellung ................................................................................... 136
5.3 Kritische Bewertung der Forschungsergebnisse .................................................. 164
5.3.1 Dokumentation der Forschungsergebnisse ............................................... 164
5.3.2 Auswahl und Anwendung der Forschungsmethode ................................. 165
5.3.3 Zielsetzung der Forschung ....................................................................... 166
6 Fazit und Ausblick ........................................................................................................ 175
Literaturverzeichnis ................................................................................................................ 177
Anhang ................................................................................................................................... 247
Abbildungsverzeichnis
Abbildung 1: Historische Entwicklung Informationsmanagement ............................................ 4
Abbildung 2: Modell des Informationsmanagements ................................................................ 6
Abbildung 3: Lebenszyklusmodel im Informationsmanagement ............................................. 7
Abbildung 4: Abgeleitete Bestandteile des Informationsmanagements .................................... 9
Abbildung 5: Informationswirtschaftliches Gleichgewicht .................................................... 25
Abbildung 6: Entscheidungsparameter Forschungsdesign ..................................................... 36
Abbildung 7: Forschungsmethodisches Gesamtbild der eigenen Arbeit ................................ 41
Abbildung 8: Prototyping-Prozess .......................................................................................... 44
Abbildung 9: Deskriptives Big Data Modell ............................................................................ 52
Abbildung 10: Ergebnisse Big Data Messmodell .................................................................... 57
Abbildung 11: Literaturüberblick Elektrizitätsmarkt ............................................................... 68
Abbildung 12: Literaturüberblick Gasmarkt ............................................................................ 68
Abbildung 13: Verknüpfung Handelstransaktion mit Nachricht ............................................. 71
Abbildung 14: Datenausschnitt in der Trendberechnung ......................................................... 72
Abbildung 15: Verknüpfung Datenbestand Forward und Backward Mapping ....................... 77
Abbildung 16: Vorgehen Modelltraining ................................................................................. 78
Abbildung 17: Vorgehen Echtzeitbetrieb ................................................................................. 78
Abbildung 18: Konzeption interaktive Benutzeroberfläche ..................................................... 82
Abbildung 19: Impact Berechnung für Forward und Backward Mapping .............................. 85
Abbildung 20: Erweiterung Vorgehen Modelltraining ............................................................ 87
Abbildung 21: Vorgehen Identifikation historisch ähnlichste Nachricht ................................. 92
Abbildung 22: Identifikation historisch ähnlichste Nachricht in RapidMiner ......................... 92
Abbildung 23: Konzeption und Erweiterung interaktive Benutzeroberfläche ......................... 94
Abbildung 24: Schematische Darstellung des Gesamtsystems .............................................. 107
Abbildung 25: Schematische Darstellung des Clusters .......................................................... 108
Abbildung 26: Beispielhafter Prozess aus Pentaho ................................................................ 110
Abbildung 27: Beispielhafter Datenausschnitt aus einer Transformation ............................. 110
Abbildung 28: Beispielhafter Ausschnitt aus dem Trainingsbestand .................................... 111
Abbildung 29: Verknüpfte Handelstransaktionen, Marktdaten und Nachrichten .................. 113
Abbildung 30: Klassifikations- und Clusterungsprozess RapidMiner ................................... 114
Abbildung 31: Ergebnis Klassifikation und Clusterung RapidMiner .................................... 115
Abbildung 32: Umsetzung interaktive Benutzeroberfläche mit MicroStrategy ..................... 116
Abbildung 33: Detailansicht interaktive Benutzeroberfläche mit MicroStrategy .................. 117
Abbildung 34: Zusammenfassung des Experteninterviews und Identifikation der
Konsequenzen im Informationsmanagement (Erkenntnisziel) .............................................. 123
Abbildung 35: Gestaltungsempfehlungen Management der Informationswirtschaft
(Gestaltungsziel) ..................................................................................................................... 142
Abbildung 36: Gestaltungsempfehlungen Management der Informationssysteme
(Gestaltungsziel) ..................................................................................................................... 151
Abbildung 37: Gestaltungsempfehlungen Management der Informations- und
Kommunikationstechnik (Gestaltungsziel) ............................................................................ 156
Abbildung 38: Gestaltungsempfehlungen Führungsaufgaben des
Informationsmanagements (Gestaltungsziel) ......................................................................... 160
Abbildung 39: Anzahl Gestaltungsempfehlungen pro Konsequenz ...................................... 162
Tabellenverzeichnis
Tabelle 1: Beschreibungen der Bestandteile des Informationsmanagements .......................... 10
Tabelle 2: Potenzielle Konsequenzen innerhalb des Informationsmanagements .................... 31
Tabelle 3: Zusammenfassung wissenschaftstheoretische Positionierung ................................ 36
Tabelle 4: Wissenschaftstheoretische Positionierung der Arbeit ............................................. 39
Tabelle 5: Abgeleitete Big Data Messvariablen ....................................................................... 56
Tabelle 6: Abgleich Betrachtungsgegenstand Big Data Prädikatoren ..................................... 61
Tabelle 7: Initiale Anforderungen des Prototyps ..................................................................... 67
Tabelle 8: Ergebnis Modellevaluierung polynomiale Klassifikation ....................................... 74
Tabelle 9: Ergebnis Anforderungen Prototyp erster Zyklus .................................................... 75
Tabelle 10: Ausschnitt Einflussfaktoren Vorhersage ............................................................... 79
Tabelle 11: Ergebnis Modellevaluierung binomiale Klassifikation ......................................... 80
Tabelle 12: Ergebnis Modellevaluierung Naive Bayes Forward Mapping .............................. 81
Tabelle 13: Ergebnis Modellevaluierung DOWN und UP ....................................................... 81
Tabelle 14: Ergebnis Anforderungen Prototyp zweiter Zyklus ............................................... 83
Tabelle 15: Vergleich Modellevaluierung Instance Selection ................................................. 89
Tabelle 16: Ergebnis Anforderungen Prototyp dritter Zyklus ................................................. 91
Tabelle 17: Themenspezifischer Vergleich zwischen zwei Nachrichten ................................. 93
Tabelle 18: Evaluierung historisch ähnlichste Nachricht ......................................................... 95
Tabelle 19: Ergebnis Anforderungen Prototyp vierter Zyklus ................................................. 96
Tabelle 20: Anforderungen Informationssysteme/Informations- und
Kommunikationstechnik ........................................................................................................ 105
Tabelle 21: Vergleich Berechnungszeit Klassifikation RapidMiner und Radoop ................. 112
Tabelle 22: Vergleich Berechnungszeit Clusterung RapidMiner und Radoop ...................... 113
Tabelle 23: Ergebnis Anforderungen Informationssysteme/Informations- und
Kommunikationstechnik ........................................................................................................ 118
Tabelle 24: Zusammenfassung der Experteninterviews und Identifikation der
Konsequenzen im Informationsmanagement (Erkenntnisziel) .............................................. 125
Tabelle 25: Ausschlusskriterien Literaturüberblick ............................................................... 136
Tabelle 26: Anwendung Ausschlusskriterien Literaturüberblick ........................................... 138
Tabelle 27: Industrieverteilung Evaluierung Gestaltungsempfehlung ................................... 139
Tabelle Anhang 1: Big Data Gestaltungsempfehlungen (detailliert) ..................................... 247