Visual Business Analytics - Effektiver Zugang zu Daten und Informationen
von: Jörn Kohlhammer, Dirk U. Proff, Andreas Wiener
dpunkt, 2013
ISBN: 9783864913945
Sprache: Deutsch
232 Seiten, Download: 18369 KB
Format: EPUB, PDF, auch als Online-Lesen
2 Visualisierung von Daten und Informationen
Wachsende Datenmengen
Heutige Unternehmen sammeln, speichern und verwerten Daten in einem nie da gewesenen Ausmaß. Wo vor Jahrzehnten noch das Hauptaugenmerk auf den Möglichkeiten der besseren Sammlung und Speicherung von Daten lag, hat die Business-Welt und viele andere Bereiche von Regierungen bis zum individuellen Menschen ein Problem mit der schieren Masse an Daten. Dieser sogenannte Information Overload ist eigentlich erst einmal ein Data Overload. Wenn man es genau betrachtet, sind wir auch weniger im Informationszeitalter, sondern eher noch im Datenzeitalter, denn wir haben viele Probleme noch nicht gelöst, die mit dem Umgang verschiedener Datenarten und großen Mengen dieser Daten zu tun haben.
Neue Datenquellen
Viele Quellen stimmen darin überein, dass die Menge der Daten, wie auch die Dynamik der Änderungen, in Zukunft weiter zunehmen wird. Es liegt in jedem größeren Unternehmen eine Vielzahl von relevanten Datenquellen vor, die heute noch gar nicht angebunden werden, da die Datenmengen die aktuellen Möglichkeiten der Verarbeitung und Auswertung übersteigen. Erst allmählich beschäftigen sich Unternehmen mit sozialen Netzwerken, unstrukturierten Daten und all den Texten und Dokumenten, die bisher in den Verzeichnissen der Unternehmensserver liegen.
Dabei unterscheiden sich die für verschiedene Unternehmen relevanten Daten nicht unerheblich, auch wenn wir in diesem Buch den klaren Fokus auf diejenigen Daten setzen, die für Business Intelligence und Business Analytics wesentlich sind. Jedoch sind in den letzten Jahren neben betriebswirtschaftlichen Zahlen zum Beispiel eben auch Texte, soziale Netzwerke oder geografische Daten zunehmend geschäftsrelevant geworden.
Im Folgenden gehen wir auf verschiedene Aspekte von Daten und Informationen sowie deren Visualisierung ein. Dies legt den Grundstock für die weiteren Kapitel, die näher auf die drei Ausbaustufen der VBA eingehen.
2.1 Daten und Datentypen
Daten als Grundlage der Visualisierung
Als Leser dieses Buches haben Sie mit großer Wahrscheinlichkeit ein sehr gutes Verständnis von Daten sowie ihrer Sammlung, Speicherung und Verwendung. Wir werden daher in diesem Abschnitt keine Datenbankgrundlagen wiederholen, sondern sehr stark auf diejenigen Aspekte von Daten abheben, die für die Visualisierung und die weiteren Kapitel essenziell sind. Die Fragestellung ist immer, was wir über die Daten wissen sollten und was wir mit den Daten tun sollten, damit wir besser visualisieren und dadurch besser entscheiden können.
2.1.1 Daten
Daten sind die Rohmaterialien unserer heutigen Informationswelt. Sie haben aber für sich alleine genommen noch keinen großen Wert für Entscheider. Daten sind zum Beispiel Zahlenreihen, die ohne Kontext keinen Sinn ergeben. Die Zahlenreihe 4015555634 bekommt erst im Kontext »Telefonnummer« eine spezielle Bedeutung, die eine andere ist als im Kontext »Kontonummer«.
Das heißt, um eine Bedeutung zu erhalten, müssen Daten im Kontext erklärt werden, in Gruppen oder Strukturen organisiert werden, transformiert und präsentiert werden. Erst dann werden Daten zu Informationen. Diese Daten mit kontextueller Bedeutung können sinnvoll verwendet und visualisiert werden.
Struktur der Daten
Eine typische Datenmenge, wie sie in der Visualisierung betrachtet wird, ähnelt einer relationalen Datenbanktabelle. Die Datenmenge besteht aus Datensätzen, die wiederum über mehrere Attribute beschrieben werden. Jeder dieser Attribute hat einen bestimmten Datentyp, z.B. Text oder Zahl. Natürlich ist Text nicht gleich Text, da es nur eine definierte Menge an Ausprägungen geben kann, die ein Attribut tragen. Genauso sind Zahlen nicht gleich Zahlen. Sie können für einen Geldbetrag stehen oder einen Monat bezeichnen.
Daten und Datentypen interessieren uns insbesondere deshalb für die Visualisierung, da sich verschiedene Visualisierungstechniken für bestimmte Datentypen und die Struktur, in der die Daten vorliegen (Hierarchie, Netzwerk, Text etc.), eignen. Diese lernen wir in Kapitel 4 näher kennen. Ein Balkendiagram eignet sich nicht für Netzwerkdaten, eine Darstellung von Netzwerken nicht für jährliche Verkaufszahlen. In Abschnitt 2.1.2 gehen wir näher auf diese Zusammenhänge ein.
2.1.2 Datentypen
Im Allgemeinen werden Daten in quantitative, ordinale und nominale Typen unterschieden. Quantitative Daten enthalten numerische Werte, auf denen mathematische Berechnungen ausgeführt werden können (z.B. Umsatzzahlen oder KPIs). Diese können diskret (also ganze Zahlen oder Werte einer definierten Menge von Zahlen, z.B. 0 und 1) oder kontinuierlich sein (also reale Zahlen). Ordinale Daten haben eine vorgegebene Ordnung. Diese Daten können numerisch (z.B. 1, 2,..., 12 für die Monate des Jahres) oder nicht numerisch (z.B. Januar, Februar,..., Dezember) sein. Nominale Daten enthalten beliebige nicht numerische Werte, die keine Ordnung haben (z.B. die Namen von Mitarbeitern).
In Abschnitt 5.2.5 betrachten wir noch weitere Beispiele für diese Datentypen und zeigen dabei auf, wie man diese Typen in eine visuelle Abbildung überführt. Tabelle 2–1 fasst die wichtigsten Eigenschaften der Datentypen für dieses Kapitel noch einmal zusammen.
Tab. 2–1 Datentypen
Quantitativ | Ordinal | Nominal |
|
|
|
|
|
|
|
|
|
2.1.3 Datenakquisition und Datenherkunft
Bei der Datenakquisition ist die Herkunft der Daten und damit auch die Verlässlichkeit der Daten ein wesentliches Kriterium für die Datenverwertung, Analyse und Visualisierung. Dies hängt eng auch mit den Fragen der Datenqualität zusammen, auf die wir in Abschnitt 2.1.5 kurz eingehen werden.
Interne und externe Daten
Bestimmte Datenquellen haben Unternehmen dabei unter ihrer Kontrolle und Verfügungsgewalt. Sie können damit selbst entscheiden, welches Format diese Daten haben, wie oft sie erhoben werden und wie sie aggregiert und verarbeitet werden sollen. Diese Daten bezeichnen wir als interne Daten. Andere Datenquellen werden extern erhoben und verarbeitet oder als Rohdaten im Unternehmen weiterverwendet. Diese Daten bezeichnen wir als externe Daten. Diese können sowohl frei verfügbar als auch kommerziell vom eigenen Unternehmen erworben sein.
Tab. 2–2 Interne und externe Daten
| Rohdaten | Aufbereitete Daten |
Interne Daten |
|
|
Externe Daten |
|
|
Aktualität
Eine Vielzahl von Dienstleistern bietet aufbereitete Daten und Informationen für verschiedene Unternehmensbereiche und Fragestellungen an. Die Dynamik der Daten reicht dabei von untersekündlichen Ticks an der Börse bis hin zu aggregierten Firmeninformationen im Überblick. Gerade in letzterem Fall stellt sich die Frage nach den Aktualisierungsmechanismen, die den Datenverwender von Änderungen an aggregierten Datensätzen in Kenntnis setzt. Anders als bei Data Warehouses, bei denen das Unternehmen die zeitlichen Abstände der Aktualisierung selbst unter Kontrolle hat, kann sich dies von Datenquelle zu Datenquelle unterscheiden. Ähnliches gilt für die Einschätzung der Unsicherheit von Daten.
Unsicherheit
2.1.4 Datenspeicherung
Eine Vielzahl von Datenquellen liegt heutzutage in Datenbanken oder in Form von Dateien vor. Dabei bieten sich im Betriebsumfeld vielfach relationale Datenbanken von verschiedenen Herstellern an. Diese reichen von kostenlosen SQL-Datenbanken bis hin zu mächtigen Datenbanklösungen für höchste Performanzanforderungen. Die Software Microsoft Excel und andere Tabellenkalkulationen sind zudem breit genutzte Werkzeuge. Diese werden auch häufig bis an die Grenzen der menschlichen und softwareseitigen Verarbeitbarkeit ausgereizt.
Relationale Datenbanken
Die Vorteile konsistenter Datenspeicherung in relationalen und anderen Datenbanken liegt außerhalb...