Visual Business Analytics - Effektiver Zugang zu Daten und Informationen

Visual Business Analytics - Effektiver Zugang zu Daten und Informationen

von: Jörn Kohlhammer, Dirk U. Proff, Andreas Wiener

dpunkt, 2013

ISBN: 9783864913945

Sprache: Deutsch

232 Seiten, Download: 18369 KB

 
Format:  EPUB, PDF, auch als Online-Lesen

geeignet für: geeignet für alle DRM-fähigen eReader geeignet für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Apple iPod touch, iPhone und Android Smartphones Online-Lesen PC, MAC, Laptop


 

eBook anfordern

Mehr zum Inhalt

Visual Business Analytics - Effektiver Zugang zu Daten und Informationen



2 Visualisierung von Daten und Informationen


Wachsende Datenmengen

Heutige Unternehmen sammeln, speichern und verwerten Daten in einem nie da gewesenen Ausmaß. Wo vor Jahrzehnten noch das Hauptaugenmerk auf den Möglichkeiten der besseren Sammlung und Speicherung von Daten lag, hat die Business-Welt und viele andere Bereiche von Regierungen bis zum individuellen Menschen ein Problem mit der schieren Masse an Daten. Dieser sogenannte Information Overload ist eigentlich erst einmal ein Data Overload. Wenn man es genau betrachtet, sind wir auch weniger im Informationszeitalter, sondern eher noch im Datenzeitalter, denn wir haben viele Probleme noch nicht gelöst, die mit dem Umgang verschiedener Datenarten und großen Mengen dieser Daten zu tun haben.

Neue Datenquellen

Viele Quellen stimmen darin überein, dass die Menge der Daten, wie auch die Dynamik der Änderungen, in Zukunft weiter zunehmen wird. Es liegt in jedem größeren Unternehmen eine Vielzahl von relevanten Datenquellen vor, die heute noch gar nicht angebunden werden, da die Datenmengen die aktuellen Möglichkeiten der Verarbeitung und Auswertung übersteigen. Erst allmählich beschäftigen sich Unternehmen mit sozialen Netzwerken, unstrukturierten Daten und all den Texten und Dokumenten, die bisher in den Verzeichnissen der Unternehmensserver liegen.

Dabei unterscheiden sich die für verschiedene Unternehmen relevanten Daten nicht unerheblich, auch wenn wir in diesem Buch den klaren Fokus auf diejenigen Daten setzen, die für Business Intelligence und Business Analytics wesentlich sind. Jedoch sind in den letzten Jahren neben betriebswirtschaftlichen Zahlen zum Beispiel eben auch Texte, soziale Netzwerke oder geografische Daten zunehmend geschäftsrelevant geworden.

Im Folgenden gehen wir auf verschiedene Aspekte von Daten und Informationen sowie deren Visualisierung ein. Dies legt den Grundstock für die weiteren Kapitel, die näher auf die drei Ausbaustufen der VBA eingehen.

2.1 Daten und Datentypen


Daten als Grundlage der Visualisierung

Als Leser dieses Buches haben Sie mit großer Wahrscheinlichkeit ein sehr gutes Verständnis von Daten sowie ihrer Sammlung, Speicherung und Verwendung. Wir werden daher in diesem Abschnitt keine Datenbankgrundlagen wiederholen, sondern sehr stark auf diejenigen Aspekte von Daten abheben, die für die Visualisierung und die weiteren Kapitel essenziell sind. Die Fragestellung ist immer, was wir über die Daten wissen sollten und was wir mit den Daten tun sollten, damit wir besser visualisieren und dadurch besser entscheiden können.

2.1.1 Daten

Daten sind die Rohmaterialien unserer heutigen Informationswelt. Sie haben aber für sich alleine genommen noch keinen großen Wert für Entscheider. Daten sind zum Beispiel Zahlenreihen, die ohne Kontext keinen Sinn ergeben. Die Zahlenreihe 4015555634 bekommt erst im Kontext »Telefonnummer« eine spezielle Bedeutung, die eine andere ist als im Kontext »Kontonummer«.

Das heißt, um eine Bedeutung zu erhalten, müssen Daten im Kontext erklärt werden, in Gruppen oder Strukturen organisiert werden, transformiert und präsentiert werden. Erst dann werden Daten zu Informationen. Diese Daten mit kontextueller Bedeutung können sinnvoll verwendet und visualisiert werden.

Struktur der Daten

Eine typische Datenmenge, wie sie in der Visualisierung betrachtet wird, ähnelt einer relationalen Datenbanktabelle. Die Datenmenge besteht aus Datensätzen, die wiederum über mehrere Attribute beschrieben werden. Jeder dieser Attribute hat einen bestimmten Datentyp, z.B. Text oder Zahl. Natürlich ist Text nicht gleich Text, da es nur eine definierte Menge an Ausprägungen geben kann, die ein Attribut tragen. Genauso sind Zahlen nicht gleich Zahlen. Sie können für einen Geldbetrag stehen oder einen Monat bezeichnen.

Daten und Datentypen interessieren uns insbesondere deshalb für die Visualisierung, da sich verschiedene Visualisierungstechniken für bestimmte Datentypen und die Struktur, in der die Daten vorliegen (Hierarchie, Netzwerk, Text etc.), eignen. Diese lernen wir in Kapitel 4 näher kennen. Ein Balkendiagram eignet sich nicht für Netzwerkdaten, eine Darstellung von Netzwerken nicht für jährliche Verkaufszahlen. In Abschnitt 2.1.2 gehen wir näher auf diese Zusammenhänge ein.

2.1.2 Datentypen

Im Allgemeinen werden Daten in quantitative, ordinale und nominale Typen unterschieden. Quantitative Daten enthalten numerische Werte, auf denen mathematische Berechnungen ausgeführt werden können (z.B. Umsatzzahlen oder KPIs). Diese können diskret (also ganze Zahlen oder Werte einer definierten Menge von Zahlen, z.B. 0 und 1) oder kontinuierlich sein (also reale Zahlen). Ordinale Daten haben eine vorgegebene Ordnung. Diese Daten können numerisch (z.B. 1, 2,..., 12 für die Monate des Jahres) oder nicht numerisch (z.B. Januar, Februar,..., Dezember) sein. Nominale Daten enthalten beliebige nicht numerische Werte, die keine Ordnung haben (z.B. die Namen von Mitarbeitern).

In Abschnitt 5.2.5 betrachten wir noch weitere Beispiele für diese Datentypen und zeigen dabei auf, wie man diese Typen in eine visuelle Abbildung überführt. Tabelle 2–1 fasst die wichtigsten Eigenschaften der Datentypen für dieses Kapitel noch einmal zusammen.

Tab. 2–1 Datentypen

Quantitativ

Ordinal

Nominal

  • Numerische Werte
  • Definierte Ordnung
  • Beliebige nicht numerische Werte
  • Berechnungen möglich
  • Numerische oder nicht numerische Werte
  • Beispiel: Nachnamen
  • Beispiel: Umsatzdaten
  • Beispiel: Monatsnamen

 

2.1.3 Datenakquisition und Datenherkunft

Bei der Datenakquisition ist die Herkunft der Daten und damit auch die Verlässlichkeit der Daten ein wesentliches Kriterium für die Datenverwertung, Analyse und Visualisierung. Dies hängt eng auch mit den Fragen der Datenqualität zusammen, auf die wir in Abschnitt 2.1.5 kurz eingehen werden.

Interne und externe Daten

Bestimmte Datenquellen haben Unternehmen dabei unter ihrer Kontrolle und Verfügungsgewalt. Sie können damit selbst entscheiden, welches Format diese Daten haben, wie oft sie erhoben werden und wie sie aggregiert und verarbeitet werden sollen. Diese Daten bezeichnen wir als interne Daten. Andere Datenquellen werden extern erhoben und verarbeitet oder als Rohdaten im Unternehmen weiterverwendet. Diese Daten bezeichnen wir als externe Daten. Diese können sowohl frei verfügbar als auch kommerziell vom eigenen Unternehmen erworben sein.

Tab. 2–2 Interne und externe Daten

 

Rohdaten

Aufbereitete Daten

Interne Daten

  • Tägliche Verkaufszahlen
  • Interne E-Mails
  • Tagesaktuelle Kosten
  • u.v.a.
  • Geschäftskennzahlen
  • Jahresberichte
  • Analyse der Kundenzufriedenheit

Externe Daten

  • Neue Patente
  • Kundenanfragen
  • Aktienkurse
  • Kommerzielle Newsticker
  • u.v.a.
  • Marktanalysen
  • Branchenliteratur
  • Kommerzielle Datenquellen (Hoppenstedt, Reuters etc.)

Aktualität

Eine Vielzahl von Dienstleistern bietet aufbereitete Daten und Informationen für verschiedene Unternehmensbereiche und Fragestellungen an. Die Dynamik der Daten reicht dabei von untersekündlichen Ticks an der Börse bis hin zu aggregierten Firmeninformationen im Überblick. Gerade in letzterem Fall stellt sich die Frage nach den Aktualisierungsmechanismen, die den Datenverwender von Änderungen an aggregierten Datensätzen in Kenntnis setzt. Anders als bei Data Warehouses, bei denen das Unternehmen die zeitlichen Abstände der Aktualisierung selbst unter Kontrolle hat, kann sich dies von Datenquelle zu Datenquelle unterscheiden. Ähnliches gilt für die Einschätzung der Unsicherheit von Daten.

Unsicherheit

2.1.4 Datenspeicherung

Eine Vielzahl von Datenquellen liegt heutzutage in Datenbanken oder in Form von Dateien vor. Dabei bieten sich im Betriebsumfeld vielfach relationale Datenbanken von verschiedenen Herstellern an. Diese reichen von kostenlosen SQL-Datenbanken bis hin zu mächtigen Datenbanklösungen für höchste Performanzanforderungen. Die Software Microsoft Excel und andere Tabellenkalkulationen sind zudem breit genutzte Werkzeuge. Diese werden auch häufig bis an die Grenzen der menschlichen und softwareseitigen Verarbeitbarkeit ausgereizt.

Relationale Datenbanken

Die Vorteile konsistenter Datenspeicherung in relationalen und anderen Datenbanken liegt außerhalb...

Kategorien

Service

Info/Kontakt