Kurzprofil: Datenvisualisierung Praxiskurs

1 Überblick

In diesem Modul lernen Sie Methoden der Datenvisualisierung für den Einsatz in der (Wirtschafts-)Praxis. Der Schwerpunkt liegt auf der praktischen Fähigkeit; theoretische Grundlagen spielen eine Nebenrolle. Alle Diagramme werden mit der Programmiersprache R erstellt.

2 Inhalte

2.1 Publikationsreife Diagramme

Im Folgenden sind einige Beispiele für Diagramme dargestellt, die im Unterricht besprochen und “nachgebaut” werden. Zentrale Technologie findet ggplot2 (in R) Verwendung.

Praktische Hinweise zur ggplot2 finden sich Wickham (2016); Hinweise zu Qualitätsmerkmalen von Datendiagramme sind in Wilke (2019) nachzulesen. Die theoretischen Grundlagen zur Visualisierung von Daten finden sich in Wilkinson (2005).

Quelle

Unter z.B. dem Stichwort tidytuesday finden sich eine Reihe sehenswerter Diagramme (mit ggplot2) erstellt; eine Übersicht findet sich hier.

Eine nette weitere Spielerei Variante der Datenvisualisierung sind Animationen; zu Zeiten einer Pandemie etwa:

Quelle

2.2 Dashboards

Dashboards sind in Organisationen beliebte Darstellungen, um Daten entscheidungsrelevant zu visualisieren. Sie sollen mehrere Kennzahlen auf einem Blick verdeutlichen. Häufig sind sie in (etwa) Echtzeit (automatisch) aktualisiert, so dass sie möglichst stets die aktuellen Informationen aufbereiten.

Einfache Dashboards, haben den Vorteil, schnell entwickelt werden zu können und online verfügbar zu sein, was den Bedürfnissen vieler Organisationen nahekommt. Als zentrale Technologie wird FlexDashboards (in R) genutzt.

An relevanter Literatur ist z.B. Xie, Dervieux, and Riederer (2020) oder Xie, Hill, and Thomas (2018) zu nennen.

Quelle

Eine weitere Idee für eine Anwendung ist die Erstellung eines lokalen Corona-Dashboards:

Quelle

2.3 Automatisierte Berichte

In vielen Situationen ist es im (betrieblichen) Alltag nötig, Berichte in leicht abgewandelter Version in mehreren Ausfertigungen wiederholt zu erstellen. Ein typisches Beispiel ist die Aufstellung von Umsatzergebnissen nach Zeit, Region und/oder Sparte. Versucht man, solche Berichtsvarianten “händisch” zu erstellen, sieht man sich schnell einer großen Zahl von redundanten Abläufen gegenüber. Dazu kommt die große Fehleranfälligkeit häufiger Variantenerstellung. Viel besser ist es, wenn eine Berichtsvorlage automatisch aktualisiert wird, etwa um die Umsatzzahlen von letzter Woche durch die von dieser Woche zu ersetzen. Dazu bietet RMarkdown eine Möglichkeit. Entsprechend stellt RMarkdown die zentrale Technologie für diesen Themenbereich dar.

Praktische Hinweise finden sich in Allaire et al. (2016) oder Xie (2016).

Beispielhaft sei hier ein Bericht für Flugdaten, jeweils für ein Quartal des Jahres 2014, dargestellt.

2.4 Daten-Apps

R ist eine führende Programmiersprache zur Datenanalyse; allerdings ist für bestimmte Zielgruppen – etwa dem Management eines Betriebs – kein spezialisiertes technisches Wissen zuzumuten. Stattdessen sind grafische Benutzeroberflächen (GUIs) nötig. Auf dieser Basis ist es in bestimmten Situationen sinnvoll, GUIs für bestimmte (R-)Analyse zu entwickeln, so dass Nutzis einfach mit der Analyse kommunizieren können, also etwa Ergebnisse abfragen oder Eingabeparameter ädern können. Mittels Shiny Apps ist dies möglich; Shiny Apps stellen die zentrale Technologie für dieses Themengebiet dar.

Hintergründe zu Shiny sind z.B. in Wickham (2021), Fay et al. (2021) oder Resnizky (2015) nachzulesen.

Im Folgenden sind einige Beispiele solcher Apps dargestellt:

3 Prüfung

Prüfungsgegenstand ist eine Projektarbeit, in der der gelernte Stoff an einem Projekt angewendet werden soll.

4 Voraussetzungen

Es werden Grundlagen in R und in Statistik vorausgesetzt, wie sie in Grundlagenveranstaltungen (etwa “Quantitative Methoden 1”) erworben werden.

Literatur

Allaire, J. J., Joe Cheng, Yihui Xie, Jonathan McPherson, Winston Chang, Jeff Allen, Hadley Wickham, Aron Atkins, and Rob Hyndman. 2016. Rmarkdown: Dynamic Documents for r. https://CRAN.R-project.org/package=rmarkdown.
Fay, Colin, Sebastien Rochette, Vincent Guyader, and Cervan Girard. 2021. Engineering Production-Grade Shiny Apps. Chapman; Hall/CRC. https://engineering-shiny.org/.
Resnizky, Hernan G. 2015. Learning Shiny. Place of publication not identified: Packt Publishing Limited.
Wickham, Hadley. 2016. Ggplot2: Elegant Graphics for Data Analysis. Springer. https://ggplot2.tidyverse.org.
———. 2021. Mastering Shiny. O‘Reilly. https://mastering-shiny.org/.
Wilke, C. 2019. Fundamentals of Data Visualization: A Primer on Making Informative and Compelling Figures. First edition. Sebastopol, CA: O’Reilly Media.
Wilkinson, Leland. 2005. The Grammar of Graphics. 2nd ed. Statistics and Computing. New York: Springer. https://doi.org/10.1007/0-387-28695-0.
Xie, Yihui. 2016. Bookdown: Authoring Books and Technical Documents with r Markdown. CRC Press.
Xie, Yihui, Christophe Dervieux, and Emily Riederer. 2020. R Markdown Cookbook. 1st ed. The r Series. Boca Raton: Taylor; Francis, CRC Press.
Xie, Yihui, Alison Presmanes Hill, and Amber Thomas. 2018. Blogdown: Creating Websites with r Markdown.