Tour de France Datenvisualisierung mit Tableau

1 min read

Komplexe Daten mit Excel zu visualisieren stößt schnell an seine Grenzen, einerseits reicht die Funktionsvielfalt nicht immer aus, andererseits ist die Bedienung nicht unbedingt leicht. Grafiken mit Programmier-Bibliotheken wie zum Beispiel “mathplotlib” (https://matplotlib.org/) für Python zu erstellen, ist zwar sehr flexibel, aber man muss Skripte dafür schreiben. Bei der explorativen Datenanalyse kann das schnell aufwändig und zeit-intensiv sein. Hier kommen spezialisierte Softwareprodukte zum Einsatz, wie “Tableau” (https://www.tableau.com/) das ich heute beleuchten möchte. Da derzeit mit der “Tour de France” eine große Sportveranstaltung läuft, verwende ich Daten davon für einen Test.

Als Datenquellen für den Import bietet “Tableau” eine Vielzahl von Dateiformaten und Datenbankservern an, wobei eine “Live”-Verbindung gemacht werden kann, bei der die Daten der Quelle aktualisiert werden, oder eine Kopie der Daten übernommen wird.

Die Benutzeroberfläche (siehe Screenshot) ist sehr durchdacht und trotz vieler Möglichkeiten nicht überladen. Das Beispiel zeigt einen “Scatterplot” der Durchschnittsgeschwindigkeit mit der Länge der Tour-Austragungen nach Jahren gegenüberstellt. Dabei können die Punkte per “Drag and Drop” mit Datenwerten verbunden werden, und damit Beschriftung, Größe, Farbe und Form der Einträge verändert werden. Im Beispiel im Screenshot ist jeder Punkt mit Jahreszahl beschriftet, die Anzahl der Etappen bestimmt die Punktgröße und bei Mouseover wird der Name des Siegers angezeigt. Nicht unerwartet ist die Durchschnittsgeschwindigkeit um so höher je kürzer die Tour war, was üblicherweise in der jüngeren Vergangenheit war. Ist die Geschwindigkeit höher wegen der Kürze oder weil in den letzten Jahren generell schneller gefahren wird?

Tableau bietet auch einfache lineare Analyse Modelle an, die per Knopfdruck in die Charts eingefügt werden können (siehe Grafik oberhalb). Seit Mitte der Zwanzigerjahre steigt die Durchschnittsgeschwindigkeit an, seit 2000 scheint aber ein Platau erreicht worden sein. Das Prognosemodell (hellblaue Linie) zeigt dies mit einem Trichter für die Unsicherheit an.

Ein weiterer Grafik-Typ sind Kartendarstellungen. Ich habe eine Karte aller Startstädte der Tour erstellt, dessen Farbcode die Anzahl der gestarteten Fahrer wiedergibt.

Zur Präsentation bietet “Tableau” sogenannte Dashboards und Stories an. Bei Dashboards hat man die Möglichkeit graphische Auswertungen mit anderen Elementen wie Texte oder Websites zu interaktiven Screens zusammen zu fassen, in die auch veränderbare Parameter integriert werden können. Dies eignet sich nicht nur für Analysen sondern auch für Präsentationen. Für Präsentationen sind auch die “Storys” gedacht, bei denen sich Grafiken, einzelne Zustände von Dashboards etc. zu Abfolgen wie in Powerpoint zusammenstellen lassen.

Mit Dashboards lassen sich Anwendungen wie die im Artikel http://34.91.1.55/welche-personen-dominieren-die-berichterstattung-in-den-medien/ beschriebene realisieren, ohne diese zum Beispiel mit Python programmieren zu müssen.

Ich habe in diesem Artikel die Desktop-Version, die für Windows und Mac verfügbar ist, und 70$ pro Monat kostet betrachtet.

One Reply to “Tour de France Datenvisualisierung mit Tableau”

Schreibe einen Kommentar