Zur Europameisterschaft 2016 ist uns eine Visualisierung des Bayerischen Rundfunks aufgefallen. Sie beschäftigt sich mit der Frage: „In welchem Land sind die Teilnehmer der EM 2016 geboren?“.

Zur Europameisterschaft 2016 ist uns eine Visualisierung des Bayerischen Rundfunks aufgefallen. Sie beschäftigt sich mit der Frage: „In welchem Land sind die Teilnehmer der EM 2016 geboren?“.

Gewählt wurde eine Geovisualisierung, die den Geburtsort als Position auf der Weltkarte darstellt und die Mannschaftszugehörigkeit als Nationalflagge kodiert. Die Ansicht ist beliebig verschieb- und zoombar. Bemerkenswerte Zusammenhänge, z.B. „Britisches Inselhopping“ oder „Eidgenossen vom Balkan“ sind als Kommentar in die Grafik eingefügt.

Quelle: http://web.br.de/interaktiv/europasbeste/

Die interaktive Karte bietet einen hohen Unterhaltungswert. Für eine Darstellung in einem Geschäftsbericht ist sie allerdings nur bedingt geeignet. Visuelle Darstellungen ermöglichen es Trends, Muster, Clusterungen und Ausnahmen zu erkennen.

Dies funktioniert in dieser Darstellung aus folgenden Gründen nicht gut:

  • Zoomfaktor: Der Einstieg ist bereits gezoomt. Wir beginnen also nicht mit einer vollkommenden, weltweiten Übersicht, sondern mit einem Ausschnitt des Kontinentaleuropas. Bei einer Darstellung von Daten ist Zoomen und Filtern immer erst ein zweiter Schritt.
  • Overplotting: Die Datenpunkte sind immer gleich groß und neigen zum „overplotting“, d.h. sie werden übereinander dargestellt. Erst durch Zoomen und Filtern ist so ein Erkenntnisgewinn möglich. Es ist vor allem in kleineren Ländern schwierig zu sehen, zu welchem Land der Datenpunkt gehört. Da hilft meist nur Zoomen auf Stadtebene.
  • Nutzung von Flaggen: Der Betrachter muss alle Flaggen, kennen und unterscheiden können, das ist z.B. bei Ländern wie Italien und Irland nicht unbedingt einfach.

WIE GEHT ES BESSER?

In dem zu der Visualisierung gehörenden Artikel wird vor allem darauf eingegangen, wie viele Nationalspieler auch in dem jeweiligen Land geboren sind bzw. ob es starke Zusammenhänge zu anderen Ländern gibt. Dass die gewählte Visualisierung diese Aussage nicht optimal unterstützt lässt sich schon daran zeigen, dass die wesentlichen Aussagen erst durch die Hinzunahme der oben genannten Kommentare erkennbar werden.

Die Visualisierung enthält also die beiden Dimensionen

  • Geburtsland
  • EM Teilnehmer

Sowie als Kennzahl die jeweilige Anzahl der Spieler.

Aufgrund der Anzahl der Dimensionsausprägungen (24 Teilnehmerländer und 43 Geburtsländer) ist eine Darstellung als Balken- oder Liniendiagramm nicht praktikabel. Wir haben uns von der Heatmap und dem Korrelogram inspirieren lassen und uns für eine Kreuztabelle (Teilnehmer x Geburtsland) entschieden, die die Anzahl der Spieler farblich kodiert.

Abbildung 1 - Kreuztabelle alphabetisch sortiert

Der Zusammenhang zwischen Geburtsland und Nationalmannschaft lässt sich hier sofort erkennen. Sortiert man die EM-Teilnehmer nach vorne und die nicht-EM-Teilnehmer alphabetisch dahinter wird dies in der Darstellung noch klarer:

Abbildung 2 - EM-Teilnehmer vorne

Deutlich erkennbar ist, dass der Zusammenhang zwischen Geburtsland und Herkunftsland unterschiedlich stark ausgeprägt ist, z. B. bei Albanien (ALB), Irland (IRL), Wales (WAL) und Portugal (POR). Wie so oft sind die Ausreißer interessant, also die Frage:

Aus welchem Land kommen die Spieler, wenn sie nicht im Inland geboren sind?

Hierzu verändern wir die Darstellung ein wenig und entfernen alle Spieler, die in dem Land geboren sind, für das sie spielen:

Abbildung 3 - Im Ausland geborene Spieler

Die angepasste Heatmap hilft sofort Folgendes zu erkennen:

  • Spieler für Albanien sind oft im Kosovo oder der Schweiz geboren wurden.
  • Umgekehrt spielen für die Schweiz Spieler aus dem Kosovo
  • Für Irland, Nordirland und insbesondere für Wales spielen Spieler, die in England geboren wurden
  • Für die Türkei spielen eine Reihe von Spielern, die in Deutschland geboren wurden
  • Für Portugal spielen in Frankreich geborene Spieler

FAZIT

Eine Visualisierung muss sich immer an einem bestimmten Zweck orientieren. Die Darstellung des Bayerischen Rundfunks hat den Zweck, Leser für den Inhalt des Artikels zu begeistern und opfert dafür die klare Darstellung der Zusammenhänge. Die von uns gewählte Visualisierung ist in erster Linie kein Hingucker, stellt dafür aber die Korrelation zwischen Geburtsland und Teilnehmerland sehr gut dar.

Natürlich kommt auch unsere Darstellung nicht ohne einen Haken aus: Eine Analyse auf Ebene einzelner Städte per Zoom ist nicht möglich. Jede Zelle der Kreuztabelle muss also auf einen Detailbericht verlinkt sein, der diese Information darstellt. In diesem Zusammenhang ist es wichtig, den Informationsbedarf der einzelnen Berichtsempfänger genau zu erfassen und mit einer geeigneten Detaillierung zu bedienen.

Während die hier gewonnenen Erkenntnisse lediglich Unterhaltungswert haben, lässt sich unsere Form der Darstellung für eine Vielzahl von Analysen einsetzen, z.B. Materialherkunft und –verwendung, Käuferherkunft- und Logistikanalysen.

Neuen Kommentar schreiben

Ihre E-Mail Adresse wird nicht veröffentlicht.

NEUESTE BEITRÄGE

Die drei größten Softwaretest-Mythen
05.06.2023

Die drei größten Softwaretest-Mythen

Sören Schmock

Softwaretests sind ein sehr wichtiger Bestandteil des Softwareentwicklungsprozesses, um die Qualität, Funktionalität und Sicherheit von Softwareprodukten zu gewährleisten. Doch wie bei vielen anderen Bereichen der Technik gibt es auch hier einige Mythen, die sich hartnäckig halten und die Arbeit der Tester erschweren oder sogar gefährden können. In diesem Blogbeitrag möchte ich drei der größten Softwaretest-Mythen aufdecken und erklären, warum sie nicht stimmen.

Expertise
Einführung von Protegrity - Ein Kundenprojektbericht
31.05.2023

Einführung von Protegrity - Ein Kundenprojektbericht

Leon Geitmann

Im Juli 2022 begann offiziell das Kundenprojekt „Einführung Protegrity“. Über die nächsten 6 Monate wurde dabei die neue Softwarekomponente Protegrity in die bestehende Infrastruktur eines IT-Dienstleisters im Bankenbereich implementiert. Worum es sich bei Protegrity handelt, warum es eingeführt wurde und wie dieses Projekt in etwa ablief, möchte ich in einem kurzen Projektbericht teilen.

Expertise
Welche Hürden gibt es bei Testdatengeneratoren im Softwaretest?
30.05.2023

Welche Hürden gibt es bei Testdatengeneratoren im Softwaretest?

Sören Schmock

Testdatengeneratoren sind Werkzeuge, die automatisch Daten erzeugen, die für den Softwaretest verwendet werden können. Sie können nützlich sein, um große Mengen von Daten zu erzeugen, die bestimmte Anforderungen erfüllen, wie z. B. Format, Typ oder Bereich. Allerdings eignen sich Testdatengeneratoren noch immer nur sehr bedingt für den Softwaretest.

Expertise