Quantile – nun auch beim Radeln

Vor doch schon etwas längerer Zeit habe ich angefangen, mein Lauftempo über die Zeit hinweg, genau wie die Streckenlängen, nicht nur über monatliche Mittelwerte, sondern auch über Quantile zu analysieren. Dazu ein kurzer Exkurs, um einzuordnen, was das bedeutet und eventuell bringen kann:

Quantile sind Kenngrößen eines Datensatzes. Ein spezielles – und am Anfang leicht verständliches – Quantil ist der Median. Der Median gibt die Grenze zwischen der „hohen“ Hälfte und der „niedrigen“ Hälfte der Werte an. Wenn ich also den Median meiner Radfahrstrecken in einem Monat bestimme, bestimme ich die Kilometerzahl, die genau die „lange“ Hälfte meiner Radfahrten von der „kurzen“ Hälfte trennt. Der „Durchschnitt“, also das arithmetische Mittel der Streckenlängen, wird dagegen berechnet, indem ich alle meine Strecken des Monats aufsummiere und dann durch die Zahl meiner Fahrten teile.

Mittelwerte meiner monatlichen Radfahrleistungen – Geschwindigkeit und Dauer. Beim Laufen gebe ich die mittlere Länge einer Aktivität an, beim Radfahren erschien mir die Dauer sinniger – aber vielleicht muss ich das irgendwann ändern.

Klingt zunächst einmal so, als sollten Median und Mittelwert ähnliche Werte ergeben. Wenn ich nun aber einige sehr kurze Strecken und wenige, dafür aber sehr lange Strecken dabei habe – nur als Beispiel – können Median und Mittelwert sehr stark voneinander abweichen. Der Median allein aber reicht mir nicht, um die Verteilung meiner Streckenlängen (und Geschwindigkeiten) beim Laufen und Radfahren zu charakterisieren. Also benutze ich weitere Quantile – der Median ist ja nur das eine Hälfte – andere Hälfte Quantil.

Für meine Diagramme habe ich also Excel beauftragt, zunächst jeweils die kürzeste und die langsamste sowie die längste und die schnellste Radfahrt jedes Monats zu bestimmen. Das sind nur Minima und Maxima, noch keine Quantile. Dann habe ich Excel weiter beauftragt, folgende Grenzen (also Quantile) zu bestimmen:

  • Die Grenze zwischen dem langsamsten bzw. dem kürzesten Achtel meiner Radfahrten und dem Rest.
  • Die Grenze zwischen dem langsamsten bzw. dem kürzesten Viertel meiner Radfahrten und dem Rest.
  • Den Median, also die Grenze zwischen langsamer und schneller bzw. kurzer und langer Hälfte meiner Radfahrten.
  • Die Grenze zwischen dem schnellsten bzw. dem längsten Viertel meiner Radfahrten und dem Rest.
  • Und zu guter letzt die Grenze zwischen dem schnellsten bzw. dem längsten Achtel meiner Radfahrten und dem Rest.

Die Spanne meines Tempos beim Radfahren wird also sichtbar kleiner, auch die schnellste Fahrt des langsamsten Achtels ist seit Oktober 2020 zuverlässig über 20 km/h Durchschnittsgeschwindigkeit gekommen. Im Winter bin ich auf voller Breite etwas langsamer geworden, nun im Frühjahr steigt das Tempo wieder.

Wesentlich aufschlussreicher finde ich allerdings im Moment das Strecken-Quantil-Diagramm. Deutlich ist zu sehen, dass von April bis Juli 2020 stets die Hälfte meiner Radfahrten im Bereich von ca. 20 Kilometern umfasst haben. Das zeigt recht deutlich, dass in dieser Zeit der Arbeitsweg (je nach Route 19,5 bis 22 Kilometer) meine Radfahrerei ziemlich stark dominierte. Im Spätsommer und Herbst 2020 kamen dann lange Fahrten – Umwege auf dem Heimweg, lange Spaßfahrten am Wochenende und Dienstreisen per Rad – hinzu und nahmen zunehmend größere Anteile meiner Radfahrerei ein. Im Winter brach das dann wieder auf reine Fahrten zum Büro und nach Hause ein – und steigt nun wieder an. Mit aber zunehmenden Fahrten zum Einkaufen, gelegentlich mit lustvollen Umwegen verbunden, aber halt nicht auf volle 20 Kilometer, hat sich das im Jahr 2021 stark verschoben: Es gibt ein recht präsentes „langes“ Viertel meiner Radfahrten, das im Februar und März über 30 Kilometer Strecke bedeutete, während auch rund ein Viertel der Strecken unter 20 Kilometer lang war – ein Achtel sogar kürzer als zehn bis zwölf Kilometer.

Die Ergebnisse sind nicht unerwartet, ich kann die Veränderungen der Verteilung recht gut der Entwicklung meines Radfahrverhaltens zuordnen. Aber ich finde sehr, sehr interessant, diese Werte zur Hand zu haben und weiter zu verfolgen.

Einen Nachteil haben die Quantile auf die reine Tempo- bzw. die reine Distanzverteilung aber: Sie geben keinen Aufschluss, ob die langen Fahrten langsamer sind als die kurzen. Beim Laufen gibt es diesen Zusammenhang eindeutig, aber auch da konnte man ihn nicht aus Quantilen ablesen. Beim Radfahren ist der Zusammenhang tatsächlich ein anderer, da tendenziell die kürzesten Fahrten eher langsam sind: Sie führen quer durch die Stadt, wo man dauernd anhalten und natürlich Rücksicht auf andere Verkehrsteilnehmer nehmen muss, oder sie beinhalten über’s Einkaufen Stopps und langsame Passagen. Hier äußert sich recht stark, dass Radfahren mehr als Laufen auch als vollwertiges Verkehrsmittel dient.

Die Quantile finde ich auch beim Radfahren trotzdem sehr nützlich und freue mich schon, sie über weitere Monate hinweg zu verfolgen.

5 Kommentare zu „Quantile – nun auch beim Radeln

    1. Es gibt in der Statistik auch andere Methoden, Verteilungen zu charakterisieren. Meist sind die gedacht, um Eigenschaften von Wahrscheinlichkeitsverteilungen zu beschreiben – und letztlich sind Häufigkeitsverteilungen (wie die Häufigkeit der einzelnen Kilometerleistungen beim Radfahren in einem Monat) nichts anderes als in die Realität der endlichen Zahlen getragene Wahrscheinlichkeiten.

      Aber ich fand wenige Methoden und Kennzahlen so anschaulich wie Quantile. In Excel kannst Du dafür die Funktionen quantil(), quantil.inkl() und quantil.exkl() verwenden. Alle brauchen im Endeffekt zwei Argumente: Deine Verteilung und den Anteil (in meinem Falle also 0,125, 0,25, 0,5, 0,75 und 0,875).

      Wenn Du, wie das bei mir der Fall ist, die Radfahrten und eventuell sogar anderen Sport in einer fortlaufenden Liste hast, kannst Du das, was ich im Absatz vorher als „Deine Verteilung“ beschrieben habe, mittels der wenn()-Funktion aus der Gesamtheit heraussortieren – um wenn() einen Array, den quantil() verarbeiten kann, zurückgeben zu lassen, musst Du allerdings Matrixfunktionen verwenden.

      Im Endeffekt gebe ich Dir hier aber, falls Du die Konzepte noch nicht kennen solltest, in erster Linie die Suchbegriffe, um es Dir mit der Office-Hilfe selbst zusammenzuschrauben. Meine konkrete Lösung hilft Dir nämlich nur eingeschränkt, wenn Du Deine Radfahrten in anderer Form als ich gelistet hast.

      Falls Du Dir das antust: Viel Spaß beim Basteln. Ich fand sehr befriedigend, was dabei herauskam, aber ein wenig Arbeit war’s schon.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google Foto

Du kommentierst mit Deinem Google-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.