Grundsätze

Bei der Erstellung von Ranglistensystemen ergeben sich Fragen grundsätzlicher Art, die zunächst einmal beantwortet werden müssen.

Die erste Frage ist natürlich: was soll überhaupt gemessen werden? In einer Liga-Tabelle, wie wir sie alle kennen, ist die Frage klar beantwortet. Am Ende einer Saison werden die Mannschaften nach ihren durchschnittlich erbrachten Leistungen bewertet. Das Maß aller Dinge ist also die mittlere Spielstärke.

Moment mal! Am Ende einer Saison werden doch einfach die erzielten Punkte addiert und – falls das zur Unterscheidung nicht ausreicht – die Tordifferenzen betrachtet. Stimmt! Das ändert aber nichts daran, dass der Durchschnitt der erbrachten Leistungen das Maß ist. Da bei allen Mannschaften die Anzahl der zu berücksichtigenden Ergebnisse gleich ist, macht es keinen Sinn, die Punktsummen noch jeweils durch die Anzahl der zu berücksichtigenden Spiele zu dividieren, weil sich dadurch an der Rangfolge nichts ändern würde. Was die Leistungseinschätzung einer Mannschaft angeht, sind die Summen in diesem Fall gleichbedeutend den Durchschnitten.

Die zweite zentrale Frage ist: betrachte ich bei der Ermittlung der mittleren Spielstärke starr einen zuvor festgelegten Zeitraum oder wähle ich ein dynamisches (fortschreibendes) System?

Für eine Liga ist auch diese Frage (scheinbar) eindeutig beantwortet! Selbstverständlich betrachte ich nur einen zuvor festgelegten Zeitraum (eben vom ersten bis zum letzten Spieltag einer Saison).

Vielleicht für viele überraschend: mit einem dynamischen System kann ich zu völlig identischen Ergebnissen kommen, wie nachfolgendes Beispiel verdeutlichen soll:

in einer Liga mit z.B. 21 Mannschaften gewänne eine Mannschaft fünfmal öfter als sie verlöre. Bei 40 Spielen im Laufe einer Saison entspricht das einem Plus von 12,5 Prozentpunkten (5:40x100) bzw. einer Differenz aus „Gewinnen“ und „Verlusten“ von 56,25 gegenüber 43,75 Prozentpunkten.

Mithin könnte man die mittlere Spielstärke am Ende der betrachteten Saison mit 56,25 Punkten bewerten. Die 56,25 Prozentpunkte errechnen sich im Übrigen einfacher, wenn ich für einen Sieg einen und für ein Unentschieden 0,5 Punkte vergebe; bei einem Überhang von fünf Siegen ergibt sich dann bei 40 Spielen eine Differenz von 22,5 (Gewinnpunkten) gegenüber 17,5 Punkten → 22,5:40x100 ergibt dann ebenfalls 56,25.

Um das Beispiel fortzusetzen: in der Vorsaison verlor die gleiche Mannschaft gegen die gleichen Gegner achtmal öfter als sie gewann. Die mittlere Spielstärke am Ende der Vorsaison war demnach bei einer Punktdifferenz von 16 gegenüber 24 (Differenz = -8) 16:40x100 = 40 Punkte.

Dynamische (fortschreibende) Systeme haben alle die gleiche Grundformel:

neue Rating = alte Rating + (Gewinne – Gewinnerwartung) x Faktor

Rating ist hierbei der „mittleren Spielstärke“ gleichzusetzen. Die Gewinne entsprechen den Gewinnpunkten der abgelaufenen Saison. Die Gewinnerwartung ergibt sich aus der alten Rating (mittlere Spielstärke der Vorsaison); da sich die alte Ratingzahl aus den (16) Gewinnpunkten ergibt, kann diese Zahl sofort in die Formel eingegeben werden.

Rechnen wir also mit verschiedenen Faktoren probeweise durch:

neue Rating = 40 + (22,5 – 16) x 1 = 46,5 → Faktor ist zu niedrig
neue Rating = 40 + (22,5 – 16) x 3 = 59,5 → Faktor ist zu hoch
neue Rating = 40 + (22,5 – 16) x 2 = 53 → Faktor ist zu niedrig
neue Rating = 40 + (22,5 – 16) x 2,5 = 56,25

Ist der Faktor richtig dimensioniert, so lösen sich im Beispiel die Ergebnisse der Vorsaison bei der Bewertung der aktuellen mittleren Spielstärke vollkommen im Nichts auf; sie haben mithin keinerlei Einfluss mehr auf die aktuelle Leistungsbewertung. Von der Wirkung her sind im Beispiel die alten Ergebnisse gelöscht.

In dynamischen Bewertungssystemen werden zwar alte Ergebnisse betrachtet und fortgeschrieben, und trotzdem: nach und nach – im Beispiel bis zum Saisonende – lösen sie sich im Nichts auf.

Um ein plastisches Beispiel zu geben, das leicht nachvollzogen werden kann: die öffentliche Verwaltung ist ein dynamisches System! Sie ist existent – verursacht ja schließlich jede Menge Kosten -,  wenn man sie braucht, löst sie sich (scheinbar) im Nichts auf …

Diese (neue) Erkenntnis sollte aber nicht unbedingt auf einen einzelnen dynamischen Öffentlich-Besoldeten übertragen werden, da er dies u. U. kostenpflichtig zurückweist.

Völlig gefahrlos kann hingegen ein dynamisches Wertungssystem statt eines starren verwandt werden. Es ist grundsätzlich nicht erforderlich, bestimmte Betrachtungszeiträume vorab festzulegen. Dies ist allerdings an eine Bedingung geknüpft:

Der „Faktor“ in der Grundformel neue Rating = alte Rating + (Gewinne – Gewinnerwartung) x Faktor muss exakt oder zumindest hinreichend genau bestimmbar sein. Dieser Faktor bestimmt nämlich, welche Bedeutung einer Leistungsänderung zugemessen wird.

Im Beispiel „Vergleich zweier Saisonen“ wäre man sicher schneller zur Bestimmung des Faktors gekommen, wenn man einfach 100 (Prozentpunkte) durch 40 (Anzahl der Spiele einer Saison) dividiert hätte. Es geht aber eben auch anders – nämlich durch schrittweise Annäherung. Diese Methode war im Beispiel nicht zwingend erforderlich (im Gegenteil - sie war sogar ausgesprochen umständlich), sie ist aber eine funktionierende Lösungsmethode, die für die praktische Anwendung bei Bewertungssystemen unerlässlich ist.

Die Entscheidung – zeitlich starres oder dynamisches System – hängt auch davon ab, welche und vor allem wie viele Daten (Spielergebnisse) ich als Grundlage für die Bewertung einer Leistungsstärke habe. Und da tritt bei Fußball-Nationalmannschaften ein großes Problem auf.

Innerhalb eines Jahres können nur wenige Spielergebnisse bewertet werden, da nicht so oft gespielt wird wie z.B. in einer Liga im Laufe einer Saison. Bewertungen der mittleren Spielstärke einer Mannschaft, die ausschließlich auf wenigen Spielergebnissen beruhen, sind zwangsläufig ungenau und instabil. Und sogar dann, wenn eine Mannschaft selbst relativ viele Spiele absolviert hat, tritt immer noch ein großes Problem auf: wird die Leistungsstärke der jeweiligen Gegner halbwegs richtig eingeschätzt? Dies ist ja auch eine Grundvoraussetzung dafür, eine erbrachte Leistung richtig einzuordnen.

Im Ergebnis ist bei der Wahl zwischen starrem und dynamischem System folgende Abwägung vorzunehmen:

Ø     wähle ich ein starres System, verbunden mit der mechanischen Löschung (ggf. auch Abwertung) älterer Ergebnisse? (z.B. am 31.12. eines Jahres wird der „mechanische Reiz“ ausgelöst, alle Ergebnisse des Vorjahres zu löschen oder abzuwerten). Dies hat die Konsequenz, dass die Datenbasis sehr gering und dies die Ursache für Ungenauigkeiten ist.

Ø     wähle ich ein dynamisches System? Dies hat die Konsequenz, dass die Bestimmung des Faktors aus der Grundformel nicht per Dreisatz errechnet werden kann und dadurch Ungenauigkeiten auftreten können.

Vergleicht man das Ausmaß der möglichen „systembedingten“ Ungenauigkeiten, dann ist die Entscheidung klar. Sicher – mechanische Reize haben auch was für sich … Und nicht zu vergessen: wenn das Datum ein Kriterium eines Ranglistensystems ist, dann spielt das System mit sich selber … Alleine durch Wechseln des Datums kommt dann eine Rangliste zu unterschiedlichen Bewertungen der Spielstärken → ansonsten braucht gar nichts zu passieren (bei geringer Datenbasis können die Auswirkungen dann sogar sehr beträchtlich sein).

Aus all den genannten Überlegungen ist klar: das Rechenmodell, das die Zahlen für die Seite Ratings (Ranking) liefert, ist ein dynamisches System. Das Augenmerk ist dabei ganz besonders darauf gerichtet, die Bedeutung einer festgestellten Leistungsverschiebung (Gewinnpunkte gegenüber erwarteten Gewinnpunkten aufgrund der vorherigen mittleren Spielstärke) möglichst korrekt zu bestimmen; eben so nahe wie möglich an der Wirklichkeit!

 

Nach oben