Gewinnerwartungen

 

Auf der Seite „Grundsätze“ ist ein Beispiel dafür angegeben, wie sich Gewinnerwartungen aufgrund der zuvor ermittelten Spielstärke berechnen lassen. Dies ist erforderlich, um aus der Differenz von erbrachter Leistung und Gewinnerwartung auf die „aktuelle“ Leistungsstärke schließen zu können.

 

Die Leistung der zu bewertenden Saison betrug im Beispiel 22,5 von 40 möglichen Gewinnpunkten. Verglichen mit der Vorsaison, in der 16 Gewinnpunkte erreicht wurden, entsprach dies einem Anstieg von 6,5 Punkten. Multipliziert mit dem Faktor 2,5 ergab sich dann der Wert von 16,25 (Wertungs-)punkten. Die neue Ratingzahl betrug demnach 16,25 plus alte Ratingzahl (=40) gleich 56,25 (Wertungs-)punkte, was exakt dem Ergebnis der zuletzt betrachteten Saison entsprach.

 

Um Dezimalbrüche nach Möglichkeit zu vermeiden, können die Zahlen mit einem Faktor, z.B. den Faktor 8, erweitert werden.

 

Es ist auch möglich, einer Wertungspunktzahl von 50 (→ Prozentpunkte, dabei ist die Differenz aus Siegen und Niederlagen gleich null) den Wert 0 zuzuordnen.

 

Also: aus alter Ratingzahl 40 würde dann der Wert -80 (errechnet sich aus (40-50)x8, aus der neuen Ratingzahl 56,25 der Wert +50. Auf die Leistungsabstände haben Erweiterungen und Verschieben der ganzen Skala keinerlei Einfluss. Überprüfung: Leistungsverschiebung = +50-(-80) = +130; dividiert dann durch 8 ergibt 16,25 usw. usf.

 

Das eigentliche Problem bei der Ermittlung der „Gewinnerwartungen“ besteht in ganz anderer Hinsicht: Fußball-Nationalmannschaften spielen relativ wenig und schon gar nicht spielt im Laufe einer Saison jede Mannschaft gegen jede andere. Nicht einmal im Laufe der Fußballgeschichte (Länderspiele gibt es seit 30.11.1872) gab es bisher Länderspiele (Direktvergleiche) zwischen allen Mannschaften.

 

Verglichen mit dem Beispiel einer Saison bedeutet dies, dass nicht gegen alle anderen gespielt wird, sondern nur gegen einige. Aus dem Abschneiden der Gegner in der Vorsaison (entsprechend der „alten“ Leistungseinschätzungen) lassen sich gleichwohl Gewinnerwartungen gegenüber allen Gegnern einzeln berechnen. Hierbei gibt es mehrere Methoden:

 

1. die lineare Methode

 

Für unsere Beispiel-Mannschaft (nennen wir sie Team A) errechnet sich nach der letzten Saison ein Rating von +130; gegen eine Mannschaft (Team B) mit einem Rating von +210 ergibt sich ein Abstand von -80 Punkten. Spielen nun beide Mannschaften jeweils auf ihrem durchschnittlichen Niveau, so ist zu erwarten, dass die Gewinnerwartung „unseres“ Teams um 80:8 = 10 Prozentpunkte unter dem Niveau einer dem Gegner gleichwertigen Mannschaft liegen wird, mithin 40 % beträgt.

 

Nimmt man nun ein Team C hinzu, dessen Gewinnerwartung gegen Team B aufgrund der Spielstärke 80 % sei, so ließe sich bei dieser linearen Betrachtungsweise eine Chancenverteilung von 90 gegenüber 10 % für ein Spiel zwischen den Teams C und A errechnen.

 

Differenz in Ratingpunkten (C – B)        240

Differenz in Ratingpunkten (B – A)          80

Differenz in Ratingpunkten (C – A)        320

 

Für die Betrachtung einer einzelnen Liga ist es zumeist völlig ausreichend, die lineare Methode anzuwenden.

 

Fußball-Nationalmannschaften gehören von ihrer Spielstärke her aber ganz unterschiedlichen Leistungsklassen an. Und plötzlich erkennt man Grenzen einer linearen Betrachtung.


(Ein anderes) Beispiel: zwischen einem Team A und einem Team B betrage der Leistungsunterschied 240 Ratingpunkte [= 30 Prozentpunkte; Gewinnerwartung A = 80 % (=0,8); B = 20 %]

Zwischen Team B und C bestünde ein gleicher Leistungsabstand, also ebenfalls 240 Ratingpunkte.

Wie verteilen sich nun die Gewinnerwartungen, wenn A gegen C spielt?

 

Der Abstand beträgt dann 480 Ratingpunkte. Linear betrachtet kommt man dann zu Gewinnerwartungen von 110 Prozent für Team A und -10 Prozent für Team C …

 

Das kann so ja nicht sein. Deshalb betrachten wir

 

2. die „verhältnismäßige“  Methode

 

Das zuletzt angenommene Beispiel lässt sich linear nicht „sinnvoll“ lösen, wohl aber, wenn die Gewinnwahrscheinlichkeiten in Form von Verhältnissen ausgedrückt werden. Dann ergibt sich:

 

A – B 4:1, B – C 4:1 und durch Multiplikation der beiden Chancenverteilungen:

A – C 16:1 (etwa 94,1 gegenüber 5,9 Prozent)

 

Genau diese Methode wird z.B. in der Elo-Formel und damit von eloratings angewandt.

 

Folgende Formeln (im Excel-Format) kommen dabei für

  • D (Wertungsdifferenz) aufgrund p (prozentualer Erwartungswert) und
  • p (prozentualer Erwartungswert) aufgrund von D (Wertungsdifferenz)

zur Anwendung:

 

D (p=0,8) =-400*log(1/p-1) = 240,823997

p (für D=2 mal 240,823997) =1/(1+10^(-D/400)) = 0,94117647

 

Das Einbetten in eine logistische Funktion ändert nichts daran, dass die Chancenverteilungen einfach in Chancenverhältnisse umgerechnet werden; mittelbare Chancenverhältnisse ergeben sich dann durch Multiplikation unmittelbarer Chancenverhältnisse. Durch die „Umwandlung“ auf eine „logarithmische Ebene“ wird lediglich nebenbei eine Skalierung erreicht und andererseits das Rechnen um eine „Ebene gesenkt“ (aus Multiplikation wird Addition … usw.)

 

Eine weitere Methode wäre

 

3. die Normalverteilungsfunktion

 

Zur Normalverteilungsfunktion sind die Grundlagen auf der Seite „Ratingskala“ beschrieben.

 

In nachfolgender Abbildung sind die Funktionsgraphen der unterschiedlichen Methoden dargestellt.
 

 

Im Bereich von 50 bis 80 Prozent liegen die Graphen für lineare Funktion, logistische Funktion und Normalverteilungsfunktion sehr eng beieinander.

 

Genau deshalb eignet sich auch die lineare Funktion sehr gut, um z.B. die Spielstärken von Mannschaften hinreichend genau abzubilden, die in etwa einer Leistungsklasse angehören. Die lineare Funktion wird u. a. von Michael Cameron von der University of Waikato (Neuseeland) zur Berechnung seiner AQB-Ratings angewandt.

 

Aus gutem Grund umfasst seine veröffentlichte Liste auch nur gut die Hälfte aller aktiven Nationalmannschaften; leistungsschwächeren Mannschaften ist aufgrund der linearen Funktion keine sinnvolle Ratingzahl mehr zuzuordnen.

 

Für dynamische Wertungssysteme hat AQB aber einen unschätzbaren Vorteil: hier ist am leichtesten nachzuvollziehen, dass letztendlich dynamische Wertungssysteme nicht anderes sind als Systeme des GEWOGENEN DURCHSCHNITTS.

 

 

Bei den drei beschriebenen Funktionen kommt es zu größeren unterschiedlichen „Erwartungen“ (= Einschätzungen der Spielstärken), wenn der Leistungsabstand zweier Mannschaften mehr als eine Leistungsklasse beträgt (siehe Diagramm, Werte >80%).

 

Möchte ich alle Mannschaften in eine Rangliste aufnehmen

[vorausgesetzt, es sind jeweils genügend Leistungsnachweise (= Spielergebnisse) vorhanden, um überhaupt eine Leistungseinschätzung vornehmen zu können],

so taugt die lineare Funktion nicht.

 

Die Frage, ob logistische Funktion oder Normalverteilungsfunktion besser geeignet sind, lässt sich von vorneherein eher schwer beantworten. Die Normalverteilungsfunktion hat immer dann ihre Vorteile, wenn verschiedene – oft sogar nicht gleichgerichtete – Einflüsse für das Eintreten eines bestimmten Ereignisses von Bedeutung sind.

 

Ganz theoretisch: wären die Leistungsstärken zweier Mannschaften das alleinige oder auch völlig dominierende Kriterium für den mutmaßlichen Ausgang eines Spiels, so wäre sicherlich ein auf logistischer Funktion beruhendes System geeigneter. Je stärker andere Einflussfaktoren zu berücksichtigen sind desto stärker neigt sich die Waage zur Normalverteilungsfunktion hin.

 

Dies alles ist aber mehr oder weniger ausschließlich ein „akademischer“ Streit. Interessant ist aber, dass selbst eine Analyse der Ergebnisse bei eloratings (auf logistischer Funktion basierend) zu dem Ergebnis kommt, dass die Normalverteilung nach Gauß ein sehr präzises Messinstrument ist.

 

Wenn also selbst bei eloratings die Abweichungen zwischen „Vorhersagen“ aufgrund zuvor gemessener Spielstärken und dann tatsächlich eintretenden Spielergebnissen sehr, sehr nahe an der Gaußschen Normalverteilung liegen, dann spricht nichts dagegen, die Normalverteilungsfunktion als Berechnungsgrundlage für die Gewinnerwartungen zu nehmen.

 

Nach oben