schwatzgelb.de das Fanzine rund um Borussia Dortmund
A- A+
schwatzgelb.de das Fanzine rund um Borussia Dortmund
Startseite | FAQ | schwatzgelb.de unterstützen
Login | Registrieren

Ja es bietet einen großen Mehrwert (BVB)

Nolte, Sonntag, 28.02.2021, 09:16 (vor 1153 Tagen) @ Fugazi1982
bearbeitet von Nolte, Sonntag, 28.02.2021, 09:19


Wo ist mein Denkfehler, wenn ich aus einem höheren xG-Wert - eines einzelnen Spiels - für Team A gegen Team B schließe, dass Mannschaft A aus - im Profiligen-Durchschnitt -erfolgsversprechenderen Schusspositionen geschossen hat?

Das hat doch auch eine gewisse Aussagekraft für die Siegwahrscheinlichkeit in einem einzelnen Spiel oder nicht?

Extrem Beispiel: Wir kennen beide das tatsächliche Ergebis nicht. Ich zeig dir einen xG-Wert eines einzelnen Spiels: Team-A-xG=5 und Team-B-xG=0 - ich wette 100€ auf Team B. Steigst du mit ein und wettest dagegen oder sagst du xG ist Quatsch und die Siegwahrscheinichkeit beider Teams liegt bei 50%?

Da ist kein grundsätzlicher Denkfehler. Bei dieser Wette steige ich natürlich ein. xG sagt tendenziell schon etwas darüber aus, welches Team mehr/größere Torchancen hatte - insbesondere, wenn die Diskrepanz groß ist.

Unbegründet dagegen ist der Glaube, dass so "exakte" Zahlen wie 2,51 vs. 0,64 dem tatsächlichen Chancenverhältnis nahekommen. Das liegt einfach daran, dass in einer so kleinen Stichprobe wie einem einzelnen Spiel die Torwahrscheinlichkeiten der jeweiligen Schüsse stark vom durch xG wiedergegebenen Durchschnittswert abweichen können. Eine doch recht große Differenz wie 2,51-0,64 kann also einen Hinweis darauf geben, dass wir das Spiel verdient gewonnen haben. Ob unser Sieg nun aber zu hoch, zu niedrig oder genau richtig ausgefallen ist, lässt sich daraus nicht mit so großer Sicherheit sagen, wie es die Zahlen suggerieren.


Wäre ein passenderes Beispiel nicht eher, du ziehst eine Zufalls-Stichprobe (der Grundgesamtheit Deutschland [Torschüsse aus Dahoud-Position aller Profi-Ligen] von 1.000 Personen und ermittelst das Ereignis Geschlecht [Tor?], dabei kommt raus: Männer[Tor]=400 und Frauen[kein Tor]=600; dann sollst du voraussagen, ob eine zufällig aus Deutschland ausgewählte Person eher Männlich oder Weiblich ist. [(...), ob der Schuss von Dahoud eher Tor oder kein Tor ist].

Grundsätzlich gibt es natürlich einen Unterschied zwischen binären und nicht-binären Variablen, aber ich sehe ehrlich gesagt nicht, inwiefern der für die Betrachtung relevant ist. Mein Argument bleibt gleich, wenn wir dein Beispiel mit "männlich" und "weiblich" aufgreifen. Äquivalent zum Grundschulbeispiel in einem anderen meiner Beiträge verändert sich meine Schätzung zum Geschlecht der Person mit den Informationen, die ich habe. Wenn ich nichts über die Person weiß - nur, dass sie aus der Grundgesamtheit der deutschen Bevölkerung gezogen wurde -, tippe ich eher auf weiblich. Wenn ich aber beispielsweise etwas über die Frisur oder den Beruf dieser Person erfahre, beziehe ich diese in meine Überlegungen ein und passe meine Schätzung gegebenenfalls an.

Nichts Anderes sollte man bei einem Torschuss in einem Spiel machen. Zu sagen "Dahouds Tor hatte eine fünfprozentige Wahrscheinlichkeit, reinzugehen, weil xG das sagt", ohne die konkrete Situation in meine Überlegungen mit einzubeziehen (obwohl ich sie gesehen habe), ist so, als würde ich bei deiner zufällig gezogenen Person sagen "Es gibt eine größere Chance, dass sie weiblich ist, weil in der Gesamtbevlkerung mehr Frauen als Männer sind", und bei dieser Vermutung auch dann bleiben, wenn ich erfahre, dass die Person kurze Haare hat und auf dem Bau arbeitet. (Natürlich gibt es kurzhaarige Frauen auf dem Bau, aber sie sind gegenüber Männern wohl deutlich in der Unterzahl)

So grobe Kennzahlen wie die Geschlechterverteilung in Deutschland oder der xG-Wert für Torschüsse kann einen Anhaltspunkt geben, wenn du sonst keine Informationen hast. Wenn du aber weitere Infos hast (Beruf der Person; Ansehen der Torchance), solltest du sie auch in deine Schätzung einfließen lassen.


Jetzt sagst du ja zurecht, dass du nur anhand dieser Daten eine große Unsicherheit hast - aber seriöse xG-Modelle berücksichtigen meines Wissens nach auch weitere Prädiktoren (z.B. Kopfball/Gegnerdruck/Spieleranzahl zwischen Schussposition und Tor/Wetter).

Dabei gibt es aber zwei mögliche Probleme, von denen zumindest eines vermutlich auftreten wird:

a) Die Prädikatoren sind noch immer zu grob, als dass sie eine jeweilige Situation adäquat wiedergeben. Beispielsweise könnte man bei "Spieleranzahl zwischen Schussposition und Tor" für relevant halten, wo genau die Spieler sich befinden (ein Spieler, der zwischen Ball und rechtem Toreck steht, hat wenig Einfluss, wenn der Schütze nach links schießt), in welche Richtung sie sich bewegen, und ob sie mit dem Gesicht zum Ball stehen. Es ist also trotz weiteren Prädikatoren denkbar, dass sie weiterhin zu grob sind.

b) Wenn man die Prädikatoren verfeinert und viele verschiedene Szenarien bei gleicher Schussposition unterscheidet, entsteht das Risiko, dass für die jeweilige Situation nicht mehr so viele Beobachtungen im Datensatz sind. Dann hast du womöglich zehn Fälle, die mit Dahouds Situation vergleichbar sind - aber ist diese Menge dann ausreichend, um eine solch deutliche Aussage zur Torwahrscheinlichkeit zu treffen?

Konkrete Aussagen dazu kann ich an dieser Stelle nicht treffen, weil ich nicht weiß, wie fein die Prädikatoren sind und wie groß der xG zugrundeliegende Datensatz aufgeschlüsselt nach den durch Prädikatoren unterscheidbaren jeweiligen Torschuss-Situationen tatsächlich ist.

PS.: So oder so, ich fand eure Diskussion richtig spannend :o) - Was mir noch in den Sinn kam bzgl. eurer Diskussion: hast du da an die Unterschiede zwischen baysianischer und frequentistischer Statistik gedacht?

Konkret in der Diskussion daran gedacht habe ich nicht, aber er ist mir natürlich bekannt :)


Antworten auf diesen Eintrag:



gesamter Thread:


1233615 Einträge in 13684 Threads, 13778 registrierte Benutzer Forumszeit: 26.04.2024, 08:11
RSS Einträge  RSS Threads | Kontakt | Impressum | Nutzungsbedingungen | Datenschutzerklärung | Forumsregeln