schwatzgelb.de das Fanzine rund um Borussia Dortmund
A- A+
schwatzgelb.de das Fanzine rund um Borussia Dortmund
Startseite | FAQ | schwatzgelb.de unterstützen
Login | Registrieren

Warum man von 1000 Befragten auf 150 Millionen schließen könnte (Politik)

Freyr, Dienstag, 04.10.2022, 17:32 (vor 575 Tagen) @ Smeller
bearbeitet von Freyr, Dienstag, 04.10.2022, 17:50

Solange nicht alle befragt werden, sondern nur eine Schnittmenge, kann das auch gar nicht representativ sein, da die Umfrage davon ausgeht, dass sich eine Minderheit genauso wie eine Masse verhält.


Ich versuche es mal zu erklären, gänzlich ohne Mathematik, mathematische Symbole oder Formeln

es gibt 2 wichtige Dinge

1. Stichprobengröße

Nehmen wir mal an, dass in einem verdeckten Topf 1000 Kugeln liegen: rote und gelbe Kugeln. Nun ziehst du Kugeln und legst sie nicht wieder zurück.
Zeitaufwändig wäre es nun alle 1000 zu ziehen. Schneller wäre es wenn du einfach von einigen wenigen auf die 1000 schließen könntest. Da der Topf gut durchmischt ist, sind die gezogenen Kugeln eine ideale Probe da alles zufällig angeordnet und gezogen wird.

Du ziehst die erste Kugel und hast eine rote, du ziehst die zweite Kugel und hast eine gelbe. Du könntest also annehmen dass das Verhältnis bei 50% (rot-gelb) liegt. Da leuchtet aber jedem ein dass die Annahme so nicht zu machen ist. Dabei hast du noch viel zu wenige Kugeln gezogen.

Daher ist die Frage wie viel Kugeln musst du ziehen um sagen zu können. Hey mit 90% Wahrscheinlichkeit hast du exakt soviele gelbe/rote gezogen wie gelbe/rote im Topf liegen.

Nun wird uns das exakte Verhältnis im Topf verraten. Es sind 900 gelbe und 100 rote.
Wenn du also 50 Kugeln ziehst müssten also 45 gelbe und 5 rote dabei sein. Die Wahrscheinlichkeit dafür liegt bei 81% dass es exakt so kommt. Das ist zwar viel aber nicht gut genug. Also 50 Kugeln ziehen reicht nicht aus.

Machen wir 200 daraus. dann müssten 180 gelbe und 20 rote dabei sein um das exakte Ergebnis widerzuspiegeln. Da liegt die Chance schon bei 89,x%. da könntest du schon sagen, hey das reicht mir, den Aufwand den Rest zu zählen mache ich mir nicht mehr.

--------

Sehr ähnlich ist es bei Umfragen. Auch da gibt es ein Verhältnis was unbekannt ist (statt gelb/rot, Bolsonaro/Lula), und eine Stichprobengröße die wir festlegen müssen damit wir sagen können: also mit sehr hoher Wahrscheinlichkeit wird das stimmen.

Da gibt es in der zuständigen Statistik 2 wichtige Werte: Konfidenzniveau (confidence level) und Fehlerspanne (margin of error). Die legen fest wie genau das Ergebnis nun sein soll. Das Konfidenzniveau liegt meist bei 90, 95 oder 99% und die Fehlerspanne bei 5%.
(Standardabweichung lass ich mal weg)

Auf unser obiges Beispiel bezogen mit einem Konfidenzniveau von 95% und Fehlerspanne und 5% kannst du ausrechnen, dass bei einer Gesamtpopulation (also wie viele Kugeln/Personen es überhaupt gibt) von 1000 Kugeln wir zufällig davon mindestens 278 ziehen müssten um die Parameter zu erreichen.

Das ganze können wir auch bei absurd hoher Gesamtpopulation auch berechnen. Wie groß müsste die Stichprobe sein und zu erfahren wie viele Personen den BVB eher mögen oder eher nicht mögen ohne dazwischen mit einem KN von 95% und FS von 5% (84080000 Personen in Deutschland)
Gerade mal 385 Personen müssten wir dafür befragen.
Wenn wir die Fehlerspanne auf 2% verringern, müssten es schon 2401 befragte Personen sein.

-------------
Du siehst dass die Stichprobengröße gar nicht so groß sein muss wie man denkt um mit sehr hoher Wahrscheinlichkeit von ganz wenigen auf viele schließen zu können.

2. Repräsentativität
Damit das mit der Stichprobe funktioniert, muss sie die "Grundgesamtheit abbilden". Bei dem obigen Beispiel mit den Kugeln, die zufällig gezogen wurden, ist es natürlich schon so konstruiert, dass es repräsentativ ist, das ist in der realen Welt leider oftmals schwieriger.
Wenn man also um der Beliebtheit des BVB erfahren möchte, nur in Dortmund befragt, ist es am ende wohl nicht repräsentativ, oder nur Personen mit einem E-Auto. Das heißt die Stichprobe ist am besten so durchschnittlich wie möglich bzw. so nah dran an der Gesamtpopulation wie möglich (soviele Frauen und Männer in der Stichprobe wie in der Population)
Aber auch da haben Umfrageinstitute verschiedene Daten (daher wird oftmals Alter, Beruf, Einkommen etc. mit angefragt), Modelle und Erfahrungswerte um sich ein Gesamtbild machen zu können. Aber das ist eines der Dinge bei denen es am ehesten hackt, nicht an der Stichprobengröße


Antworten auf diesen Eintrag:



gesamter Thread:


1237376 Einträge in 13717 Threads, 13791 registrierte Benutzer Forumszeit: 01.05.2024, 23:40
RSS Einträge  RSS Threads | Kontakt | Impressum | Nutzungsbedingungen | Datenschutzerklärung | Forumsregeln