Logo

Ein Hoch auf kleine Daten

Von Barnaby Skinner, 11. November 2016 20 Kommentare »
Nicht alle Umfragen rechneten mit einer Clinton-Wahl. Eine sticht dabei besonders hervor.
Stichworte:, , ,

Von Barnaby Skinner

Die US-Umfrageinstitute, die mit ihren Wahlprognosen mehrheitlich falschlagen, bekommen seit Trumps Sieg einiges zu hören. Von Bankrotterklärung ist die Rede. Der Politstratege Mike Murphy rief im Sender MSNBC aus: «Seit heute Nacht ist die Datengläubigkeit tot.»

Dabei gab es durchaus Umfragen, die das Ergebnis korrekt antizipierten: die Daybreak-Umfrage der «Understanding America Study» (UAS) der Southern California University etwa. Sie wurde seit Juli regelmässig von der «LA Times» publiziert und sah Trump seit Juli vor Clinton. Die Umfrage sah den Milliardär nach dem Kongress der Republikaner und vor den TV-Duellen im September gar mit 6 Prozentpunkten im Vorteil.

Umfragen stützten sich auf wenig Zahlenmaterial

Die letzte Vorhersage am Tag vor den Wahlen sagte noch 3 Prozentpunkte Vorsprung für Trump voraus. Zur selben Zeit gingen die meisten anderen Prognosen von einem Bonus von 4 Prozent für Clinton aus. Allen voran die Analyse des Shootingstars Nate Silver auf dem Nachrichtenportal «Fivethirtyeight». Vor vier Jahren hat Silver den US-Wahlausgang prozentgenau vorhergesagt.

Der Grund für die unterschiedlichen Wahlprognosen war die Datenbasis. Die Daybreak-Umfrage stützte sich auf wenig Zahlenmaterial. Für die Auswertung wurde eine Gruppe von 2973 Personen aus den ganzen USA per Internet befragt. Nicht einmal, wie üblich ist, sondern seit Juli jede Woche. Die Frage nach der Wahlpräferenz – Clinton oder Trump – wurde dabei Woche für Woche mit zwei bis drei Auskünften ergänzt. Zum Beispiel, ob ein Teilnehmer 2012 für Romney oder Obama gestimmt hatte.

«Die Leistung des Modells beeindruckt mich. Vor allem bildete es die Schlusswelle hin zu Trump viel konstanter ab als alle anderen Umfrageserien», sagt Politologe Claude Longchamp vom Berner GFS-Institut. Voraussetzung sei ein qualitativ hochwertiges Online-Panel. Ein solches würde ich auch in Anspruch nehmen», sagt Longchamp. Bei der letzten US-Wahl hatte die Methode Obama als Gewinner vorhergesehen.

Die anderen Modelle wussten weniger über die Teilnehmer, hantierten dafür aber mit mehr Daten.
Etwa Silver von «Fivethirtyeight». Er kombinierte dafür 12 635 Umfragen, die zusammengezählt bis zur letzten Prognose vor dem Wahltag die Angaben von 14,6 Millionen befragten Personen berücksichtigen konnten. Silver errechnete damit ein Szenario, wonach Clinton am letzten Montag 3,6 Prozentpunkte vor Trump führte.

Nicht offen zur Trump-Wahl gestanden

In der Frage, warum die Modelle mit mehr Daten scheiterten, sind sich die Experten uneins. Die einfachste Erklärung ist, dass sich menschliches Verhalten eben nicht so einfach in Wahrscheinlichkeitsmodelle packen lässt. Eine andere meint, Befragte seien nicht offen zu ihrer Trump-Wahl gestanden. Genau das könnte ein Vorteil der kleinen Umfrage gewesen sein. Die Teilnehmer bauten Vertrauen zur wiederkehrenden Umfrage auf und waren deshalb eher bereit, ihr wahres Wahlverhalten preiszugeben.

Ganz kann Nate Silver allerdings nicht akzeptieren, dass er mit seiner Grossanalyse von einem einzigen Datensatz ausgestochen wurde. Er wies in einem Tweet darauf hin, dass Clinton über alle US-Staaten gerechnet mehr Stimmen bekommen habe als Trump. Rein rechnerisch sei die Daybreak-Umfrage deshalb ungenauer als seine. Nur blöd, dass sie trotzdem den Gewinner korrekt voraussah. Und Silver nicht.

20 Kommentare zu “Ein Hoch auf kleine Daten”

  1. […] Cohn und Nate Silver für ihre Vorhersagen rechtfertigen müssen, ist absurd. Völlig bizarr ist ein Artikel, der im „Datenblog“ des Schweizer „Tagesanzeigers“ erschien und die Umfrage […]

  2. Mustermann sagt:

    Das Stimmenmehr ist komplett bedeutungslos bei den US Wahlen. Da geht es nur darum den Staat zu gewinnen, Ohio, Florida etc. Der Stimmenanteil wird bei dieser Art von Poll nicht ermitteln sondern die Abweichung von Stimmung (Wer wird gewinnen) gegen die wie werden Sie stimmen. Da liebt Trump mit 47 % viel näher als Clinton mit 43 gegenüber 53 % bei der Stimmung. Es ist also wichtig, dass Stimmung und Vote möglichst nahe kommen.
    Clinton hat am Tag Ihres Kollapses die Wahl verloren, dass sieht jeder.

  3. Roger Smith sagt:

    Witzig war auch als ich auf Tagi online in einem Kommentar schrieb dass Trump nach der 3. TV Debatte bei Umfragen vorne liegt.
    Die Reaktionen kamen prompt: “Spannend wäre es mehr über ihre Quelle zu erfahren. Breitbart?”, oder “Akzeptieren Sie die LA Times als legitime Quelle? Google -> la times – popular – vote” (Hier wurde die Aussagekraft von LA Times wohl angezweifelt) und “Quelle? Wahrscheinlich der Twitter-Account von Donald Trump…” sowie “Er liegt vorne auf dem Weg, zu verlieren!”

    Wer zuletzt lacht…

    • Flori Antha sagt:

      Sorry, aber die LA Times lag falsch, alle anderen Umfragen richtig. HC hat das Stimmenmehr. Das Problem sind nicht die Umfragen, sondern dass was die Journalisten und irgendwelche Interpreten daraus machen. Das ist genauso mit den stereotypen Wählerbeschreibungen in der Presse. Jeder seriöse Wahlforscher kann einem erklären, dass es keine einfachen eins-zu-eins Übereinstimmungen zwischen sozialen Gruppen und Kandidaten gibt. Aber daraus kann keine sexy Schlagzeile machen.

  4. Robert Karlen sagt:

    Was will dieser Beitrag sagen, dass man einen findet, der die richtige Prognose gemacht hat. Toll, das ist nicht erstaunlich, weil handelt es sich um einen Tip, bei zwei möglichen Ergebnissen Hillary oder T.

  5. Ales Urbanczik sagt:

    Ihre und Herrn Longchamps Begeisterung für die LA Times Umfrage ist überhaupt nicht nachvollziehbar.
    Hätten, über alle Bundesstaaten gleich verteilt, 1 von 100 Menschen Clinton statt Trump gewählt, so wäre Hillary Clinton Präsidentin, da sie Florida und Pennsylvania gewonnen hätte. In der LA Times Umfrage hätte diese Gesamtdifferenz von 2% immer noch Trump mit +1% vorne gehabt. Also was soll das ?
    Die LA Times Umfrage hat doch nicht den Sieger sondern nur das landesweite Stimmen Ergebnis prognostiziert was im Moment bei ca. +0.5% Clinton liegt.
    Die LA Times war also ca. 3.5% daneben. Die meisten anderen hatten Clinton bei ca. +3%, lagen also 2.5% daneben.

  6. Werner Frey sagt:

    Es ist das passiert, wie so häufig. Diejenigen denen die Umfragewerte gefallen, bleiben daheim und die, die sich durch die Umfragewerte nicht vertreten fühlen, gehen dann doch wählen. Das ist die Partei der Nichtwähler und Unentschlossenen.

  7. aj1575 sagt:

    Die einen sagten +3% für Trump, die anderen +3.6% Hillary. Am Schluss warden es etwa +0.2% für Hillary sein. Es lagen also beiden Umfragen etwa gleich weit daneben (3.2% respective 3.4%). Es gab auch Umfragen die Hillary vorne sahen, aber trotzdem näher am tatsächlichen Resultat lagen (Bloomberg, Reuters, Rassmusen).
    Es ist wie bei Wetterprognosen, wenn eine Prognose Wechselhaft mit 60% Regenwahrscheinlichkeit, und die andere mehrheitlich sonnig mit 40% Regenwahrscheinlichkeit angibt, haben beide recht wenn es sonnig ist, und wenn es regnet. Trotzdem wird gesagt warden, dass eine Prognose falsch war.

  8. T Kirk sagt:

    Was die Befragungen scheinbar unzureichend berücksichtigen, ist die geografische Verteilung der Antworten. Silver hat Recht, wenn er sagt, dass sein Modell den Vorsprung Clintons korrekt prognostiziert hat. Sie lag am Ende um ca. eine Viertel Million Stimmen vorn. Aber der Präsident wird eben nicht direkt gewählt. Bei knappen Rennen im amerikanischen System kann ein Modell nur dann sinnvolle Voraussagen liefern, wenn es Staat-für-Staat arbeitet und so die Wahlmännerstimmen prognostiziert. Sonst ist es nur eine nette Theorieübung.

  9. Stefan Egger sagt:

    Wenn man nur lange genug sucht, wird man immer eine Umfrage finden, die das Ergebnis richtig vorausgesagt hat. Irgendein “Wetterschmöcker” wird auch dieses Mal richtig liegen, wenn es darum geht, ob es an Weihnachten schneit oder nicht. Das wird man jedoch erst rückblickend wissen.

  10. w. widmer sagt:

    Da vergisst man die vielen Demokraten Wähler die gesagt haben dass sie Trump wählen weil Bernie Sanders nicht Kandidat wurde. Bernie Sanders wurde verbotenerweise von der Partei stakt benachteiligt und das haben viele Demokraten Wähler verärgert.

  11. Simon Wolanin sagt:

    Schon erstaundlich: Im Vorfeld der Wahl wurde Nate Silver noch dafür kritisiert, dass er die Siegeschancen von Trump viel zu hoch einschätze. Andere Modelle bezifferten die Clinton-Siegeschancen bis zu 99 Prozent. Silver hingegen hat immer darauf hingewiesen, dass der Vorsprung von Clinton in den einzelnen Staaten gering ist und es nur wenig braucht, damit das Pendel umschwingt: http://fivethirtyeight.com/features/the-odds-of-an-electoral-college-popular-vote-split-are-increasing/

    Der Daybreak-Poll sagte zwar den Trump-Sieg voraus, lag aber bei den Stimmenanteilen klar daneben. Nate Silver hat also völlig recht, dass sein Modell näher an der Realität war.

    • Joe Grovel sagt:

      Genau. Nate Silver hat in den Tagen vor der Wahl immer wieder darauf hingewiesen, dass Trumps Chancen intakt waren. Keine andere Internetquelle hat mich dermaßen oft immer wieder beunruhigt. Insbesondere hat er auch betont, wie weniger klar die Statistik im Vergleich zu Romney war.

  12. Manfred Blättler sagt:

    Nate Silver hatte die Wahlchancen von Trump vor der Wahl auf 28.6% beziffert. Übersetzt heisst das, dass er diese Wahl also jedes 3.5 mal gewinnt. Oder halt eben aus hypothetischen 1000 US Präsidentschaftswahlen Trump immerhin 286 mal als Sieger hervorgeht. Dass es nun selbst im Datenblog so schwer ist, Wahrscheinlichkeiten eben als WahrSCHEINlichkeiten zu deklarieren verwundert mich. Klar gab es Prognosen die Clinton bei über 95% Wahlchancen hatten, aber auch dann gewinnt Trump jede 20. Wahl! Grundschulstoff, aber leider für viele postfaktische Menschen schwer zu verstehen.

    • Hans sagt:

      Nate Silver prognostiziert wirklich gut. Ein Ereignis mit einer Wahrscheinlichkeit von 28.6% kann schon mal eintreten. Andere Prognostiker liegen aber systematisch daneben, was man notabene nicht an einem Einzelereignis festmachen kann. Fakt ist aber halt, dass die Likelihood, die man aus allen gemachten Prognosen berechnet, weit neben dem liegt, was zu erwarten wäre. Oder anders gesagt: Die behaupteten Wahrscheinlichkeiten sind unzutreffend.
      Das postfaktische Zeitalter hat zwei Gesichter. Die einen ignorieren Fakten von vornherein und grundsätzlich. Die anderen erheben wilde Spekulationen zu Fakten und reklamieren die volle Deutungshoheit darüber, was Fakten seien.

  13. Klaus Bonanomi sagt:

    Aber auch diese Umfrage stimmte nicht. Es haben landesweit mehr Menschen für Clinton gestimmt als für Trump. Das Problem ist doch, dass aus einem nationalen Stimmenanteil nicht auf den entscheidenden Wert, nämlich die Zahl der Elektoren geschlossen werden kann.

  14. Peter sagt:

    interessanterweise haben die Teilnehmer des poll ebenfalls Clinton als Sieger angegeben, jedoch hat die Methode dennoch aus diesen Daten Trump vorhergesagt. (siehe Link im blog-text).

  15. Ralf Kannenberg sagt:

    Wie sehr ich die Meinungen von Leuten liebe, die keine Ahnung von Mathematik haben. Wenn Prognosen so gut sind, dann könnte man die Wahlen einsparen und viel Geld und Zeit sparen !

    • Leo Schmidli sagt:

      Sie scheinen aber nicht wirklich viel Ahnung von Statistik zu haben. Weiter oben hat es @Manfred Blättler um 11:24 erklärt. Es gibt einen statistischen Fehler, aber insbesondere den Fakt, dass eine Wahrscheinlichkeit nie 100% beträgt.