Kiedy możemy otwierać szampana, czyli czym jest błąd statystyczny w sondażach?

Wszelkie wybory w Polsce to radość, głównie dlatego, że zawsze wyglądają tak samo – 50% ludzi uprawnionych do głosowania głosuje, pozostali nie głosują, a na końcu i tak wszyscy są niezadowoleni. Szczerze mówiąc mnie bardzo martwią losy tych miliona Polaków, którzy co wybory gubią się w drodze do lokali wyborczych i teraz muszą realizować swoje demokratyczne potrzeby poprzez wysyłanie SMS-a za 150 złotych plus VAT w celu zdecydowania, która telewizyjna gwiazda najpiękniej skacze po lodzie. Choć trzeba przyznać, że te głosowania mają jedną zasadniczą przewagę nad tymi narodowymi – ich wyniki rzadko kiedy zaskakują, co czasem faktycznie zdarza się w przypadku przewidywania wyników wyborów. A ostatnio w sposób spektakularny zdarzyło się w 2020 roku. A to za sprawą Micka Jaggera opinii publicznej, Maryli Rodowicz wszelkich narodowych dysput. A mianowicie: błędu statystycznego.

Wpis jest fragmentem książki “Statystycznie rzecz biorąc 2. Czyli jak zmierzyć siłę tornada za pomocą gofra?”, którą na hasło WYBORY kupisz z rabatem – 40% od ceny okładkowej. Zresztą podobnie jak pierwszą część. Promocja trwa tylko na stronie gwfoksal.pl

Błąd statystyczny. Jeszcze kilka tygodni wcześniej rzucano w niego kulkami z papieru, wybierano ostatniego do drużyny na WF-ie, a na szkolnych wycieczkach zawsze musiał siedzieć obok pani. Aż tu nagle stał się królem balu, pupilkiem wszystkich nauczycielek, punktem odniesienia dla kolegów i koleżanek z klasy. Spójrzcie tylko na ten wykres trendów wyszukiwań w Google, na ten cudnie naszkicowany Giewont jego popularności w dzień ostatnich wyborów prezydenckich:

To były te wybory, w których sondaże exit poll wskazały, że Andrzej Duda zdobył 50,4%, a Rafał Trzaskowski – 49,6% głosów, co w praktyce oznaczało tyle, że kładliśmy się spać, nie mając pojęcia, kto jest nowym prezydentem. Właśnie przez błąd statystyczny, czyli różnicę między występującą wartością a oczekiwaną wartością prawdziwą. W tym konkretnym przypadku: tą, która wynika z sondaży, i tą, którą poznać mamy po podliczeniu wszystkich głosów.

Błąd statystyczny w poprawnie przeprowadzonych sondażach nie powinien przekraczać 3% – właśnie o tyle ostateczne wyniki mogą wzrosnąć lub zmaleć w stosunku do tych estymowanych.

To znaczy, że jeśli dany kandydat uzyskuje 20% poparcia, to zakres błędu obejmuje wartości od 17 do 23% i estymujemy, że ten właśnie zakres będzie zawierał w sobie ostateczny, prawdziwy wynik. I o ile w przypadku sondaży exit poll błąd statystyczny jest niższy, z reguły oscyluje wokół 1%, o tyle w tamtym akurat przypadku wynosił aż 2%, ze względu na to, że sporo respondentów odmówiło ankieterom odpowiedzi.

To oznaczało, że prawdziwy wynik sondażu – i tym samym wyborów – wyglądał tak: Andrzej Duda uzyska między 48,4 a 52,4% głosów, a Rafał Trzaskowski między 47,6 a 51,6%. I tyle też wiedzieliśmy tamtego wieczoru. Czyli w sumie nic nie wiedzieliśmy, bo w dalszym ciągu każdy z kandydatów mógł ostatecznie zdobyć upragnioną „większą połowę” głosów.

Akurat w tym wypadku wynik się nie zmienił, chociaż i tak w historii bywało – na przykład w 1995 roku, kiedy Lech Wałęsa w wieczór wyborczy otwierał szampana po otrzymaniu nieco ponad 50% głosów, a następnego dnia okazało się, że musi go oddać Aleksandrowi Kwaśniewskiemu, który ostatecznie zdobył poparcie 51,72% wyborców. Sytuacja cokolwiek niezręczna, bo połowa szampana już była wypita, trzeba dolać wody gazowanej i mieć nadzieję, że nikt się nie kapnie. 

I choć 12 lipca 2020 roku wciąż nie mieliśmy pojęcia, kto wygrał głosowanie na prezydenta naszego kraju, o tyle nikt nie miał wątpliwości, że absolutnym zwycięzcą tych wyborów został błąd statystyczny, o którym tak wiele osób wtedy usłyszało. Niektórzy nawet na niego pomstowali, acz niesłusznie. 

Błąd statystyczny istnieje we wszelkich badaniach sondażowych, ale na szczęście potrafimy obliczyć jego wielkość.

To znaczy potrafimy oszacować z określonym, bardzo wysokim prawdopodobieństwem (najczęściej 95-99%), że odsetek głosujących na kandydata A przewidywany w sondażach nie będzie się różnić od odsetka głosujących na tego samego kandydata w dniu wyborów o więcej niż wskazany błąd statystyczny. Czyli w uproszczeniu – że wyniki sondażowe nie będą się różnić (w górę lub w dół) od rzeczywistych o więcej niż ta wartość. Pamiętajcie więc o tym w niedzielę, gdy będą ogłaszane wyniki wyniki sondaży exit poll – będzie tam podane, jakim błędem są obarczone. To pozwoli Wam łatwiej podjąć decyzję, czy już powinniście otwierać szampana, czy też lepiej jednak poczekać do poniedziałku.

A jeśli chcecie wiedzieć o sondażach więcej, to zapraszam Was do dwóch kolejnych wpisów na ten temat: “Jak to możliwe, że pytamy 1000 osób i na tej podstawie wiemy, jak zagłosuje 30 milionów?” i “Dlaczego sondaże wyborcze czasem się mylą?“.

Więcej o sondażach opinii publicznych przeczytasz też w moich książkach “Statystycznie rzecz biorąc. Czyli ile trzeba zjeść czekolady, żeby zdobyć Nobla” i “Statystycznie rzecz biorąc 2. Czyli jak zmierzyć siłę tornada za pomocą gofra?”. Obie na hasło WYBORY kupisz obecnie z rabatem -40% od ceny okładkowej. Promocja trwa tylko na stronie gwfoksal.pl

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *