Nie tylko Polska pękła na pół (o statystyce i nie tylko)

To długi tekst. Jeśli nie masz czasu przeczytać całości - zachęcam, by przyjrzeć
się chociaż ostatniemu akapitowi. Jest dla mnie bardzo ważny.

W zeszłym tygodniu na firmamencie zbiorowej wyobraźni pojawiła się nowa gwiazda, Mick Jagger opinii publicznej i Beata Kozidrak wszelkich narodowych dysput. A mianowicie: błąd statystyczny. Jeszcze kilka tygodni temu rzucano w niego kulkami z papieru, wybierano jako ostatniego do drużyny na WF-ie, a na szkolnych wycieczkach zawsze musiał siedzieć obok pani. Teraz zaś – król balu, najpopularniejszy chłopak na szkolnej potańcówce, pupilek wszystkich nauczycielek i koleżanek z klasy. Spójrzcie tylko na ten wykres trendów wyszukiwań w google, na te cudnie naszkicowane Kalatówki jego popularności:



Ja tam się cieszę, że w końcu został doceniony. Jakby nie było zawsze był cichym bohaterem wszelkich sondaży, suflerem poprawnych interpretacji. A za co dokładnie go kochamy? A już opowiadam. Potraktujcie ten wpis jako całkiem pokaźny opis konta na Tinderze rzeczonego błędu.

 

Zacznijmy od… zupy pomidorowej

A właściwie – od sondaży. Gdy próbujemy oszacować, w jaki sposób rozkładają się głosy na poszczególnych kandydatów to owszem, najlepiej by było przejść się po wszystkich Polakach uprawnionych do głosowania i spytać na kogo będą głosować. Ewentualnie moglibyśmy do nich zadzwonić, ale to by było jeszcze bardziej problematyczne, no bo jeśli akurat będzie leciał „Ojciec Mateusz”, to nikt nie odbierze. Niemniej chodzić po wszystkich też nie chodzimy, bo to by nam zajęło bardzo dużo czasu, żeby tyle biletów autobusowych skasować. Nie mówiąc już o innych problemach praktycznych, na które możemy natrafić przy przeprowadzaniu sondażu – na przykład w 2014 roku spektakularnie nie powiódł się spis ludności w Indiach, w całym kraju zabrakło bowiem… ołówków do wypełniania kwestionariusza. Stało się tak dlatego, że badacze nie doszacowali mniej więcej 15% populacji i o ile rozumiem, że to każdy mógł się tak pomylić, dwieście milionów ludzi w te czy we wte, to nie do końca rozumiem dlaczego nie mogli rozwiązać problemu braku ołówków tak, jak większość z nas, to jest poprzez wizytę w pobliskiej IKEI.

Na szczęście dla IKEI metodologia badań ma propozycję dla wszystkich tych, którzy chcieliby poznać jakieś społeczne opinie i przekonania, ale akurat nie mają czasu (albo ołówków) by przepytać każdego jednego człowieka w danym kraju.

Albowiem jest tak, że gdy przeprowadzamy badanie, na jakikolwiek temat, to musimy wybrać populację badaną, czyli grupę osób (albo zwierząt, krajów, instytucji itd.), która w tym naszym naukowym rendez-vous weźmie udział.

Wbrew powszechnej opinii populacja badania nie oznacza „wszystkich ludzi na świecie” – w przypadku sondaży przedwyborczych oznacza wszystkich Polaków uprawnionych do głosowania (dodatkowo warto sprawdzić, czy autorzy danego badania postanowili wziąć pod uwagę również polskich wyborców mieszkających za granicą, czy też wykluczyć ich z badania). A dalej to już radość i dobra zabawa – pobieramy losową próbę badaną, czyli grupę osób, którą spytamy o zdanie. Taka próba jest mniej liczna niż populacja (a więc oszczędzamy na ołówkach, yay!!!), niemniej wciąż reprezentatywna. Co oznacza, że możemy uogólnić wnioski z sondażu przeprowadzonego na mniejszej grupie osób na całość populacji. To jest powiedzieć: wygląda na to, że Polacy będą głosować tak i tak, i generalnie to ten kandydat powinien zacząć chłodzić szampana.

No ale jak to jest możliwe – spytacie – że możemy sobie przepytać 1000 osób i na tej podstawie stwierdzić, jak zagłosuje ponad 30 milionów osób?

No pozwólcie, że wytłumaczę Wam to wraz z moją najlepszą koleżanką zupą pomidorową. Jeśli nagotujemy sobie pięć litrów pomidorówki i tuż przed wizytą grupy z pobliskiego przedszkola zechcemy sprawdzić, czy owa zupa jest gastronomiczną świnką Peppą, to jest podbije ich małe serduszka, to nie musimy w tym celu wypijać całego garnka. Wszak niedawno byliśmy w IKEI po ołówki i nie tylko, więc możemy skorzystać ze swojej nowej chochli, zamieszać naszą pomidorówkę, a potem spróbować tej jednej łyżki i na tej podstawie ocenić, czy nasza zupa jest pyszna. Chochlę należy następnie zachować, by okładać nią po głowie tych, którzy twierdzą, że pomidorową je się z makaronem (!?!??!?!).

Kluczowym jest to, że zupę mieszamy, a próbę losujemy. Jak losujemy*, to badacz w żaden sposób nie ingeruje w to, kto się w danym badaniu znajdzie. Robimy to po to, by próba badana była jak najbardziej zbliżona do populacji pod względem kluczowych cech socjodemograficznych (wiek, płeć, umiłowanie do „Ojca Mateusza”…). Bo tylko wtedy będziemy mogli naszym wnioskom ufać i uogólnić je na wszystkich uprawnionych do głosowania.

*Metody losowego doboru próby to nie tylko dobór losowy prosty, czyli na przykład losowanie komu kupujemy prezent na klasowe Mikołajki. Mamy w statystyce również dobór losowy systematyczny, warstwowy, wielostopniowy i jeszcze parę innych… no generalnie jak wszystkie te dobory losowe przychodzą na Wigilię to tyle ich jest, że matka musi pożyczać krzesła od sąsiadki. Ale to temat na zupełnie osobny wpis, ewentualnie film pełnometrażowy.

(bardziej szczegółowo o próbie, populacji i sondażach piszę w książce o statystyce, którą ja napisałam, a Wy KUPCIE  JĄ!!! Tutaj jednak skróciłam ten wywód do niezbędnego minimum, tak by zostało Wam jeszcze trochę uwagi na to, by poczytać o Beacie Kozidrak badań sondażowych, tj. błędzie statystycznym)

 

Mick Jagger opinii publicznej i Radosław, co udawał ogórka

Klawo, nie? Bierzemy sobie chochlę społecznej zupy i na jej podstawie wnioskujemy o całym garnku. No, klawo. Choć oczywiście musimy pamiętać o tym, że takie wnioskowanie jest – siłą rzeczy – niedoskonałe, narażone na błąd.  Niemniej mam dla nas wszystkich dobre wiadomości – teoria statystyki pozwala nam tę niedoskonałość oszacować.

To znaczy – dla każdego badania możemy wybrać naszego króla balu, ustalić wielkość błędu statystycznego za pomocą specjalnego wzoru matematycznego. To zaś pozwala nam założyć, z określonym prawdopodobieństwem, iż odsetek z próby badania nie będzie się różnił od odsetka w populacji o więcej niż wskazany błąd statystyczny.

W uproszczeniu – że wyniki sondażowe nie będą się różnić (w górę lub dół) od tych rzeczywistych o więcej niż ta wartość.

Nie inaczej jest w przypadku badań exit poll, czyli „sondaży wyjścia”, przeprowadzanych przed losowo wybranymi lokalami wyborczymi w dniu wyborów. Badani wychodzący z lokalu dostają do wypełnienia anonimową ankietę, gdzie są pytani o to, kogo poparli. Potem wrzucają ją do urny i to jest w miarę proste zadanie, no bo mają w tym już jakąś wprawę.

Mogłoby się wydawać, że takie sondaże wyjścia to już trzaskają pomiar dokładny jak dzielenie pizzy w akademiku na równe 38 części, chyba że Radosław jednak nie wyjdzie z tej beczki do której wszedł po pijaku, żeby udawać kiszonego ogórka, to wtedy 37. No ale nie – wciąż próbujemy przewidzieć ostatecznego zwycięzcę na podstawie deklaracji mniejszej grupy wyborców. I wciąż potrafimy tę swoją niedoskonałość oszacować*.

* do pewnego stopnia, bo wiadomo, że są czynniki, których nie przewidzisz – na przykład głosy nieważne, gdy ktoś myślał, że zagłosował, ale jednak mu się wybory pomyliły z konkursem plastycznym w przedszkolu i zamiast krzyżyka trzasnął dinozaura.

To ile wynosił błąd statystyczny w przypadku exit polli z zeszłej niedzieli? 2 punkty procentowe. Co przy podanych wynikach (50,4% do 49.6%) oznaczało, że ostateczny prezydent jeszcze mógł się nam zmienić po podliczeniu wszystkich głosów. Akurat w tym wypadku się nie zmienił, ale i tak w historii bywało – na przykład w 1995 roku, kiedy Lech Wałęsa otwierał w wieczór wyborczy szampana po otrzymaniu trochę ponad 50 procent głosów, a następnego dnia okazało się, że musi go oddać Aleksandrowi Kwaśniewskiemu, który ostatecznie zdobył poparcie 51,72% wyborców. A to niezręcznie, bo połowa już wypita, więc musiał dolać wody gazowanej i mieć nadzieję, że nikt się nie kapnie.

 

Społeczeństwo jak wafel

Zarówno w tym, jak i w 1995 roku można by pomyśleć, że oto społeczeństwo pękło nam na pół jak wafel, niedziwne, jest podobnie kruche i niejednolite. Niemniej nie tylko u nas głosy rozkładają się czasem zadziwiająco symetrycznie. Na przykład w 2011 roku wybory federalne w Szwajcarii skończyły się niemiło dla dwójki kandydatów – Marca Romano i Monici Duca – bo  każde z nich otrzymało po 23 979 głosów. I dajcie spokój, to potem człowiek do końca życia żałuje, że w dzieciństwie zjadł bratu cały słoik nutelli i podmienił na błoto dla niepoznaki, bo wiele lat później to mógł być ten jeden decydujący głos, którego zabrakło. A jak zabrakło to sprawę trzeba było rozstrzygnąć inaczej, to jest poprzez losowanie. Niestety nie wiem, czy Szwajcarzy załatwili sobie własną komisję gier i zakładów, czy też musieli wypożyczyć jedną z Polsatu.

Kolejny przykład: wybory powszechne na wyspie Niue. Jest to dość niewielka wyspa na Oceanie Spokojnym, czyli to z jednej strony fajnie, bo nie ma kolejek do głosowania, a z drugiej strony kłopot, bo jak ktoś ma brzydkie zdjęcie w dowodzie, to cała wyspa się z niego śmieje. Niemniej w 2014 roku śmiali się krótko, bo szybko napotkali na podobny problem jak ich koledzy Szwajcarzy, co oznacza, że dwójka kandydatów dostała równo po 10 głosów. Ostatecznie nazwiska obu kandydatów wrzucono do czapki i w ten sposób wylosowano zwycięzcę. Tutaj możemy z dużą dozą prawdopodobieństwa założyć, że wszystko odbywało się bez udziału naszej rodzimej komisji, no bo nikt ich nie chciał wpuścić na wyspę na paszport Polsatu. A teraz ciekawostka! Sześć lat później wyborcy wyspy znowu obrzucili równą liczbą głosów dwójkę kandydatów. Tym razem zwycięzca został wybrany poprzez rzut monetą. Nie wiadomo dlaczego, widocznie tym razem nikt nie przyszedł w czapce.

Zresztą w trakcie wyborów w stanie Missisipi w 2015 roku też nie, bo jak kandydaci otrzymali po równe 4589 głosów, to ostatecznie wygrał ten, który wyciągnął dłuższą słomkę. I widzicie, ja Wam o tym mówię, bo chcę zwrócić Waszą uwagę na jedną bardzo ważną rzecz – jeśli myślicie o karierze politycznej dla Waszych dzieci, to w zakresie ich edukacji powinniście zdecydowanie postawić na umiejętność gry w papier-nożyce-kamień, a do szkoły robić im kanapki z kuponami lotto zamiast sałaty.

Takich przykładów podzielonych wyborów jest znacznie więcej i być może jest to dla nas dobra wiadomość, to znaczy – to nie jest tak, że tylko my rozpadliśmy się na pół jak biszkopt zbyt wcześnie wyjęty z piekarnika, w innych społeczeństwach to też się przecież zdarza. Martwi mnie jedynie tylko, że my niekoniecznie uczymy się na własnych błędach.

Wiecie, nikt kto mnie czyta nie może mieć jakichkolwiek wątpliwości, przy którym nazwisku ja postawiłam krzyżyk i jaki wynik by mnie ucieszył. Niemniej nie tylko samemu wynikowi przypatrywałam się uważnie. Miałam nadzieję na konkretnego zwycięzcę, ale również – na konkretne reakcje. „Konkretne” czyli: nie takie, jak zawsze. Kiedy to nagle okazuje się, że nasz szacunek do drugiego człowieka zależy od tego, czy ma poglądy skserowane od naszych.

 

Baba od pługa? Niech zdycha

Rolnicy, mieszkańcy wsi i małych miasteczek, ludzie z wykształceniem podstawowym i ci powyżej 65 roku życia – to grupy społeczne, które w zdecydowanej większości głosowały za Andrzejem Dudą. No i wiecie, zawsze znajdzie jakiś fanatyk, który uzna, że mieli do tego prawo. Ale wiecie do czego cała reszta miała prawo? By się wypowiedzieć.

„Oto mamy demokrację. Zawsze powtarzałam, że to jest nienormalne i chore, żeby taki sam głos należał do zapijaczonego menela, baby od pługa, która nie bardzo potrafi czytać i do Olgi Tokarczuk” – pisze Elżbieta. Elżbieta ma wyższe wykształcenie pedagogiczne (!), trójkę dzieci i niezwykłą umiejętność stawiania znaku równości pomiędzy kategorią socjodemograficzną „mieszkaniec wsi” i „babą od pługa, która nie potrafi czytać”. O ludziach z wykształceniem podstawowym to nawet nie wspominam, bo wiadomo, że ci to mogli w życiu zostać jedynie „zapijaczonym menelem”.

Ewentualnie – jak stwierdza Anonimowy Internauta – „niewykształconym prostakiem”.

Babą od pługa. Menelem. Prostakiem.

A przecież problem ten można by łatwo rozwiązać – wystarczyłoby, byśmy w końcu przyjęli do wiadomości, że niektórzy nie powinni mieć prawa, by decydować, na przykład jeśli zdarzyło im się potrzebować pomocy. Nie rozumiecie? Otóż oto wytłumaczy Wam to Filip12345:

„Każdy, kto otrzymuje lub otrzymywał od państwa świadczenia socjalne powinien zostać pozbawiony prawa głosu. Czyli beneficjenci 500+ nie głosują, klienci MOPS nie głosują, emeryci i renciści nie głosują. Za to głosują ci, którzy zasłużyli”.

Zasłużyli.

Zasłużyć można na przykład poprzez skończenie odpowiednich szkół, no bo – jak tłumaczy nam kolejny internauta – „jak bez wykształcenia, to znaczy że smród i patologia”.

No i jeszcze mój ulubiony zryw społeczny – „nie kupuję u polskiego rolnika”. Serio, weźcie sobie wyobraźcie, że ci głupi rolnicy to myśleli, że mogą głosować tak, jak chcą, w zgodzie z własnymi poglądami!!! No i co? Chcieli głosować tak, jak głosowali, to teraz pani Sabina im wyjaśni:

„Mam to samo postanowienie: nie kupuję produktów od polskich rolników. Niech zdychają”.

Niech zdychają.

Rolnicy, mieszkańcy wsi i małych miasteczek, ludzie z wykształceniem podstawowym i ci powyżej 65 roku życia. Szkoda, że to wiejska patologia, która nie umie czytać, bo tym samym nigdy się nie dowiedzą prawdy o sobie wybazgranej w internecie. I teraz tak – ja rozumiem, że to ich błąd, sami się prosili, kto to widział, by w demokratycznym kraju ludzie głosowali tak, jak chcą, a nie tak, jak my uważamy za słuszne.

Wiem, że ja ciągle o tym mówię – w TEDxach, wywiadach, swojej książce. Ale powtórzę raz jeszcze:

Nie możemy jednocześnie kogoś obrażać i dziwić się, że nie chce nas słuchać

Serio, ktoś mógłby pomyśleć, że właśnie o to chodzi w demokracji – że każdy powyżej osiemnastego roku życia może głosować w zgodzie ze swoimi przekonaniami i opiniami, bez konieczności pytania połowy internetu o zgodę. Znaczy – tej lepszej połowy. Złożonej z młodych, zamożnych, z wielkich ośrodków. A, no i wykształconych. Tyle egzaminów na studiach pozdawaliśmy, a co wybory oblewamy ten jeden kluczowy – z obywatelskiej dojrzałości i zwykłej ludzkiej przyzwoitości.

***
Hej, czy wiesz, że napisałam książkę? Jest o tym, jak piękniej myśleć i jak wyciągać wnioski na temat otaczającego nas świata oparte na wiedzy, faktach i badaniach naukowych, a nie na stereotypach, własnych uprzedzeniach i wzajemnej pogardzie.

TO NIE JEST PODRĘCZNIK DO STATYSTYKI, to jest książka popularnonaukowa o tym, że statystyka jest wspaniała. I – w moim zamyśle – takie książkowe narzędzie, dzięki któremu można się nauczyć, jak weryfikować informacje, gazetowe nagłówki, doniesienia amerykańskich naukowców. Słowem – jak nie dać się oszukać mediom, wykresom i danym. Tutaj możecie ją kupić, tylko dziś w promocji za 19,99zł: KUP  JA!!!