Statystyk Damian umiłowany w modżajto i wizualizacja danych

Najgorzej to jest wtedy, kiedy statystyk Damian przychodzi do roboty i wciąż ma zdecydowanie zbyt niski poziom krwi w alkoholu po tym, jak poniosła go alkoholowa chłosta z okazji Barbórki, co by nawet nie było takie dziwne, gdyby nie to, że ta Barbórka to była trzy miesiące wcześniej. No i on przychodzi, a tam go kolega spotyka i mówi mu, że na takiej bani to na bank mu się nie uda narysować żadnego wykresu, a on mówi, że jemu się nie uda??!? On nie da rady?!!?!?!? POTRZYMAJ MI EXCELA!!!!

I właśnie w ten sposób, moje drogie dzieci, powstało to małe statystyczne dzieło sztuki, które kosztowało mnie trzy zawały serca i trzydzieści telefonów na policję, choć oni wciąż twierdzą, że nie, pani Janino, nie możemy zamknąć kogoś w więzieniu za to, że za pomocą wykresu dokonał aktu wandalizmu na zdrowym rozsądku. Popatrzcie na grafikę poniżej – to są te same dane, ale dwa różne wykresy – u góry widzimy ten autorstwa TVP, a na dole ten, który narysowałam ja z drobną pomocą PRZYZWOITOŚCI.

Bo pamiętajcie, że wykresy słupkowe są naszymi najlepszymi przyjaciółmi, ale gdy ich skala nie zaczyna się od 0, to bardzo pięknie zakłamują rzeczywistość i to często w brutalny sposób. Jak w przykładzie poniżej:

O osi X naszego rodzimego wykresu z TVP to już nawet nie wspominam, bo tam co prawda coś poszło nie tak z datami, rok 2014, 2015, 2016, JEB! 2020, ale dobra tam, kogo nigdy nie poniosło sylwestrowe elo melo w taki sposób, że obudził się dopiero trzy lata później, niech pierwszy rzuci „wściekłym psem”.

Edward Tufte, wspaniały ekspert wizualizacji danych do opisu takich sytuacji stworzył pojęcie współczynnika kłamstwa (ang. Lie Factor). Jest to stosunek efektu widocznego na wykresie do efektu wykazywanego przez dane, na podstawie których ten graf narysowaliśmy. Po ludzku: jak widzicie na wykresie u góry (to ten narysowany przez statystyka Damiana) różnice pomiędzy poszczególnymi latami są jakieś oszałamiające. Na dolnym wykresie (to mój!) wyglądają trochę mniej spektakularnie. Cudna manipulacja. W programie “Jak oni rysują (wykresy)” nawet Beata Tyszkiewicz przyznałaby autorom jeden punkt.

Uważajcie więc na zdradliwe osie i znikające słupki, bo niestety w świecie statystyk manipulacje notorycznie czają się na nas niczym wąż w pomidorach. A to człowiek nie ma czasu ciągle składać wyjaśnień na policji jako świadek morderstwa na zdrowym rozsądku.  Wszak koty leżące na szklanych stolikach same się nie obejrzą.

Źródło: boredpanda.com

A jeśli chcecie poczytać więcej o wizualizacji danych i dowiedzieć się dlaczego wykres kołowy to fiat multipla statystyki i w jaki sposób nie trafić do statystycznego piekła, to mam dla Was gratkę, zniżkę na moją książkę o statystyce, co ja ją napisałam, a ty KUP JĄ!!!

Książkę “Statystycznie rzecz biorąc. Czyli ile trzeba zjeść czekolady, żeby dostać Nobla” kupicie taniej o 43% (a więc za trochę ponad dwie dyszki) o tu: https://cutt.ly/wnYlBH5

7 komentarzy

  1. koniarska

    14 czerwca 2021 o 11:23

    Od pierwszej sekundy w której pojęłam że ten wykres to kolejny dowód wprost na manipulację ludzkim pojęciem, przechodzącym ludzkie pojęcie czekałam na ten wpis. Czekałam, aż Janina weźmie na warsztat tę cuchnącą propagandę i z wrodzonym wdziękiem pokaże, że ten uśmiechnięty wykres jest jednak mocno bezzębny. No i jak zwykle nie zawiodłam się. Miłego Tygodnia Janino 🙂

    Odpowiedz
  2. fan Hansa Roslinga

    14 czerwca 2021 o 12:17

    Mnie nauczyli w szkole po pierwsze patrzeć na liczby, a nie wykresy (w podstawówce) oraz starać się dojść do tego co za tymi liczbami się kryje (w średniej). Zatem wykresy nie zrobiły na mnie wrażenia skoro są podane liczby. Brak lat 2017-19 da się wytłumaczyć chęcią zwężenia wykresu ale może to być też chęć ukrycia jakichś niekorzystnych zjawisk. Ogólnie, z wykresu wynika, że w latach 2009-15 udział wydatków publicznych na zdrowie w PKB nieznacznie zmalał, w latach 2016-21 dość znacznie wzrósł. Co odpowiada prawdzie. Inna sprawa czy taki wzrost jest zjawiskiem korzystnym. Bo jeżeli gdzieś się dokłada, to skądś trzeba zabrać. Skąd? Może od wdów i sierot. Po drugie, bez radykalnych reform te wydatki i tak zostaną w większości zmarnowane.

    Odpowiedz
  3. Weterani z Mysiej

    16 czerwca 2021 o 10:28

    Dziękujemy, miło widzieć, że są osoby, które doceniają naszą trudną pracę sprzed lat. W dodatku nie tylko słowem ale i czynem. I tak proszę trzymać. A nam nie było wcale łatwo, bo już w latach 80-tych musieliśmy, zaciskając zęby, przepuszczać to co na szczęście tutaj nie ma wstępu. Jako bardziej doświadczeni koledzy po fachu sugerowalibyśmy tylko więcej entuzjastycznych wpisów wspierających.

    Odpowiedz
  4. Klaudia Jaroszewska

    30 czerwca 2021 o 14:21

    Ależ to pięknie wygląda na wykresie, ale po analizie brak sensu. Dobrze, że jesteś, bo dzięki temu zaczęłam zwracać większą uwagę na takie szczegóły 🙂

    Odpowiedz
  5. Paweł Kuźma

    7 lipca 2021 o 11:03

    Moja żona czyta Twoją książkę na głos podczas naszych wycieczek samochodowych.
    Nie powiem.. ciekawa… nie chce się spać za kółkiem.. lepsza niż kawa 🙂
    Anegdoty z życia na uczelni i w małżeństwie – bezcenne…i takie prawdziwe.
    Kilka Twoich pomysłów i sugestii chętnie wykorzystam w pracy (prezentacje biznesowe).

    Zgadzam się, że “obcinanie” osi Y jest manipulacją. Niemniej czasami 1% zmian jest znaczące
    dla niektórych branż. Czy masz jakiś gotowy pomysł, jak można wizualizować tak małe zmiany?
    Nie skończyliśmy jeszcze Twojej książki … za spoiler nie obrażę się 🙂

    PS. Nie pracujemy dla rządu 🙂

    Pozdrawiam,

    Paweł

    Odpowiedz
  6. Aga

    14 listopada 2021 o 10:45

    Wykres na gorze jest po prostu bardziej czytelny dla przeciętnego zjadacza chleba i udowadnia to co oczywiste, ze wydatki wzrosną 🙂 Brakuje tylko informacji, ze o mikro % (np 2021 vs 2020 o całe szalone 0,3%), ze jest to naturalna tendencja, bo społeczeństwo się starzeje, usługi i sprzęt medyczny z roku na rok drożeją (np na skutek inflacji – oczywiście tej z winy Tuska ;)))… Ale to są drobiazgi.. 😉

    W sumie ten wykres w zasadzie nie pokazuje nic poza wykresem. Zaskakujących trendów tu człowiek nie wyśledzi.
    Miało być ładne tło do Wiadomości to było 🙂

    Odpowiedz
  7. Michał

    20 kwietnia 2023 o 16:28

    Dzięki za tą stronę i za pracę wymagającą zebrania tych przykładów, omówienia i pokazania poprawnej wizualizacji.
    Dziękuję za pojęcie “współczynnika kłamstwa” to ważne pojęcie w obecnych czasach .

    Przy okazji proszę sprawdzić bo chyba jedna z ilustracji zniknęła (pomiędzy słowami “Wszak koty leżące na szklanych stolikach same się nie obejrzą” a “Źródło: boredpanda.com”

    Odpowiedz

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *