Cześć wszystkim.
Zarejestrowałem się tu, bo jestem zdumiony tym, co mi przed chwilą wyszło z obliczeń.
Liczyłem sobie skuteczność szczepień w zapobieganiu zgonom na COVIDa na podstawie spreparowanych (troszkę) danych. I to co uzyskałem przerasta moje zdolności poznawcze. Może ktoś bardziej kumaty mógłby mi to wyjaśnić?
Wymyśliłem sobie takie dane:
Ogólna populacja to 39 milionów ludzi, z czego:
- w wieku do 80 lat: 34 miliony ludzi,
- w wieku powyżej 80 lat: 5 milionów ludzi.
W grupie do 80 lat odsetek szczepień wynosi 50% (a więc 17 mln niezaszczepionych i 17 mln zaszczepionych).
W grupie powyżej 80 lat odsetek szczepień wynosi 90% (a więc 0,5 mln niezaszczepionych i 4,5 mln zaszczepionych).
W grupie do 80 lat zmarło 1700 osób niezaszczepionych i 85 osób zaszczepionych.
W grupie powyżej 80 lat zmarło 500 osób niezaszczepionych i 900 osób zaszczepionych.
W przeliczeniu na milion osób wychodzi:
W grupie do 80 lat:
- wśród niezaszczepionych 1700/17 = 100 zgonów na milion osób
- wśród zaszczepionych 85/17 = 5 zgonów na milion osób.
W grupie powyżej 80 lat:
- wśród niezaszczepionych 500/0,5 = 1000 zgonów na milion osób
- wśród zaszczepionych 900/4,5 = 200 zgonów na milion osób.
Mogę z tego wywnioskować, że ryzyko śmierci dzięki szczepieniu spada:
- w grupie do 80 lat 100/5 = 20 razy
- w grupie powyżej 80 lat 1000/200 = 5 razy.
Tak to wygląda w tych dwóch grupach.
Jednak gdy policzę to w całej populacji, to mam:
- wśród niezaszczepionych zmarło 1700+500 = 2200 osób
- wśród zaszczepionych zmarło 85+900 = 985 osób
A więc:
- wśród niezaszczepionych było 2200/17,5 = 126 zgonów na milion osób
- wśród zaszczepionych było 985/21,5 = 46 zgonów na milion osób.
A więc ryzyko śmierci w ogólnej populacji dzięki szczepieniu spada 126/46 = 2,7 razy.
Jak to jest możliwe, że w ogólnej populacji skuteczność szczepienia jest mniejsza niż w którejkolwiek z grup osobno?
Gdy podzieliliśmy populację na dwie grupy, to w jednej grupie wyszła skuteczność 20 razy, a w drugiej 5 razy.
A gdy bierzemy pod uwagę całą populację, to skuteczność wynosi tylko 2,7 razy.
Jak to jest możliwe? Ja intuicyjnie spodziewałem się jakiejś wartości pomiędzy 5 a 20. A tu wyszła wartość mniejsza niż wartość w którejkolwiek z grup składowych. Jak to jest możliwe???
Paradoks - pytanie laika
-
- Użytkownik
- Posty: 4
- Rejestracja: 4 gru 2021, o 18:15
- Płeć: Mężczyzna
- wiek: 0
- kmarciniak1
- Użytkownik
- Posty: 809
- Rejestracja: 14 lis 2014, o 19:37
- Płeć: Mężczyzna
- Podziękował: 48 razy
- Pomógł: 183 razy
-
- Użytkownik
- Posty: 4
- Rejestracja: 4 gru 2021, o 18:15
- Płeć: Mężczyzna
- wiek: 0
Re: Paradoks - pytanie laika
Dzięki. Zerknę na to.
Dodano po 14 godzinach 1 minucie 34 sekundach:
Czyli tak naprawdę licząc skuteczność ogólną ja nie porównałem niezaszczepionych z zaszczepionymi, tylko młodych ze starymi. Teraz wszystko jasne. Dzięki.
Tak to jest, jak za analizę danych statystycznych biorą się dziennikarze
Dodano po 14 godzinach 1 minucie 34 sekundach:
Czyli tak naprawdę licząc skuteczność ogólną ja nie porównałem niezaszczepionych z zaszczepionymi, tylko młodych ze starymi. Teraz wszystko jasne. Dzięki.
Tak to jest, jak za analizę danych statystycznych biorą się dziennikarze
- kmarciniak1
- Użytkownik
- Posty: 809
- Rejestracja: 14 lis 2014, o 19:37
- Płeć: Mężczyzna
- Podziękował: 48 razy
- Pomógł: 183 razy
Re: Paradoks - pytanie laika
No ogólnie to właśnie paradoks Simpsona zwraca uwagę na to że trzeba być bardzo ostrożnym gdy się przekłada jakąś analizę z jednej grupy osób na inną najczęściej liczniejszą grupę. W tym linku jest to bardzo przystępnie opisane :
Kod: Zaznacz cały
https://www.statystyczny.pl/paradoks-simpsona-o-dyskryminacji-kobiet-kamicy-nerkowej-i-bezrobociu/