Regresja logistyczna - problem zmiennej

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
wildkid
Użytkownik
Użytkownik
Posty: 2
Rejestracja: 17 mar 2015, o 11:44
Płeć: Kobieta
Lokalizacja: warszawa

Regresja logistyczna - problem zmiennej

Post autor: wildkid »

Hej,

słuchajcie buduje model regresji logistycznej i mam problem z doborem zmiennych opisujących. O co chodzi... Przed zbudowaniem modelu sprawdziłam współczynniki korelacji moich zmiennych i niestety jedna, która intuicyjnie powinna silnie wpływać wpływa nieznacznie i jest nie istotna na poziomie istotności alfa=0,5 (p-value pearson 0,0938). Zatem po obniżeniu poziomu istotności wpada mi do modelu.
Mimo to wrzuciłam ją do modelu i w całym modelu jest ona istotna, istotnie wpływa na model, co więcej model z tą zmienną w porównaniu z takim, który jej nie zawiera ma lepszą ocenę: wyższe R2, niższe kryterium Akaike i większe pole pod wykresem ROC.
I co teraz?
Wstępna selekcja zmiennych każe zmienną odrzucić na poziomie istotności 95%, natomiast zmienna znacznie poprawia ocenę modelu. Jestem trochę zagubiona, nie wiem co powinno być dla mnie ważniejsze, czy mogę dowolnie obniżyć poziom istotności - po prostu poszukuje najbardziej optymalnego rozwiązania. Czym mam sie kierować?

Bardzo proszę o pomoc
miodzio1988

Regresja logistyczna - problem zmiennej

Post autor: miodzio1988 »

Porównaj te dwa modele ( bez zmiennej i z zmienną) i zobacz czy są statystycznie takie same

Jeśli pracujesz w pakiecie R to funkcja anova() się kłania

Coś na tej zasadzie:

wildkid
Użytkownik
Użytkownik
Posty: 2
Rejestracja: 17 mar 2015, o 11:44
Płeć: Kobieta
Lokalizacja: warszawa

Regresja logistyczna - problem zmiennej

Post autor: wildkid »

Dzięki za podpowiedź. Pracuje na innym pakiecie. Tak jak napisałam model z tą zmienną ma lepsze wyniki: wyższe R2, niższe kryterium Akaike, -2 log L i większe pole pod wykresem ROC, niż model bez zmiennej. Jedynie statystyki dewiancji i reszty Pearsona sugerują odrzucenie hipotezy o dobrym dopasowaniu modelu. Czy zatem model z tą zmienną mam uważać za lepszy, czy gorszy? Które statystyki powinny być dla mnie najważniejsze?

Chodzi mi o to, czy mogę w opisie badania napisać, że pomimo iż wstępna selekcja (korelacja) wskazuje, że zmienną objaśniającą powinno się odrzucić, bo jej istotność p=0,0938 (p>alfa), to mimo wszystko dana poprawia jakość modelu? Czy moze powinnam to inaczej interpretować?-- 18 mar 2015, o 18:25 --Hej,

czy ktoś jest w stanie mi podpowiedzieć? Będę bardzo wdzięczna.
ODPOWIEDZ