Cześć Wszystkim,
Mam pytanie dotyczące wyliczania poziomu istotności. Spotkałem się niedawno z dwoma różnymi podejściami dotyczącymi liczenia poziomu istotności i przedziałów ufności, zastanawiam się który z nich jest poprawny, albo który jest mniej błędny, bo według mnie obydwa nie są idealne.
Dane: testujemy różnice średnich w dwóch niezależnych grupach. W tym celu wykorzystujemy test T Studenta.
Sposób pierwszy. Grupa pierwsza i druga zostaje przeważona przez przyjęte wagi. Wagi dla grupy pierwszej i drugiej różnią się. Po przeważeniu w grupie pierwszej mamy 40 razy więcej obserwacji. Możemy przyjąć N1(surowe) = 2000, N1(ważone) = 80 000. Po przeważeniu w grupie drugiej mamy trzy razy mniejszą liczebność. Możemy przyjąć N2(surowe) = 1000, N2 (ważone) = 300. Wszystkie parametry do obliczenia Testu T Studenta bierzemy z danych ważonych.
Sposób drugi. Średnie i odchylenia z grup brane są z uwzględnieniem wag (patrz wyżej), ale liczebności surowe. Ma to na celu ograniczenie wpływu rozszerzania i zwężania przedziału ufności pod wpływem ważenia. Do tego robiona jest korekta przedziału ufności uwzględniająca ważenie.
Dodam, że liczebności surowe nie odzwierciedlają udziałów grup w populacji.
Ktoś ma jakieś pomysły? Czy myślicie, że rozwiązanie polegające na zastosowaniu nowych wag uwzględniających udział grup w populacji będzie najlepszym rozwiązaniem?
Pozdrawiam,
Piotr