Centralne Twierdzenie graniczne

Definicja klasyczna. Prawdopodobieństwo warunkowe i całkowite. Zmienne losowe i ich parametry. Niezależność. Prawa wielkich liczb oraz centralne twierdzenia graniczne i ich zastosowania.
kakusia18
Użytkownik
Użytkownik
Posty: 58
Rejestracja: 28 paź 2012, o 16:55
Płeć: Kobieta
Lokalizacja: Kraków
Pomógł: 1 raz

Centralne Twierdzenie graniczne

Post autor: kakusia18 »

Mam pewne zadnie z CTG, mniej więcej wiem jak się używa tego tw , jednak czytając to zadanie mam problem z "podstawieniem odpowiednich danych". Bardzo proszę o pomoc. Dziękuje.
treść zadania:
Do badania majęcego określić skuteczność nowej szczepionki na grypę przystapiło 98 osób. Ochotników podzielono na dwie grupy, połowie z nich podano placebo, a pozostałym - aktywną szczepionkę. W ciągu roku w grupie , która otrzymała placebo, na grypę zachorowało 20% osób ( można przyjąć tę liczbę jako prawdopodobieństwo zachorowania). Natomiast w grupie, której zaaplikowano testową szczepionkę, zachorowało tylko 10 %. Załóżmy ze skuteczność szczepionki jest taka sama jak placebo( to tzw. hipoteza zerowa). Jakie jest wówczas prawdopodobieństwo , ze wśród osób zaszczepionych zachorowalność bedzie nie większa niż 10%? ( Oszacuj na podstawie CTG, do dwóch miejsc po przecinku)
thom
Użytkownik
Użytkownik
Posty: 61
Rejestracja: 31 sie 2013, o 00:27
Płeć: Mężczyzna
Lokalizacja: Polska
Pomógł: 25 razy

Centralne Twierdzenie graniczne

Post autor: thom »

Mówiąc w języku statystycznym, pytamy o poziom istotności testu weryfikującego hipotezę \(\displaystyle{ H_0\colon \text{szczepionka nie ma wpływu na ryzyko zachorowania}}\) wobec hipotezy \(\displaystyle{ H_1\colon\text{szczepionka ma wpływ na ryzyko zachorowania}}\), w którym to teście umawiamy się, że odrzucamy \(\displaystyle{ H_0}\), gdy poziom zachorowania w grupie zaszczepionej wyniesie co najwyżej 10%. Szukamy bowiem prawdopodobieństwa odrzucenia hipotezy \(\displaystyle{ H_0}\) w przypadku, gdy jest prawdziwa, a zatem - właśnie prawdopodobieństwa błędu pierwszego rodzaju.

Niech \(\displaystyle{ X}\) będzie zmienną losową o rozkładzie dwupunktowym \(\displaystyle{ \mathbb{P}(X=1)=p:=0.2}\) (zachorowanie), \(\displaystyle{ \mathbb{P}(X=0)=q:=0.8}\) (brak zachorowania), \(\displaystyle{ X_1,\ldots,X_n}\) będą niezależnymi realizacjami zmiennej \(\displaystyle{ X}\) (pacjenci), przy czym u nas \(\displaystyle{ n=49}\). Mamy oczywiście \(\displaystyle{ \mu:=\mathbb{E}X=0.2}\) oraz \(\displaystyle{ \sigma^2:=\mathbb{D}^2X=0.16}\). To, o co pytamy, to liczba

\(\displaystyle{ a:=\mathbb{P}\left(X_1+\ldots+X_n\leq\frac{1}{10}n\right)}\).

Na mocy CTG zachodzi zbieżność według rozkładu:

\(\displaystyle{ \frac{X_1+\ldots+X_n-n\mu}{\sqrt{n\sigma^2}}\xrightarrow[n\to\infty]{D}\mathcal{N}(0,1),}\)

jeżeli więc liczność próby \(\displaystyle{ n}\) jest odpowiednio duża, to możemy przyjąć, że zestandaryzowana zmienna po lewej stronie ma w istocie rozkład \(\displaystyle{ \mathcal{N}(0,1)}\). W konsekwencji

\(\displaystyle{ a=\mathbb{P}\left(\frac{X_1+\ldots+X_n-n\mu}{\sqrt{n\sigma^2}}\leq\frac{n\left(\frac{1}{10}-\mu\right)}{\sqrt{n\sigma^2}}\right)\cong\Phi\left(\frac{n\left(\frac{1}{10}-\mu\right)}{\sqrt{n\sigma^2}}\right),}\)

gdzie \(\displaystyle{ \Phi}\) jest oczywiście dystrybuantą rozkładu \(\displaystyle{ \mathcal{N}(0,1)}\).

Jeżeli zaś nie zadowala nas stwierdzenie typu "skoro \(\displaystyle{ n}\) jest duże, możemy zastąpić rozkład odpowiedniej standaryzacji rozkładem normalnym", to powinniśmy skorzystać z dokładnych oszacowań błędu w CTG, na przykład z twierdzenia Berry'ego-Esséena (zob. str. 212 w książce J. Jakubowskiego i R. Sztencla). Błąd powyższego oszacowania liczby \(\displaystyle{ a}\) (mamy tu do czynienia ze schematem Bernoulliego) nie przekracza \(\displaystyle{ C(p^2+q^2)/\sqrt{npq}}\) dla pewnej stałej \(\displaystyle{ C\in [1/\sqrt{2\pi},0.8]}\).
ODPOWIEDZ