Weryfikacja hipotez dotyczących proporcji (wskaźników struktury)
Model dla jednej proporcji
Zmienna \(\displaystyle{ X}\) ma rozkład dwupunktowy, \(\displaystyle{ P(X=1)=p}\)
Hipoteza zerowa: \(\displaystyle{ H_0: \ p=p_0}\)
Statystyka testowa dla małej próby: \(\displaystyle{ \boxed{Z=2 \left( \arcsin \sqrt{\hat{p}} - \arcsin \sqrt{p_0} \right) \sqrt{n}}}\)
Statystyka testowa dla dużej próby: \(\displaystyle{ \boxed{Z=\frac{\hat{p} - p_0}{\sqrt{\frac{p_0 (1-p_0)}{n}}}}}\)
Hipotezy alternatywne oraz obszary krytyczne: \(\displaystyle{ \begin{tabular}{|c||c||c|} \hline
H_1: \ p \ne p_0 & H_1: \ p > p_0 & H_1: \ p < p_0 \\ \hline
\left(-\infty; -z_{1-\frac{\alpha}{2}}\right) \cup \left(z_{1-\frac{\alpha}{2}}; +\infty\right) & \left(z_{1-\alpha}; +\infty\right) & \left(-\infty; -z_{1-\alpha}\right) \\ \hline
\end{tabular}}\)
Przykład 1.1
Ukryta treść:
Rzucono 19 razy monetą otrzymując 7 orłów. Czy na poziomie istotności \(\displaystyle{ \alpha = 5\%}\) można stwierdzić, że moneta jest "uczciwa"?
Zastosuję test dla małej próby.
Dane: \(\displaystyle{ n=19 \\
\hat{p} = \frac{7}{19} \\
p_0 = \frac{1}{2} \\
\alpha = 0,05 \\}\)
Z odczytuję kwantyl dla \(\displaystyle{ \Phi=0,975}\). Obszar krytyczny: \(\displaystyle{ (-\infty ; -1,96) \cup (1,96; +\infty )}\)
Obliczam wartość statystyki testowej: \(\displaystyle{ Z = 2 \left( \arcsin \sqrt{\frac{7}{19}} - \arcsin \sqrt{\frac{1}{2}} \right) \sqrt{19} \approx -1,16}\)
Ponieważ wartość statystyki testowej nie należy do obszaru krytycznego, nie możemy odrzucić hipotezy zerowej. Kod programu R:
n <- 19
pdaszek <- 7/19
p0 <- 1/2
alfa <- 0.05
kwantyl <- qnorm(1-alfa/2)
Z <- 2*(asin(sqrt(pdaszek)) - asin(sqrt(p0)))*sqrt(n)
kwantyl
Z
ifelse(-kwantyl<Z & Z<kwantyl,'nie ma podstaw do odrzucenia H0','odrzucamy H0 na korzysc H1')
Przykład 1.2
Ukryta treść:
Na pewnej łące zebrano 248 osobników męskich szczawiu i 280 osobników żeńskich. Na poziomie ufności 95% sprawdź, czy liczba osobników żeńskich jest istotnie większa od liczby osobników męskich.
Wykonam test dla dużej próby. Badam proporcję osobników żeńskich do męskich, zatem zastosuję drugą hipotezę alternatywną.
Dane: \(\displaystyle{ n=528 \\
\hat{p} = \frac{280}{528} \\
p_0 = \frac{1}{2} \\
\alpha = 0,05 \\}\)
Z odczytuję kwantyl dla \(\displaystyle{ \Phi=0,95}\). Obszar krytyczny: \(\displaystyle{ (1,64; +\infty )}\)
Obliczam wartość statystyki testowej: \(\displaystyle{ Z = \frac{\frac{280}{528} - \frac{1}{2}}{\sqrt{\frac{\frac{280}{528}\left( 1 - \frac{280}{528}\right) }{528}}} \approx 1,39}\)
Ponieważ wartość statystyki testowej nie należy do obszaru krytycznego, nie możemy odrzucić hipotezy zerowej. Kod programu R:
n <- 528
pdaszek <- 280/528
p0 <- 1/2
alfa <- 0.05
kwantyl <- qnorm(1-alfa)
Z <- (pdaszek-p0)/sqrt((p0*(1-p0))/n)
kwantyl
Z
ifelse(Z<kwantyl,'nie ma podstaw do odrzucenia H0','odrzucamy H0 na korzysc H1')
Marek w pierwszej klasie liceum pisał 12 sprawdzianów z matematyki. Siedem z nich napisał na ocenę niedostateczną i musiał powtarzać klasę. W następnym roku nauczycielka przeprowadziła w kasie 10 sprawdzianów, a Marek napisał 3 z nich na ocenę niedostateczną. Czy Marek się czegoś nauczył? Przyjmij poziom ufności 90%.
Zastosuję test dla małej próby z drugą hipotezą jednostronną.
Dane: \(\displaystyle{ k_1=7 \\
n_1=12 \\
k_2=3 \\
n_2=10 \\
\Rightarrow \ \hat{p}_1 = \frac{7}{12} \\
\Rightarrow \ \hat{p}_2 = \frac{3}{10} \\
\Rightarrow \ n^* = \frac{120}{22} \\
\alpha = 0,1 \\}\)
Z tablicy rozkładu normalnego odczytuję kwantyl dla \(\displaystyle{ \Phi=0,9}\). Obszar krytyczny: \(\displaystyle{ (1,28; +\infty)}\)
Obliczam wartość statystyki testowej: \(\displaystyle{ Z = 2 \left( \arcsin \sqrt{\frac{7}{12}} - \arcsin \sqrt{\frac{3}{10}} \right) \sqrt{\frac{120}{22}} \approx 1,35}\)
Ponieważ wartość statystyki testowej należy do obszaru krytycznego, możemy odrzucić hipotezę zerową. Kod programu R:
k1 <- 7
n1 <- 12
k2 <- 3
n2 <- 10
pdaszek1 <- k1/n1
pdaszek2 <- k2/n2
ngwiazdka <- n1*n2/(n1+n2)
alfa <- 0.1
kwantyl <- qnorm(1-alfa)
Z <- 2*(asin(sqrt(pdaszek1)) - asin(sqrt(pdaszek2)))*sqrt(ngwiazdka)
kwantyl
Z
ifelse(Z<kwantyl,'nie ma podstaw do odrzucenia H0','odrzucamy H0 na korzysc H1')
Przykład 2.2
Ukryta treść:
Badamy, czy dwie szczepionki są równoważne. Po zaszczepieniu 132 osób szczepionką A, 86 z nich uzyskało odporność. Szczepienie 241 osób szczepionką B dało odporność 155 osobom. Czy szczepionki różnią się skutecznością? Przyjmij poziom istotności 4%.
Wykonam test dla dużej próby z pierwszą hipotezą alternatywną.
Dane: \(\displaystyle{ k_1=86 \\
n_1=132 \\
k_2=155 \\
n_2=241 \\
\Rightarrow \ \hat{p}_1 = \frac{86}{132} \\
\Rightarrow \ \hat{p}_2 = \frac{155}{241} \\
\Rightarrow \ p^* = \frac{241}{373} \\
\Rightarrow \ n^* = \frac{31812}{373} \\
\alpha = 0,4 \\}\)
Z tablicy rozkładu normalnego odczytuję kwantyl dla \(\displaystyle{ \Phi=0,98}\). Obszar krytyczny: \(\displaystyle{ (-\infty; -2,05) \cup (2,05; +\infty )}\)
Obliczam wartość statystyki testowej: \(\displaystyle{ Z = \frac{\frac{86}{132} - \frac{155}{241}}{\sqrt{\frac{\frac{241}{373}\left( 1 - \frac{241}{373}\right) }{\frac{31812}{373}}}} \approx 0,16}\)
Ponieważ wartość statystyki testowej nie należy do obszaru krytycznego, nie możemy odrzucić hipotezy zerowej. Kod programu R: