Trzy typy przedziałów ufności i ich interpreatacja

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
janusz47
Użytkownik
Użytkownik
Posty: 7910
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1670 razy

Trzy typy przedziałów ufności i ich interpreatacja

Post autor: janusz47 »

Zadanie 1
Operator telefonii komórkowej chce oszacować długość rozmów międzynarodowych w czasie weekendu.
Z losowej próby \(\displaystyle{ n = 120}\) rozmów otrzymano średni czas rozmowy \(\displaystyle{ \oveline{T}_{120} = 20,5 min.}\), przy odchyleniu standardowym \(\displaystyle{ S_{120} = 10,5 min.}\)
Proszę oszacować metodą przedziałową \(\displaystyle{ p = 0,95}\) przeciętny czas rozmów \(\displaystyle{ \overline{t}}\) międzynarodowych w weekendy.

Jest to przykład zadania na dwustronny przedział ufności, gdy rozkład badanej cechy - średniego czasu rozmów międzynarodowych w weekendy jest nieznany - i próba losowa jest duża.

\(\displaystyle{ Pr \left(\overline{T}_{120} - \frac{S_{120}\cdot u_{0,05}}{\sqrt{n}}\leq \overline{t} \leq \overline{T}_{120} + \frac{S_{120}\cdot u_{0,05}}{\sqrt{n}}\right) = 1- 0,05 = 0,95 \ \ (1)}\)

Kwantyl \(\displaystyle{ u_{0,05}}\) znajdujemy z tablicy dystrybuanty rozkładu \(\displaystyle{ \mathcal{N}(0,1)}\) lub programu komputerowego na przykład \(\displaystyle{ R.}\)

\(\displaystyle{ \phi(u_{0,05}) = 1 -\frac{0,05}{2} = 0,975.}\)

Program R

Kod: Zaznacz cały

> u005 = qnorm(0.975)
> u005
[1] 1.959964
\(\displaystyle{ u_{0,05} \approx 1,96 \ \ (2)}\)

Po podstawieniu danych liczbowych do \(\displaystyle{ (1), (2)}\) otrzymujemy przedział ufności o końcach: lewym \(\displaystyle{ L}\) i prawym \(\displaystyle{ P}\)

Program R

Kod: Zaznacz cały

> L = 20.5 - (10.8*1.96)/sqrt(120)
> L
[1] 18.56763
> P = 20.5 + (10.8*1.96)/sqrt(120)
> P
[1] 22.43237
\(\displaystyle{ Pr( 18,6 \leq \overline{t}\leq 22, 4 )min. =0,95.}\)

Interpretacja otrzymanego przedziału ufności

Z prawdopodobieństwem \(\displaystyle{ 0,95}\) należy oczekiwać, że przedział o końcach \(\displaystyle{ 18,6 min., 22,4 min.}\) należy do podzbioru tych przedziałów ufności, które pokryją średni czas rozmów międzynarodowych w weekendy pewnego operatora, a nie tylko jego próby losowej \(\displaystyle{ 120}\) rozmów.

Zadanie 2
W celu oszacowania dokładności pewnego urządzenia pomiarowego dokonano nim \(\displaystyle{ 5}\) niezależnych pomiarów długości pewnego odcinka i otrzymano wyniki w milimetrach:

Tabela
\(\displaystyle{ \begin{tabular}{|c|c|c|c|c|c|} \hline
nr. pomiaru & 1 & 2 & 3 & 4 & 5 \\ \hline
wynik [mm] & 15,15 &15,20 & 15,04 & 15,14 & 15,22 \\ \hline
\end{tabular}}\)


Przyjmując współczynnik ufności \(\displaystyle{ p = 0,95}\) proszę zbudować przedział ufności dla odchylenia standardowego tym przyrządem.

Dwustronny przedział ufności dla odchylenia standardowego:

\(\displaystyle{ Pr\left( \sqrt{n\cdot \frac{S^2_{n}}{u_{2}}}\leq \sigma \leq \sqrt{n\cdot \frac{S^2_{n}}{u_{1}} \right) \ \ (1)}\)

Kwantyle \(\displaystyle{ u_{1}. u_{2}}\) obliczamy z tablicy rozkładu \(\displaystyle{ \chi^2}\) albo programu \(\displaystyle{ R:}\)

\(\displaystyle{ Pr( Y_{n-1}\geq u_{1}) = \frac{\alpha}{2}}\)

\(\displaystyle{ Pr(Y_{n-1}\geq u_{2} = 1 - \frac{\alpha}{2}.}\)

Na podstawie danych w tabeli obliczamy wariancję z próby:
Wykorzystamy programem \(\displaystyle{ R.}\)

Program R

Kod: Zaznacz cały

> pomiary = c(15.15,15.20,15.04,15,14,15.22)
> var(pomiary)
[1] 0.21743
\(\displaystyle{ S^2_{5} \approx 0,22 \ \ mm^2 \ \ (2)}\)

Kwantyle rozkładu \(\displaystyle{ \chi^2}\) rzędu odpowiednio \(\displaystyle{ 0,025, \ \ 0,975}\) z \(\displaystyle{ 5-1 = 4}\) stopniami swobody:

Program R

Kod: Zaznacz cały

> u1 = qchisq(0.025, 4)
> u1
[1] 0.4844186
> u2 = qchisq(0.975, 4)
> u2
[1] 11.14329

\(\displaystyle{ u_{1}\approx 0,48, \ \ u_{2}= 11,14 \ \ (3)}\)

Po podstawieniu danych liczbowych \(\displaystyle{ (2), (3)}\) do \(\displaystyle{ (1)}\) otrzymujemy przedział ufności dla odchylenia standardowego:

Program R

Kod: Zaznacz cały

> Q1= sqrt(5*0.22/11.14)
> Q1
[1] 0.3142344
> Q2= sqrt(5*0.22/0.48)
> Q2
[1] 1.513825
\(\displaystyle{ Pr( 0,31 \leq \sigma \leq 1,51) mm = 0,95.}\)

Interpretacja otrzymanego przedziału ufności

Z prawdopodobieństwem \(\displaystyle{ 0,95}\) należy oczekiwać, że przedział ufności o końcach \(\displaystyle{ 0,31 mm, 1, 51 mm}\) należy do podzbioeu tych przedziałów ufności które pokryją odchylenie standardowe pewnego przyrządu pomiarowego a nie tylko jego \(\displaystyle{ 5}\) pomiarów.

Zadanie 3
Wiadomo, że wydajność pracy podlega rozkładowi normalnemu. Próba \(\displaystyle{ 26}\) pracowników dała średnią arytmetyczną wydajności \(\displaystyle{ 27}\) sztuk na jedneo pracownika oraz odchylenie standardowe \(\displaystyle{ 4}\) sztuki.
Przyjmując współczynnik ufności \(\displaystyle{ p = 0,90}\), proszę zbudować przedział ufności dla przeciętnej wydajności pracy wszystkich pracowników tego zakładu.

Dwustronny przedział ufności, gdy badana cecha ma rozkład normalny- znany, nieznane jest jej odchylenie standardowe.

\(\displaystyle{ Pr\left( \overline{X}_{n} -\frac{S_{n}\cdot t_{\alpha}}{\sqrt{n-1}} \leq m \leq \overline{X}_{n} +\frac{S_{n}\cdot t_{\alpha}}{\sqrt{n-1}}\right) = 0,90 \ \ (1)}\)

Kwantyl rzędu \(\displaystyle{ u_{\alpha} = u_{0,10}}\) znajdujemy z tablicy rozkaładu Studenta z \(\displaystyle{ n-1 = 26-1 = 25}\) stopniami swobody

Program R

Kod: Zaznacz cały

> t010 = qt(0.90, 25)
> t010
[1] 1.316345
\(\displaystyle{ t_{0,10} \approx 1,32 \ \ ( 2)}\)

Podstawiając (2) i dane liczbowe wynikające z treści zadania do (1), otrzymujemy przedział ufności dla średniej wydajności pracowników pewnego zakładu

Program R

Kod: Zaznacz cały

 W1 = 27 - 4*1.32/sqrt(25)
> W1
[1] 25.944
> W2 = 27 + 4*1.32/sqrt(25)
> W2
[1] 28.056
\(\displaystyle{ Pr( 26 szt. \leq m \leq 28 szt.) = 0,90.}\)

Interpretacja otrzymanego przedziału ufności
.

Z prawdopodobieństwem \(\displaystyle{ 0.90}\) można oczekiwać, że przedział \(\displaystyle{ [ 26, 28 ]}\) sztuk pewnego wyrobu, przypadającego na jednego pracownika należy do tych przedziałów ufności, które pokryją średnią wydajność pracowników, a nie tylko \(\displaystyle{ 26}\) elementowej ich próby.

Względna dokładność tego oszacowania wynosi \(\displaystyle{ \delta_{\overline{X}} = \frac{\frac{28-26}{2}}{27}\cdot 100 \% \approx 3,7\%.}\)
mikos02
Użytkownik
Użytkownik
Posty: 24
Rejestracja: 27 cze 2015, o 18:25
Płeć: Mężczyzna
Lokalizacja: Kutno
Pomógł: 6 razy

Trzy typy przedziałów ufności i ich interpreatacja

Post autor: mikos02 »

Może warto uzupełnić, że obliczenia przedziału ufności dla wariancji/odchylenia standardowego można uzyskać z wykorzystaniem rozkładu normalnego.

błąd standardowy wariancji:

Kod: Zaznacz cały

c <- c(15.15,15.20,15.04,15.14,15.22)
z <- (c-mean(c))**2
sqrt(var(z)/n)
[1] 0.002234368
... 09-015.pdf

Krótsze przedziały:

Kod: Zaznacz cały

qnorm(c(0.025,0.975),var(c),asympTest::seVar(c))**0.5
[1] 0.02281928 0.09632902
bootstrap:

Kod: Zaznacz cały

m <- replicate(10000,sd(sample(c,length(c),TRUE)))
quantile(m,c(0.025,0.975))
      2.5%      97.5% 
0.02236068 0.09165151 
Tak na marginesie,
w zadaniu nr 1 odchylenie standardowe jest równe 10.5 a w kodzie R-a 10.8.
ODPOWIEDZ