Obliczenie przedziału ufności

harryy1 · Post autor: **harryy1** » 18 cze 2012, o 01:19

Witam koledzy!
Mam pewien problem i niestety nie mam zbytnio czasu żeby szukać w internecie odpowiedzi na nurtujące mnie pytania, a nie posiadam żadnych wykładów ze studiów. Początkowo zacząłem nawet samemu szukać odpowiedzi, ale nie znalazłem nic konkretnego, a zajęło mi to sporo czasu. Od dawna nie miałem z tym do czynienia i nie ukrywam, że nie wiem dokładnie o co tutaj chodzi. Po prostu tego nie pamiętam. Proszę kolegów o pomoc, tzn. wytłumaczenie tego wszystkiego. Mam wiele zadań do rozwiązania, ale może zacznę od jednego, a być może jakoś mi to rozjaśni obraz tego wszystkiego. Poniżej jedno z zadań:

W wyniku 10 pomiarów zawartości białka w owocach pewnej rośliny otrzymano w procentach: 11,6; 10,1; 10,9; 11,2; 13,7; 15,6; 17,1; 14,2; 12,9; 11,2. Wyznaczyć:
a) wartość przeciętną(w procentach) zawartości białka,
b) wariancję i odchylenie standardowe zawartości białka dla danej próbki,
c) przedział ufności dla wartości przeciętnej na poziomie ufności 0,99 przy założeniu, że badana cecha ma rozkład normalny.

A więc co zrobiłem:
a)w tym wypadku będzie to po prostu średnia arytmetyczna(proszę mnie poprawić jeśli się mylę)
\(\displaystyle{ \overline{x}= \frac{1}{n} \sum_{i=1}^{n}x_{i}=12,85}\)

b) jeśli chodzi o wariancję i odchylenie standardowe to liczę to następująco:
Wariancja:
\(\displaystyle{ \sigma^2= \frac{1}{n} \sum_{i=1}^{n}(x_{i}-\overline{x})^2=4,6545}\)
Odchylenie standardowe:
\(\displaystyle{ \sigma=\sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_{i}-\overline{x})^2}=2,1574}\)

c)co do przedziału ufności to korzystam z następującego wzoru:
\(\displaystyle{ \overline{x}-u_{\alpha} \frac{\sigma}{\sqrt{n}}<m<\overline{x}+u_{\alpha}\frac{\sigma}{\sqrt{n}} \Rightarrow 11.0898<m<14.6101}\)

\(\displaystyle{ \overline{x}}\) - to jest moja średnia, którą wyliczyłem
\(\displaystyle{ \sigma}\) - to jest moje odchylenie standardowe
\(\displaystyle{ n}\) - to liczba próbek
\(\displaystyle{ u_{\alpha}}\) - wartość zmiennej losowej, która jest wzięta z tablicy rozkładu normalnego i tego właśnie nie rozumiem. Skąd to się wzięło? Jaką wartość powinienem przyjąć. Co prawda znalazłem pewną wskazówkę, która mówi, że dla mojego poziomu ufności powinno to być 2,58. Ale czemu? Jak korzysta się z tej tablicy. Rozumiem, że moich wartości powinienem szukać w kolumnie z wartością 0,01, bo \(\displaystyle{ 1-\alpha=1-0,99=0,01}\)? Wartości w tablicy są wyliczane z pewnego wzoru, w którym jest moje "u". Skąd je wziąć?
Może niepotrzebnie zawracam sobie tym głowe, ale chciałbym wiedzieć co by było jakby poziom ufności wynosił 0,95? Domyślam się, że to co piszę to są podstawy, ale naprawde od bardzo dawna tego nie robiłem. Więc proszę o pomoc.

scyth · Post autor: **scyth** » 18 cze 2012, o 09:12

Tablice statystyczne + jak z nich korzystać?

Ogólnie o przedziałach ufności:
Przedział ufności dla wskaźnika struktury (procentu)
Przedział ufności dla wariancji

Elvenpat · Post autor: **Elvenpat** » 18 cze 2012, o 22:14

Wartości \(\displaystyle{ u_{\alpha}}\) należy odczytywać z tablic, jednak wymaga to też odrobiny ostrożności. Najpierw ustalasz poziom istotności na jakim przychodzi Ci tworzyć przedziały ufności lub weryfikować hipotezy, w tym przypadku jest to \(\displaystyle{ \alpha = 0,01}\). Następnie sprawdzasz czy przedział jaki tworzysz, lub hipoteza jaką weryfikujesz jest dwustronna (w przypadku przedziałów ufności jest to dosyć oczywiste).

Zależność jest prosta: przedział dwustronny - wartość statystyki odczytywana dla \(\displaystyle{ 1- \frac{\alpha}{2}}\), natomiast dla przedziałów jednostronnych odczytujemy dla \(\displaystyle{ 1-\alpha}\).

Stąd też w Twoim przypadku odczytujesz wartość \(\displaystyle{ u_{\alpha}}\) dla wartości \(\displaystyle{ 0,995}\) i jest ona równa \(\displaystyle{ 2,58}\).

harryy1 · Post autor: **harryy1** » 19 cze 2012, o 01:33

Dzięki koledzy! Już to załapałem, a przynajmniej mam taką nadzieję ;p Początkowo zmylił mnie też fakt, że miałem 2 różne tablice i nie wiedziałem za bardzo o co chodzi. Poniżej piszę rozpiszę jeszcze zadanie, i prosiłbym o sprawdzenie:

Zmierzono wytrzymałość 10 losowo wybranych gotowych elementów walcowych i otrzymano następujące wyniki: 383, 284, 339, 340, 305, 386, 387, 335, 344, 346[MPa]. Przy założeniu, że wytrzymałość tych elementów jest zmienną losową o rozkładzie \(\displaystyle{ N(\mu,\sigma)}\) o nieznanych \(\displaystyle{ \mu \ i \ \sigma}\), wyznaczyć na podstawie tej próbki 95% realizację przedziału ufności dla \(\displaystyle{ \mu}\)
A więc:
\(\displaystyle{ \mu}\) to po prostu średnia, która wynosi: \(\displaystyle{ \overline{x}=344,9}\) i jest to pionowa oś będąca osią symetrii rozkładu Gaussa
\(\displaystyle{ \sigma}\) to odchylenie standardowe: \(\displaystyle{ s=32,2}\)
Z racji tego, że w zadaniu mam wyraźnie powiedziane, że nie znam \(\displaystyle{ \mu \ i \ \sigma}\) muszę skorzystać z rozkładu t-Studenta. Ja utożsamiam \(\displaystyle{ \mu \ i \ \sigma}\) ze średnią i odchyleniem. Jeśli tak nie jest proszę mnie poprawić. I tutaj trochę tego nie rozumiem, bo przecież jeśli mam dane próbki to mogę wyliczyć, więc czemu muszę korzystać z rozkładu t-Studenta. Ale dalej...
\(\displaystyle{ k=n-1}\) tu określam liczbę stopni swobody(n to liczba próbek)
następnie wyliczam t: \(\displaystyle{ \alpha = 0,05}\), dlatego przy liczbie stopni swobody 9 wartość \(\displaystyle{ t=2,262}\)
Dalej wyznaczam przedział ufności ze wzoru:

\(\displaystyle{ (\overline{x}-t \frac{S}{ \sqrt{n-1}}<\mu<\overline{x}+t \frac{S}{ \sqrt{n-1}} )}\)

\(\displaystyle{ 320,62<\mu<369,18}\)

Mam nadzieję, że zadanie jest dobrze zrobione, aczkolwiek jest kilka rzeczy, których jeszcze nie rozumiem. Oczywiście mam jeszcze sporo zadań do rozwiązania i to bardziej skomplikowanych, dlatego nie ukrywam, że liczę na pomoc w zrozumieniu tego.

Elvenpat · Post autor: **Elvenpat** » 19 cze 2012, o 13:01

Według mnie wszystko w porządku, tylko tak dla wyjaśnienia: \(\displaystyle{ \mu}\) to średnia z populacji, natomiast \(\displaystyle{ \overline{x}}\) to średnia z próby. Analogicznie jest z \(\displaystyle{ \sigma}\) i \(\displaystyle{ S}\). Mając wyliczone parametry z próbki nie możesz wnioskować o tych z całej populacji.

Dochodzi jeszcze kwestia wyboru odpowiedniego modelu do konstrukcji przedziału ufności. Według moich notatek przy wzorze którego użyłeś widnieje coś takiego: "Rozkład cechy w populacji jest normalny \(\displaystyle{ N(\mu , \sigma)}\) i \(\displaystyle{ \sigma}\) nie jest znane." Czyli powinniśmy znać w tym przypadku średnią z populacji. Można wybrać inny model, w którym nie musimy znać ani \(\displaystyle{ \mu}\), ani \(\displaystyle{ \sigma}\), jednak znowu w tamtym przypadku musi zachodzić \(\displaystyle{ n>100}\). Sytuacja trochę patowa, ktoś bardziej obeznany mógłby się wypowiedzieć na ten temat.

harryy1 · Post autor: **harryy1** » 19 cze 2012, o 20:09

No ok to już mi trochę rozjaśniłeś sprawę. Mam jeszcze kilka zadań do rozwiązania. Oczywiście nie chce żebyś mi je robił, ale chciałem, jeśli oczywiście byś mógł trochę mnie nakierować jak zrobić dane zadanie. Niestety nie mam żadnych wykładów ani innych materiałów ze studiów, a zadania muszę rozwiązać.

Oto zadanie:

W pewnym doświadczeniu fizycznym mierzy się czas występowania określonego efektu świetlnego. Przeprowadzono 100 niezależnych doświadczeń nad tym efektem i zbiór wyników pogrupowano następująco:

\(\displaystyle{ \left| \frac{\mathrm{przedział \ czasu} \ ( x_{i}, x _{x+1})}{\mathrm{liczność} \ n_{i}} \right| \left. \frac{0-0,4}{20} \right|\left. \frac{0,4-0,8}{35} \right|\left. \frac{0,8-1,2}{15} \right|\left. \frac{1,2-1,6}{10} \right|\left. \frac{1,6-2,0}{20} \right|}\)

Przyjmując współczynnik ufności \(\displaystyle{ 1-\alpha=0,9}\) oszacować czas trwania badanego efektu.

Nie wiem czy dobrze myślę, ale współczynnik ufności jest dla przedziału jednostronnego...ale mogę się mylić? Jak obliczyć średnią i odchylenie? Nie wiem czy dobrze kombinuje, ale z danego przedziału powinienem obliczyć medianę i pomnożyć to przez liczebność przedziału, a następnie zsumować to co wyszło z każdego przedziału i podzielić przez całość zbiorowości, tj. 100. Tak? Potem chyba powinienem dobrać z tablic dla rozkładu t-studenta współczynnik t dla 99 stopni swobody. Czy tak?

scyth · Post autor: **scyth** » 19 cze 2012, o 20:20

Nie masz powiedziane czy ma to być przedział jednostronny, więc zawsze liczysz obustronny - tak samo z testami.
Do obliczenia średniej i odchylenia obserwacjom przypisujesz środki przedziałów (więc masz 20 obserwacji o wartości 0,2 itd.).

Elvenpat · Post autor: **Elvenpat** » 19 cze 2012, o 20:44

Wyliczasz średnią i odchylenie w sposób jaki podpowiedział kolega powyżej. Następnie pozostaje skonstruowanie 90-procentowego przedziału ufności w oparciu o te dane.

harryy1 · Post autor: **harryy1** » 19 cze 2012, o 20:54

Nom oki to już wiem kolejną rzecz. Nom to dobrze myślałem co do średniej;) Poniżej moje wyliczenia i rozwiązanie zadania. Proszę o sprawdzenie...
\(\displaystyle{ \overline{x} = 0,9\\
s=0,564\\
t=1,290\\
0,827<\mu<0,973}\)
Nie pisałem już wszystkich wyliczeń. Prosiłbym o sprawdzenie współczynnika t(ew. średniej i odchylenia), oczywiście jeśli chodzi o wyliczenie przedziału to korzystałem z tego samego wzoru co w poprzednim zadaniu dla rozkładu t-Studenta.-- 24 cze 2012, o 23:27 --Cześć koledzy mam dwa zadania, które rozwiązałem. Czy moglibyście sprawdzić czy dobrze je rozwiązałem, gdyż chciałbym mieć pewność, że dobrze zrozumiałem materiał?

Zadanie 1

W pewnym przedsiębiorstwie transportowym wylosowano niezależnie 7 samochodów 16-tonowych, dla których współczynnik gotowości technicznej(w %) był następujący: 79, 76, 74, 78, 73, 70, 75. Wiadomo, że współczynnik gotowości technicznej ma rozkład normalny. Przyjąć współczynnik ufności \(\displaystyle{ 1-\alpha=0.9}\) i oszacować przedziałowo wariancję współczynnika gotowości technicznej.

Tak więc...

Do zadania będzie mi potrzebne wyliczenie wariancji oraz średniej:
Średnia

\(\displaystyle{ \overline{x}=75}\)

Wariancja

\(\displaystyle{ S^2= \frac{1}{n} \sum_{i=1}^{n}(x_{i}-\overline{x})^2=8}\)

W dalszej części zadania korzystam ze wzoru:

\(\displaystyle{ \left( \frac{nS^2}{X^2_{(n-1, 1- \frac{\alpha}{2})}}; \frac{nS^2}{X^2_{(n-1,\frac{\alpha}{2})}}\right)}\)

Do tego korzystam z tablic dla rozkładu chi-kwadrat?!Jeśli dobrze odczytałem wartości to wynoszą one:
Odczytane wartości(proszę o sprawdzenie):

Dla \(\displaystyle{ X^2_{(n-1, 1- \frac{\alpha}{2})}= 4.507}\)

Dla \(\displaystyle{ X^2_{(n-1,\frac{\alpha}{2})}=5.348}\)

Wynik moich wyliczeń:

\(\displaystyle{ (12.43;10.47)}\)
Tu mi się nie podoba, bo skoro to przedział to moje obliczenia powinny mieć odwrotną kolejność(ale mogę się mylić).
I pytanie czy jest jakiś sposób na połapanie się w tych tablicach? Ze szkoły mam inną wersję niż znalazłem na forum. Sposób zapisu w obu różni się między sobą. W jednym zamiast \(\displaystyle{ \alpha}\) jest p, ale to przecież to samo. Tyle, że w wierszu nagłówkowym np dla mojego zadania jest poprostu 0.9, a dla drugiego 0.1 i już kilka razy się na tym złapałem. Czy jest różnica między tym \(\displaystyle{ p}\) a \(\displaystyle{ \alpha}\)?

Zadanie 2

Zakładając, że kwartalne wydatki na reklamę (w tyś. zł) mają rozkład normalny, wylosowano do próby 100 zakładów usługowych i otrzymano następujący rozkład wydatków na reklamę:

\(\displaystyle{ \begin{tabular}{c|c|c|c|c}
\text{wydatki na reklamę}&0-5&5-10&10-15&15-20\\ \hline
\text{liczba zakładów}&10&20&40&30\\
\end{tabular}}\)
Oszacować metodą przedziałową odchylenie standardowe wydatków na reklamę na poziomie ufności \(\displaystyle{ 1-\alpha=0.98}\)

Tak więc, żeby obliczyć wartości dla przedziałów będą mi potrzebne: odchylenie standardowe i średnia:
Średnia:

\(\displaystyle{ \overline{x}=10}\)

Odchylenie standardowe:

\(\displaystyle{ S=\sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_{i}-\overline{x})^2}=5.59}\)

Korzystam z następującego wzoru:

\(\displaystyle{ \left( \frac{2\sqrt{2n}}{\sqrt{2n-3}+u_{1- \frac{\alpha}{2} }}; \frac{2\sqrt{2n}}{\sqrt{2n-3}-u_{1- \frac{\alpha}{2} }}\right)}\)

Moje \(\displaystyle{ u_{1- \frac{\alpha}{2} }=2.05}\) (proszę o sprawdzenie)

Tak więc: \(\displaystyle{ (8.36;4.26)}\)

Varimatras · Post autor: **Varimatras** » 1 sty 2016, o 16:15

Pozwolę sobie odkopać ten antyczny temat bo czuje że nie do końca został wyczerpany.

Przy założeniu, że wytrzymałość tych elementów jest zmienną losową o rozkładzie \(\displaystyle{ N(\mu,\sigma)}\) o nieznanych \(\displaystyle{ \mu}\) i \(\displaystyle{ \sigma}\), wyznaczyć na podstawie tej próbki 95% realizację przedziału ufności dla \(\displaystyle{ \mu}\)

Według moich notatek przy wzorze którego użyłeś widnieje coś takiego: "Rozkład cechy w populacji jest normalny \(\displaystyle{ N(\mu , \sigma)}\) i \(\displaystyle{ \sigma}\) nie jest znane." Czyli powinniśmy znać w tym przypadku średnią z populacji. Można wybrać inny model, w którym nie musimy znać ani \(\displaystyle{ \mu}\), ani \(\displaystyle{ \sigma}\), jednak znowu w tamtym przypadku musi zachodzić \(\displaystyle{ n>100}\). Sytuacja trochę patowa, ktoś bardziej obeznany mógłby się wypowiedzieć na ten temat.

Jak to w takim razie jest? Rozwiązałem już kilka zadań tego rodzaju ale pierwszy raz chyba widzę aby \(\displaystyle{ \mu}\) było nie znane. Czy to zadanie zostało rozwiązane w pełni poprawnie?

EDIT
Jeszcze jedno pytanie. W kolejnym zadaniu pojawia się odpowiedź \(\displaystyle{ 0,827<\mu<0,973}\) Dlaczego miało by to być akurat \(\displaystyle{ \mu}\)? Który fragment zadania wskazuje że tam nie będzie np \(\displaystyle{ m, \sigma}\) albo cokolwiek innego tylko \(\displaystyle{ \mu}\)?

LittleJohnny · Post autor: **LittleJohnny** » 9 lut 2021, o 22:37

Pozwolę sobie odkopać ten antycznie odkopany antyczny temat, czyli \(\displaystyle{ antyczny ^{2} }\)

kolega Varimatras Zadanie 2
Czy może mi ktoś wytłumaczyć jak policzyć średnią? Koledze wyżej wyszło \(\displaystyle{ \overline{x}=10}\)
Wg. tego co tu napisane: [ciach] to liczę po kolei:
\(\displaystyle{ \frac{0+5}{2}=2,5 }\) (tysięcy)
\(\displaystyle{ \frac{5+10}{2}=7,5 }\) (tysięcy)
\(\displaystyle{ \frac{10+15}{2}=12,5 }\) (tysięcy)
\(\displaystyle{ \frac{15+20}{2}=17,5 }\) (tysięcy)
\(\displaystyle{ \overline{x_i} \cdot n_i}\)
\(\displaystyle{ 2,5 \cdot 10 = 25}\) (tysięcy)
\(\displaystyle{ 7,5 \cdot 20 = 150}\) (tysięcy)
\(\displaystyle{ 12,5 \cdot 40 = 500}\) (tysięcy)
\(\displaystyle{ 17,5 \cdot 30 = 525}\) (tysięcy)

\(\displaystyle{ \overline{x} = \frac{1}{n} \sum_{}^{} \overline{x_i}\cdot n_i = \frac{1}{100} \cdot 1200000=12000zł }\)
Jak to się ma do? \(\displaystyle{ \overline{x}=10}\)
I jak z tego policzyć przedział ufności ? Z dużego wzoru, bo \(\displaystyle{ n=100}\) prawda? ale co pod co podstawiać? Na jaką stronę nie spojrzę ten wzór różni się od siebie... no i nie zacznę do póki nie będę miał średniej
Help

mikos02 · Post autor: **mikos02** » 4 mar 2021, o 14:18

Kod: Zaznacz cały

# dane:
> v <- rep(c(5,15,25,35)/2,c(10,20,40,30))

# średnia:
> mean(v)
[1] 12
# błąd standardowy średniej:
> (SEm <- sqrt(var(v)/length(v)))
[1] 0.4740754 

# wariancja:
> var(v)
[1] 22.47475
# błąd standardowy wariancji:
> z <- (v-mean(v))^2
> (SEv <- sqrt(var(z)/length(z)))
[1] 2.613098

Kod: Zaznacz cały

> a <- 1-0.98

98% przedział dla odchylenia standardowego:

# kwantyle z rozkładu normalnego:
> sqrt(qnorm(c(a/2,1-a/2),var(v),SEv))
[1] 4.049169 5.343568

# kwantyle z rozkładu chi-kwadrat:
> sqrt(sort(sum(z)/qchisq(c(a/2,1-a/2),n-1)))
[1] 4.065139 5.669153


98% przedział dla średniej:

# kwantyle z rozkładu normalnego:
> qnorm(c(a/2,1-a/2),mean(v),SEm)
[1] 10.89714 13.10286

# kwantyle z rozkładu t-Studenta:
> qpearsonVII(c(a/2,1-a/2), df=99, mean(v),SEm)
[1] 10.879 13.121

Matematyka.pl