Testowanie hipotez, poprawność wzoru

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
jackie
Użytkownik
Użytkownik
Posty: 100
Rejestracja: 4 gru 2011, o 10:50
Płeć: Kobieta
Lokalizacja: Warszawa
Podziękował: 40 razy

Testowanie hipotez, poprawność wzoru

Post autor: jackie »

Dwie firmy rozwożą przesyłki po mieście. Chcemy zbadać która dostarcza przesyłki w krótszym czasie. Firma A podała średni czas dostarczenia przesyłki \(\displaystyle{ x= 28}\) oraz wariancje: \(\displaystyle{ s _{1} ^{2} = 16}\) opierając się na 17-element owej probie. Firma B dokonała pomiaru 8 dostarczeń i otrzymała średnią y= 30 a wariancje \(\displaystyle{ s _{2} ^{2} = 9}\).
Przeprowadź test hipotezy, ze czasy dostarczeń w obu firmach są równe przy alternatywie ze A dostarcza przesyłkę szybciej.
Dla jasności: \(\displaystyle{ n=17 , m=8}\).
Pisząc w skrócie: hipoteza zerowa\(\displaystyle{ A=B}\), alternatywna \(\displaystyle{ A>B}\)

Zastosowałam wzorek z notatek z wykładu:

\(\displaystyle{ T= \frac{x-y}{ \sqrt{n \cdot s_{1} ^{2}+m \cdot s_{2} ^{2} } } \cdot \sqrt{ \frac{n \cdot m}{n+m} \cdot (n+m-2) }}\)

który został poprawiony na :

\(\displaystyle{ T= \frac{x-y}{ \sqrt{(n-1) \cdot s_{1} ^{2}+(m-1) \cdot s_{2} ^{2} } } \cdot \sqrt{ \frac{n \cdot m}{n+m} \cdot (n+m-2) }}\)

I teraz pytanie, mam zły wzór w notatkach czy zastosowałam nie taki jak trzeba?
chris_f
Użytkownik
Użytkownik
Posty: 2727
Rejestracja: 14 paź 2004, o 16:26
Płeć: Mężczyzna
Lokalizacja: podkarpacie
Podziękował: 3 razy
Pomógł: 945 razy

Testowanie hipotez, poprawność wzoru

Post autor: chris_f »

Jest to typowa weryfikacja hipotezy o równości dwóch średnich w przypadku, gdy liczności prób są nieduże \(\displaystyle{ n+m\le122}\)).
Wtedy statystyka testowa wyraża się wzorem (zobacz np. Sobczyk) (zapisuję go przy Twoich oznaczeniach)
\(\displaystyle{ T=\frac{x-y}{\sqrt{\frac{ns_1^2+ms_2^2}{n+m-2}\cdot\left(\frac{1}{n}+\frac{1}{m}\right)}}}\)
Ta statystyka ma rozkład \(\displaystyle{ t}\) Studenta o \(\displaystyle{ n+m-2}\) stopniach swobody.
Nie wiem, czy któryś z Twoich wzorów odpowiada temu z podręcznika, pewnie trzeba by poprzekształcać, oba wyglądają na prawdopodobnie, trzeba by się pobawić, sprowadzić do wspólnego mianownika itp. przekształcenia.

[edit] Tak spojrzałem, to pierwszy masz identyczny z tym co napisałem, a nad drugim musisz troszkę posiedzieć.

[edit 2] W drugim jest brana pod uwagę poprawka przy wariancji, gdzie zmienia się \(\displaystyle{ n}\) na \(\displaystyle{ n-1}\), podobnie z \(\displaystyle{ m}\), żeby używać estymatorów nieobciążonych. W praktyce nie ma to żadnego znaczenia.
Ostatnio zmieniony 14 lut 2014, o 13:32 przez chris_f, łącznie zmieniany 1 raz.
jackie
Użytkownik
Użytkownik
Posty: 100
Rejestracja: 4 gru 2011, o 10:50
Płeć: Kobieta
Lokalizacja: Warszawa
Podziękował: 40 razy

Testowanie hipotez, poprawność wzoru

Post autor: jackie »

Własnie problem w tym ze użyłam tego pierwszego na kolokwium, został skreślony przez sprawdzającego i poprawiony na ten niżej. Nie udało mi się dowiedzieć dlaczego ma być tak a nie inaczej. Nie ma szans ze wzór nr 1 jest niewłaściwy? Albo ze oba są w jakiś sposób właściwe? Wg mnie mianowniki we wzorze są sobie równe dla \(\displaystyle{ s ^{2} _{2} = - s ^{2} _{1}}\) wiec nie powiedziałabym ze można jeden przekształcić w drugi (Nie wiem już z czego mam na egzaminie korzystać..)
chris_f
Użytkownik
Użytkownik
Posty: 2727
Rejestracja: 14 paź 2004, o 16:26
Płeć: Mężczyzna
Lokalizacja: podkarpacie
Podziękował: 3 razy
Pomógł: 945 razy

Testowanie hipotez, poprawność wzoru

Post autor: chris_f »

Nie da się przekształcić jednego wzoru w drugi metodą algebraiczną.
Cała sprawa rozbija się o to, jakiego wzoru na wariancję używamy.
W jednym (tym standardowym), gdy dysponujemy danymi z całej populacji w mianowniku jest \(\displaystyle{ n}\), wtedy
\(\displaystyle{ s^2=\frac1n\sum(x_i-\bar{x})^2}\)
i to jest taki zwykły (szkolny) wzór na wariancję.
Jednak taki wzór daje nam estymator obciążony w przypadku posiadania danych z próby, a nie z całej populacji. Wtedy, żeby uzyskać estymator nieobciążony, to tak obliczoną wariancję należy pomnożyć przez \(\displaystyle{ \frac{n}{n-1}}\), co spowoduje zniknięcie \(\displaystyle{ n}\) i pojawienie się \(\displaystyle{ n-1}\) w mianowniku.
Wtedy estymator będzie już nieobciążony. Przy dużych liczebnie próbach jest to nieistotne, przy małych zaczyna to być ważne.
Najprawdopodobniej na wykładzie odpuściłaś sobie słowne wyjaśnienie dlaczego takie zmiany następują i który wzór należy stosować.

Różnicę możesz to zauważyć np. w Excelu, gdzie są dwa wzory na wariancję,
WARIANCJA.A i WARIANCJA.POP (drugi dotyczy całej populacji).

No i warto wrócić do podstaw i poczytać coś o estymatorach.

[edit] Może krócej (i mniej precyzyjniej): pierwszy wzór stosujemy wtedy, gdy znamy wariancję z całej populacji, drugi, gdy znamy wariancję z próby.
ODPOWIEDZ