Początkujący statystyk , praca z hipotezami

Acros · Post autor: **Acros** » 20 cze 2014, o 13:51

Cześć , zawsze byłem bardzo dobry z matmy , więc wziołem się za opracowanie statystyczne pracy magisterskiej mojej mamy.

Możecie zweryfikować , czy metody przeze mnie stosowane są poprawne ?

Np.
Mam hipotezę - Pielęgniarki okazują życzliwość w stosunku do chorego
Do tego mam ankietę w której pacjenci oceniali życzliwość w skali od 1 do 5.

Ocena 1 2 3 4 5
Liczba 0 9 14 22 60

Uznałem, że żeby wyeliminować możliwość odrzucenia tej hipotezy muszę pokazać , że średnia (ocena) w populacji jest większa niż 3. Przyjąłem \(\displaystyle{ 1- \alpha =0,95}\) , próbka jest duża (105 badanych ), więc posłużyłem się rozkładem normalnym. Otrzymałem przedział ufności \(\displaystyle{ 4,12<m<4,47}\). Przedział ten spełnia warunek ( średnia większa od 3 ).Czy to wystarczy ?

Proszę o wyrozumiałość , jestem samoukiem , ale bardzo spodobała mi się statystyka.
Chętnie wysłycham rad .

chris_f · Post autor: **chris_f** » 21 cze 2014, o 16:38

No cóż, policzenie przedziału ufności to nie to samo co weryfikacja hipotezy.
Na początek trzeba jasno określić populację, tzn. o jakie pielęgniarki chodzi. Domyślam się, że chodzi o jakiś szpital lub ZOZ, ale to trzeba jasno podkreślić, nie można formułować tak ogólnej hipotezy na podstawie ograniczonego terytorialnie badania. Ale to jest mniej istotne.
Przede wszystkim należy poprawnie sformułować hipotezy. Przypuszczam, że gdy średnia ocena wyniesie ponad 3, to uznamy, ze pielęgniarki w miejscu X okazują życzliwość wobec chorego.
Dysponujemy wynikami z próby (które zamieściłeś w tabelce), na tej podstawie próbujemy wypowiedzieć się o średniej dla całej populacji (której nie znamy, bo w końcu nie zapytaliśmy wszystkich pacjentów, tylko 105).
Formułujemy zatem hipotezy:
\(\displaystyle{ H_0:}\) \(\displaystyle{ m=3}\) - średnia w populacji jest równa 3 - jest to hipoteza zerowa
wobec hipotezy alternatywnej
\(\displaystyle{ H_1:}\) \(\displaystyle{ m>3}\) - średnia w populacji jest większa niż 3 (jest to hipoteza jednostronna <prawostronna>, bo z wyliczonej średniej z próby wychodzi, że jest większa niż trzy).

Aby zweryfikować taką hipotezę potrzebne nam będą dwie rzeczy:
- statystyka testowa obliczona na podstawie wyników
- statystyka teoretyczna odczytana z tablic rozkładu normalnego (bo rzeczywiście liczba danych jest duża) dla danego poziomu istotności (w tym przypadku \(\displaystyle{ \alpha=0,05}\)).

Statystyka testowa wyraża się wzorem
\(\displaystyle{ Z=\frac{\bar{x}-3}{s}\cdot\sqrt{105}}\).
Musimy zatem obliczyć średnią i odchylenie standardowe z próby, dostaniemy (to zresztą chyba zrobiłeś przy liczeniu przedziału ufności)
\(\displaystyle{ \bar{x}=4,27,\ s=0,99}\)
Dostajemy zatem
\(\displaystyle{ Z=\frac{4,27-3}{0,99}\cdot\sqrt{105}=13,15}\)

Teraz z tablic rozkładu normalnego odczytujemy wartość statystyki teoretycznej
\(\displaystyle{ z_{0,05}=1,65}\).

I teraz najważniejsze: ponieważ wartość statystyki testowej \(\displaystyle{ Z=13,15}\) jest większa od wartości statystyki teoretycznej \(\displaystyle{ z_{0,05}=1,65}\) to odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną.
Oznacza to, że na poziomie istotności 0,05 średnia ocena życzliwości pielęgniarek wobec pacjentów jest większa od 3.

PS. Możesz przyjąć znacznie wyższy poziom ufności i też tak wyjdzie. Np. dla różnych poziomów ufności dostaniemy takie wartości statystyki teoretycznej:
Dla \(\displaystyle{ 1-\alpha=0,98}\) dostaniemy \(\displaystyle{ z_{0,02}=2,06}\)
Dla \(\displaystyle{ 1-\alpha=0,99}\) dostaniemy \(\displaystyle{ z_{0,01}=2,33}\)
Dla \(\displaystyle{ 1-\alpha=0,995}\) dostaniemy \(\displaystyle{ z_{0,005}=2,58}\)
Dla \(\displaystyle{ 1-\alpha=0,998}\) dostaniemy \(\displaystyle{ z_{0,002}=2,88}\)
Dla \(\displaystyle{ 1-\alpha=0,999}\) dostaniemy \(\displaystyle{ z_{0,001}=3,09}\)
W każdym przypadku należy odrzucić hipotezę zerową i przyjąć alternatywna.

PS. 2. Ja postawił bym hipotezę nieco ostrzejszą: mianowicie uznałbym, że pielęgniarki są życzliwe wobec pacjentów, jeżeli średnia ocena wynosi ponad cztery.
Ocena 3 w takiej skali sugeruje raczej obojętność. CO to zmienia?
Nieco inaczej brzmią hipotezy:
\(\displaystyle{ H_0: m=4}\)
\(\displaystyle{ H_1: m>4}\)
i będziemy mieli inny wynik w statystyce testowej
\(\displaystyle{ Z=\frac{4,27-4}{0,99}\cdot\sqrt{105}=2,79}\)
A zatem hipotezę zerową odrzucamy na poziomach ufności \(\displaystyle{ 0,95; 0,98; 0,99\ {\rm i}\ 0,995}\) (czyli pielęgniarki są życzliwe), ale już na dwóch najwyższych poziomach ufności nie ma podstaw do odrzucenia hipotezy zerowej.

Acros · Post autor: **Acros** » 22 cze 2014, o 11:07

Wielkie dzięki , wszystko bardzo klarownie wytłumaczone.

Kartezjusz · Post autor: **Kartezjusz** » 22 cze 2014, o 11:37

To są nieparametryczne dane. Subiektywne .Trzeba użyć nieklasycznych metod statystycznych.

chris_f · Post autor: **chris_f** » 22 cze 2014, o 13:18

Tu bym dyskutował.
Rzeczywiście ocena wystawiana przez pacjenta nie jest w pełni cechą mierzalną, tak jak np. wzrost, waga, cena, zarobki itp. Jednak w takich przypadkach bardzo często stosuje się przypisywanie rang takim cechom, po to by móc skorzystać ze zwykłych narzędzi. Nie różni się to zbytnio od ustalania cen, stawek gdzie mamy do dyspozycji pewną określona liczbę wyborów.
Mamy np. cztery poziomy podatku VAT i przypisujemy je rożnym grupom towarów i usług, a potem nieraz liczymy średnią, odchylenie, miary pozycyjne, czyli postępujemy tak jak ze zwykłymi cechami mierzalnymi.
Ciekaw jestem z jakich metod skorzystałbyś przy tego typu zagadnieniu.

Acros · Post autor: **Acros** » 22 cze 2014, o 22:44

Ok panowie mam jeszcze pytnko(a) :
Używam rozkładu normalnego bo \(\displaystyle{ n=105}\) i liczę sobie \(\displaystyle{ Z}\) i tak przykładowo w 3 oddzielnych przykładach mam:
\(\displaystyle{ Z1= 3,27}\) ( srednia 4,3 co jest wieksze od 4)
\(\displaystyle{ Z2 = 0,21}\) ( średnia 4,02 czyli prawie idealnie 4)
\(\displaystyle{ Z3=-7,08}\) ( średnia 3,2 czyli sporo mniej niz 3).
I tu mam problem . Chciałem policzyć \(\displaystyle{ p}\)-wartość no ale dla \(\displaystyle{ Z1}\) wychodzi\(\displaystyle{ p \approx 0}\) ;/ wiem , że to dlatego , że \(\displaystyle{ H0}\) było ,że \(\displaystyle{ m=4}\) , a \(\displaystyle{ 4,3}\) jest ponad \(\displaystyle{ 4}\).
Starałem się coś wykombionować na własnę rękę i stwierdziłem , że jeśli średnia próbki jest ponad\(\displaystyle{ 4}\) to\(\displaystyle{ p = 1}\)bo w końcu moja hipoteza to "Pielęgniarki są życzliwe" czyt. średnia ocena \(\displaystyle{ \ge 4}\).

chris_f · Post autor: **chris_f** » 23 cze 2014, o 19:42

Strasznie niezrozumiale piszesz. Czym są te \(\displaystyle{ Z1,Z2,Z3}\)? Dlaczego bierzesz średnie typu 4,02 (to jeszcze mogę zrozumieć), ale 3,2? W tym ostatnim przypadki zmieni się hipoteza alternatywna na lewostronną.
Co to jest \(\displaystyle{ p}\)-wartość?
Poczytaj trochę o weryfikacji hipotez parametrycznych (w tym przypadku chodzi o średnią).

Owszem, to jest bardzo często spotykana metoda, że manipuluje się poziomem istotności, manipuluje się sformułowaniem hipotezy tak, żeby uzyskać jak "najmocniejszy" wynik, ale trzeba to robić z głową.

To też jest arbitralny wybór: czy zmniejszamy poziom istotności, czy zwiększamy teoretyczną średnią dla populacji. te dwa parametry mają bardzo duży wpływ na odrzucenie \(\displaystyle{ H_0}\), czy tez brak podstaw do odrzucenia.

Chyba, ze chcesz zacząć się bawić w dwuwymiarowy model -średnia-poziom istotności, ale to zdecydowanie wykracza poza nie tylko podstawy, ale nawet taką klasyczna statystykę.