Początkujący statystyk , praca z hipotezami

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
Acros
Użytkownik
Użytkownik
Posty: 122
Rejestracja: 14 sty 2010, o 19:42
Płeć: Mężczyzna
Lokalizacja: woj. Mazowieckie
Podziękował: 7 razy

Początkujący statystyk , praca z hipotezami

Post autor: Acros »

Cześć , zawsze byłem bardzo dobry z matmy , więc wziołem się za opracowanie statystyczne pracy magisterskiej mojej mamy.

Możecie zweryfikować , czy metody przeze mnie stosowane są poprawne ?

Np.
Mam hipotezę - Pielęgniarki okazują życzliwość w stosunku do chorego
Do tego mam ankietę w której pacjenci oceniali życzliwość w skali od 1 do 5.

Ocena 1 2 3 4 5
Liczba 0 9 14 22 60

Uznałem, że żeby wyeliminować możliwość odrzucenia tej hipotezy muszę pokazać , że średnia (ocena) w populacji jest większa niż 3. Przyjąłem \(\displaystyle{ 1- \alpha =0,95}\) , próbka jest duża (105 badanych ), więc posłużyłem się rozkładem normalnym. Otrzymałem przedział ufności \(\displaystyle{ 4,12<m<4,47}\). Przedział ten spełnia warunek ( średnia większa od 3 ).Czy to wystarczy ?

Proszę o wyrozumiałość , jestem samoukiem , ale bardzo spodobała mi się statystyka.
Chętnie wysłycham rad .
chris_f
Użytkownik
Użytkownik
Posty: 2726
Rejestracja: 14 paź 2004, o 16:26
Płeć: Mężczyzna
Lokalizacja: podkarpacie
Podziękował: 3 razy
Pomógł: 945 razy

Początkujący statystyk , praca z hipotezami

Post autor: chris_f »

No cóż, policzenie przedziału ufności to nie to samo co weryfikacja hipotezy.
Na początek trzeba jasno określić populację, tzn. o jakie pielęgniarki chodzi. Domyślam się, że chodzi o jakiś szpital lub ZOZ, ale to trzeba jasno podkreślić, nie można formułować tak ogólnej hipotezy na podstawie ograniczonego terytorialnie badania. Ale to jest mniej istotne.
Przede wszystkim należy poprawnie sformułować hipotezy. Przypuszczam, że gdy średnia ocena wyniesie ponad 3, to uznamy, ze pielęgniarki w miejscu X okazują życzliwość wobec chorego.
Dysponujemy wynikami z próby (które zamieściłeś w tabelce), na tej podstawie próbujemy wypowiedzieć się o średniej dla całej populacji (której nie znamy, bo w końcu nie zapytaliśmy wszystkich pacjentów, tylko 105).
Formułujemy zatem hipotezy:
\(\displaystyle{ H_0:}\) \(\displaystyle{ m=3}\) - średnia w populacji jest równa 3 - jest to hipoteza zerowa
wobec hipotezy alternatywnej
\(\displaystyle{ H_1:}\) \(\displaystyle{ m>3}\) - średnia w populacji jest większa niż 3 (jest to hipoteza jednostronna <prawostronna>, bo z wyliczonej średniej z próby wychodzi, że jest większa niż trzy).

Aby zweryfikować taką hipotezę potrzebne nam będą dwie rzeczy:
- statystyka testowa obliczona na podstawie wyników
- statystyka teoretyczna odczytana z tablic rozkładu normalnego (bo rzeczywiście liczba danych jest duża) dla danego poziomu istotności (w tym przypadku \(\displaystyle{ \alpha=0,05}\)).

Statystyka testowa wyraża się wzorem
\(\displaystyle{ Z=\frac{\bar{x}-3}{s}\cdot\sqrt{105}}\).
Musimy zatem obliczyć średnią i odchylenie standardowe z próby, dostaniemy (to zresztą chyba zrobiłeś przy liczeniu przedziału ufności)
\(\displaystyle{ \bar{x}=4,27,\ s=0,99}\)
Dostajemy zatem
\(\displaystyle{ Z=\frac{4,27-3}{0,99}\cdot\sqrt{105}=13,15}\)

Teraz z tablic rozkładu normalnego odczytujemy wartość statystyki teoretycznej
\(\displaystyle{ z_{0,05}=1,65}\).

I teraz najważniejsze: ponieważ wartość statystyki testowej \(\displaystyle{ Z=13,15}\) jest większa od wartości statystyki teoretycznej \(\displaystyle{ z_{0,05}=1,65}\) to odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną.
Oznacza to, że na poziomie istotności 0,05 średnia ocena życzliwości pielęgniarek wobec pacjentów jest większa od 3.

PS. Możesz przyjąć znacznie wyższy poziom ufności i też tak wyjdzie. Np. dla różnych poziomów ufności dostaniemy takie wartości statystyki teoretycznej:
Dla \(\displaystyle{ 1-\alpha=0,98}\) dostaniemy \(\displaystyle{ z_{0,02}=2,06}\)
Dla \(\displaystyle{ 1-\alpha=0,99}\) dostaniemy \(\displaystyle{ z_{0,01}=2,33}\)
Dla \(\displaystyle{ 1-\alpha=0,995}\) dostaniemy \(\displaystyle{ z_{0,005}=2,58}\)
Dla \(\displaystyle{ 1-\alpha=0,998}\) dostaniemy \(\displaystyle{ z_{0,002}=2,88}\)
Dla \(\displaystyle{ 1-\alpha=0,999}\) dostaniemy \(\displaystyle{ z_{0,001}=3,09}\)
W każdym przypadku należy odrzucić hipotezę zerową i przyjąć alternatywna.

PS. 2. Ja postawił bym hipotezę nieco ostrzejszą: mianowicie uznałbym, że pielęgniarki są życzliwe wobec pacjentów, jeżeli średnia ocena wynosi ponad cztery.
Ocena 3 w takiej skali sugeruje raczej obojętność. CO to zmienia?
Nieco inaczej brzmią hipotezy:
\(\displaystyle{ H_0: m=4}\)
\(\displaystyle{ H_1: m>4}\)
i będziemy mieli inny wynik w statystyce testowej
\(\displaystyle{ Z=\frac{4,27-4}{0,99}\cdot\sqrt{105}=2,79}\)
A zatem hipotezę zerową odrzucamy na poziomach ufności \(\displaystyle{ 0,95; 0,98; 0,99\ {\rm i}\ 0,995}\) (czyli pielęgniarki są życzliwe), ale już na dwóch najwyższych poziomach ufności nie ma podstaw do odrzucenia hipotezy zerowej.
Acros
Użytkownik
Użytkownik
Posty: 122
Rejestracja: 14 sty 2010, o 19:42
Płeć: Mężczyzna
Lokalizacja: woj. Mazowieckie
Podziękował: 7 razy

Początkujący statystyk , praca z hipotezami

Post autor: Acros »

Wielkie dzięki , wszystko bardzo klarownie wytłumaczone.
Kartezjusz
Użytkownik
Użytkownik
Posty: 7336
Rejestracja: 14 lut 2008, o 08:31
Płeć: Mężczyzna
Lokalizacja: Z Bielskia-Białej
Podziękował: 6 razy
Pomógł: 961 razy

Początkujący statystyk , praca z hipotezami

Post autor: Kartezjusz »

To są nieparametryczne dane. Subiektywne .Trzeba użyć nieklasycznych metod statystycznych.
chris_f
Użytkownik
Użytkownik
Posty: 2726
Rejestracja: 14 paź 2004, o 16:26
Płeć: Mężczyzna
Lokalizacja: podkarpacie
Podziękował: 3 razy
Pomógł: 945 razy

Początkujący statystyk , praca z hipotezami

Post autor: chris_f »

Tu bym dyskutował.
Rzeczywiście ocena wystawiana przez pacjenta nie jest w pełni cechą mierzalną, tak jak np. wzrost, waga, cena, zarobki itp. Jednak w takich przypadkach bardzo często stosuje się przypisywanie rang takim cechom, po to by móc skorzystać ze zwykłych narzędzi. Nie różni się to zbytnio od ustalania cen, stawek gdzie mamy do dyspozycji pewną określona liczbę wyborów.
Mamy np. cztery poziomy podatku VAT i przypisujemy je rożnym grupom towarów i usług, a potem nieraz liczymy średnią, odchylenie, miary pozycyjne, czyli postępujemy tak jak ze zwykłymi cechami mierzalnymi.
Ciekaw jestem z jakich metod skorzystałbyś przy tego typu zagadnieniu.
Acros
Użytkownik
Użytkownik
Posty: 122
Rejestracja: 14 sty 2010, o 19:42
Płeć: Mężczyzna
Lokalizacja: woj. Mazowieckie
Podziękował: 7 razy

Początkujący statystyk , praca z hipotezami

Post autor: Acros »

Ok panowie mam jeszcze pytnko(a) :
Używam rozkładu normalnego bo \(\displaystyle{ n=105}\) i liczę sobie \(\displaystyle{ Z}\) i tak przykładowo w 3 oddzielnych przykładach mam:
\(\displaystyle{ Z1= 3,27}\) ( srednia 4,3 co jest wieksze od 4)
\(\displaystyle{ Z2 = 0,21}\) ( średnia 4,02 czyli prawie idealnie 4)
\(\displaystyle{ Z3=-7,08}\) ( średnia 3,2 czyli sporo mniej niz 3).
I tu mam problem . Chciałem policzyć \(\displaystyle{ p}\)-wartość no ale dla \(\displaystyle{ Z1}\) wychodzi\(\displaystyle{ p \approx 0}\) ;/ wiem , że to dlatego , że \(\displaystyle{ H0}\) było ,że \(\displaystyle{ m=4}\) , a \(\displaystyle{ 4,3}\) jest ponad \(\displaystyle{ 4}\).
Starałem się coś wykombionować na własnę rękę i stwierdziłem , że jeśli średnia próbki jest ponad\(\displaystyle{ 4}\) to\(\displaystyle{ p = 1}\)bo w końcu moja hipoteza to "Pielęgniarki są życzliwe" czyt. średnia ocena \(\displaystyle{ \ge 4}\).
chris_f
Użytkownik
Użytkownik
Posty: 2726
Rejestracja: 14 paź 2004, o 16:26
Płeć: Mężczyzna
Lokalizacja: podkarpacie
Podziękował: 3 razy
Pomógł: 945 razy

Początkujący statystyk , praca z hipotezami

Post autor: chris_f »

Strasznie niezrozumiale piszesz. Czym są te \(\displaystyle{ Z1,Z2,Z3}\)? Dlaczego bierzesz średnie typu 4,02 (to jeszcze mogę zrozumieć), ale 3,2? W tym ostatnim przypadki zmieni się hipoteza alternatywna na lewostronną.
Co to jest \(\displaystyle{ p}\)-wartość?
Poczytaj trochę o weryfikacji hipotez parametrycznych (w tym przypadku chodzi o średnią).

Owszem, to jest bardzo często spotykana metoda, że manipuluje się poziomem istotności, manipuluje się sformułowaniem hipotezy tak, żeby uzyskać jak "najmocniejszy" wynik, ale trzeba to robić z głową.

To też jest arbitralny wybór: czy zmniejszamy poziom istotności, czy zwiększamy teoretyczną średnią dla populacji. te dwa parametry mają bardzo duży wpływ na odrzucenie \(\displaystyle{ H_0}\), czy tez brak podstaw do odrzucenia.

Chyba, ze chcesz zacząć się bawić w dwuwymiarowy model -średnia-poziom istotności, ale to zdecydowanie wykracza poza nie tylko podstawy, ale nawet taką klasyczna statystykę.
ODPOWIEDZ