sprawdzenie czy rozkład jest normalny

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
Awatar użytkownika
Amundsen
Użytkownik
Użytkownik
Posty: 35
Rejestracja: 30 maja 2010, o 12:04
Płeć: Mężczyzna
Lokalizacja: Gdańsk
Podziękował: 6 razy
Pomógł: 1 raz

sprawdzenie czy rozkład jest normalny

Post autor: Amundsen »

Witam chodzi mi o zadanie z Krysickiego "Rachunek prawdopodobieństwa i statystyka matematyczna" str 120 zad 3.31
Wskrócie to chodzi o to czy cecha X ma rozkład normalny i sprawdzenie tego przy pomocy testu Shapiro-Wilka.
Wzór:

\(\displaystyle{ W= \frac{ \left( \sum_{i=1}^{[n/2]} a_{i:n}\left( X_{(n-i+1)}-X _{(i)} \right) \right)^{2} }{ \sum_{i=1}^{n}\left( X_{i}- \^{X} \right)^{2} }}\)

(ten daszek przy X to miało być oznaczenie średniej)

nie wiem dlaczego kiedy liczę ze wzoru inaczej wychodzi mi wartość mianownika niż jest to w książce zamiast 730,57 mi wychodzi 314,4053.
Nie wiem gdzie robię błąd...
pomóżcie
szw1710

sprawdzenie czy rozkład jest normalny

Post autor: szw1710 »

Mógłbyś przepisać treść zadania? Nie każdy ma Krysickiego. A Forum ma użyteczność ogólną. Ja Krysickiego mam. Popatrzę na to po południu lub wieczorem.
Awatar użytkownika
Amundsen
Użytkownik
Użytkownik
Posty: 35
Rejestracja: 30 maja 2010, o 12:04
Płeć: Mężczyzna
Lokalizacja: Gdańsk
Podziękował: 6 razy
Pomógł: 1 raz

sprawdzenie czy rozkład jest normalny

Post autor: Amundsen »

Treść:
Pobrano próbkę dotyczącą cechy mierzalnej X o liczebności n=19, wyniki:
12,4
14,2
14,9
15,6
16,1
16,8
17,3
17,9
18,2
18,6
19,3
19,7
20,4
21,9
22,8
23,7
25,2
25,9
27,4
Na poziomie istotności 0,1 zweryfikować testem Shapiro-Wilka hipotezę o normalności badanej cechy X w populacji generalnej.

PS. To zadanie chyba jest całe jakieś dziwne z reguły za poziom istotności przyjmuje się 0,05 albo 0,01
Dopiero teraz zauważyłem że ja założyłem sobie poziom istotności 0,05 i tak odczytywałem z tablicy...
szw1710

sprawdzenie czy rozkład jest normalny

Post autor: szw1710 »

Dobrze Ci ten mianownik wychodzi. W R policzyłem, bo w Excelu czasu szkoda.

Samego testu Ci nie sprawdzę, bo moja wiedza statystyczna jeszcze do niego nie dotarła, a w niedzielę nie będę się dokształcał

Trochę jednak potrafię Wykonanie w R skryptu

Kod: Zaznacz cały

x=c(12.4,14.2,14.9,15.6,16.1,16.8,17.3,17.9,18.2,18.6,19.3,19.7,20.4,21.9,22.8,23.7,25.2,25.9,27.4)
shapiro.test(x)
daje

Kod: Zaznacz cały

> x=c(12.4,14.2,14.9,15.6,16.1,16.8,17.3,17.9,18.2,18.6,19.3,19.7,20.4,21.9,22.8,23.7,25.2,25.9,27.4)
+ shapiro.test(x)

	Shapiro-Wilk normality test

data:  x 
W = 0.9716, p-value = 0.8074
Wartość \(\displaystyle{ W=0.9716}\) jest tym, czym \(\displaystyle{ W_d}\) w Krysickim. Sprawdziłem sobie: w Krysickim jest wynik \(\displaystyle{ 0.418}\). Jeśli pomnożę go przez \(\displaystyle{ 730.57}\) i podzielę przez \(\displaystyle{ 314.4053,}\) wychodzi co trzeba. Teraz jeszcze kwestia interpretacji. Mówi się, że obszar odrzucenia \(\displaystyle{ H_0}\) charakteryzuje nierówność \(\displaystyle{ \text{p--value}<\alpha.}\) Tutaj tak nie jest, więc brak podstaw do odrzucenia hipotezy o normalności rozkładu. Poczytam jeszcze w Krysickim.

Poczytałem. Więc poprawne obliczenia zmieniają postać rzeczy - wartość \(\displaystyle{ W=0.9716}\) leży pomiędzy tymi kwantylami, a więc brak podstaw do odrzucenia \(\displaystyle{ H_0.}\)

Na razie jeszcze nie doczytałem się w dokumentacji R, co dokładnie oznacza to p-value. Ale odpowiedzi z R oraz z Krysickiego po poprawieniu błędu zgadzają się.

p-value (p-wartość) to tzw. graniczny poziom istotności. Jeśli nasz poziom istotności \(\displaystyle{ \alpha}\) jest mniejszy od p-wartości, to brak podstaw do odrzucenia hipotezy zerowej. W przypadku przeciwnym odrzucamy ją.
ODPOWIEDZ