Statystyka RStudio

Mathematica, Matlab, Statistica, LaTeX i wszelkiego rodzaju oprogramowanie przydatne matematykowi w pracy. Miejsca w sieci poświęcone zagadnieniu.
chronoss
Użytkownik
Użytkownik
Posty: 1
Rejestracja: 21 cze 2022, o 14:12
Płeć: Mężczyzna
wiek: 21
Podziękował: 1 raz

Statystyka RStudio

Post autor: chronoss » 21 cze 2022, o 14:39

Dzień dobry!
Czy znalazłaby się jakaś dobra duszyczka która byłaby w stanie pomóc z tymi zadaniami z RStudio?

Zadanie 1.
Narysuj rozkład standaryzowanej średniej, jeśli liczba obserwacji wzrasta.
Wykonaj to dla zmiennej losowej o rozkładzie jednostajnym w przedziale
[0, 1]. Wykonaj symulację dla n=10, 25, 100 obserwacji oraz 1000
powtórzeń. Czy kształt krzywej gęstości staje się normalny?

Zadanie 2.
W pewnym mieście stwierdzono, że liczba wypadków komunikacyjnych
przypadająca na każdy dzień w ciągu 200 dni jest następująca:
Liczba wypadków 0 1 2 3 4 5 6 7 8
Liczba dni 14 31 47 41 29 21 10 5 2
Czy na podstawie tych danych można sądzić, ze liczba wypadków ma rozkład
POISSONA (przyjąć poziom istotności 0.05)?

Zadanie 3.
a. Wczytaj zbiór danych chmiss z pakietu faraway i zapoznaj się ze
zmiennymi tego zbioru.
b. Brakujące dane zastąpić wartością średnią dla danej zmiennej.
c. Zbadać zależność liniową zmiennej involact od pozostałych zmiennych.
d. Wybrać optymalny model liniowy stosując metodę krokową.

janusz47
Użytkownik
Użytkownik
Posty: 7175
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 27 razy
Pomógł: 1547 razy

Re: Statystyka RStudio

Post autor: janusz47 » 22 cze 2022, o 20:32

Zadanie 2

Test zgodnośći \(\displaystyle{ \chi^2 }\)

1.
Estymujemy nieznany parametr \(\displaystyle{ \overline{\lambda}}\) rozkładu Poissona za pomocą Metody Największej Wiarygodności (MNW). Tym estymatorem jak wiemy jest średnia z próby.

2.
Wyznaczamy wartości prawdopodobieństw dla rozkładu Poissona:

\(\displaystyle{ p_{i} = P_{i}(\overline{\lambda}) = \frac{\overline{\lambda}^{i}}{i!}e^{-\overline{\lambda}}, \ \ i =0,1,2,3,4,5,6,7,8}\)

3.
Obliczamy wartość statystyki testowej

\(\displaystyle{ \chi^2 = \sum_{i=0}^{8} \frac{(n_{i}- n\cdot p_{i})^2}{n\cdot p_{i}}.}\)

Statystyka testowa ma asymptotyczny rozkład \(\displaystyle{ \chi^2}\) z \(\displaystyle{ \nu = k + d - 1}\) stopniami swobody,

gdzie:

\(\displaystyle{ k = 9}\)- liczba poziomów dyskretnej zmiennej losowej,

\(\displaystyle{ d = 1}\) - liczba estymowanych parametrów za pomocą MNW.

4.
Z tablicy rozkładu \(\displaystyle{ \chi^2}\) lub programu komputerowego np. R, Sudia R dla danego poziomu istotności testu \(\displaystyle{ 0,95 }\) i \(\displaystyle{ 9 }\) stopni swobody odczytujemy wartość \(\displaystyle{ k}\) statystyki \(\displaystyle{ \chi^2.}\)

5.
Jeśli wartość statystyki \(\displaystyle{ \chi^2 \in [ k, \ \ \infty) = K }\) - to hipotezę zerową odrzucamy, przyjmując alternatywną, że liczbę wypadków nie można modelować rozkładem Poissona.

Dodano po 54 minutach 4 sekundach:
Sprawdzenie ręcznego rozwiązania w Programie R (RStudio nie używam)

\(\displaystyle{ chisq.test ( c ( 14, 31, 47, 41, 29, 21, 10, 5, 2), }\)
\(\displaystyle{ p = c( ......... )) }\)
\(\displaystyle{ qchisq(df = 9, p = 0.95). }\)

Pamiętajmy, że żeby zadziałał test - prawdopodobieństwa \(\displaystyle{ p(...) }\) muszą sumować się do jedynki.

ODPOWIEDZ