Estymator wariancji

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
Awatar użytkownika
divii
Użytkownik
Użytkownik
Posty: 57
Rejestracja: 9 gru 2006, o 17:45
Płeć: Mężczyzna
Lokalizacja: ja jestem?
Podziękował: 14 razy

Estymator wariancji

Post autor: divii »

Witam,

W jaki sposób można udowodnić, że wariancja empiryczna \(\displaystyle{ S^2_n}\) jest obciążonym estymatorem parametru \(\displaystyle{ \sigma^2}\)?
Awatar użytkownika
Emiel Regis
Użytkownik
Użytkownik
Posty: 1495
Rejestracja: 26 wrz 2005, o 17:01
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 71 razy
Pomógł: 225 razy

Estymator wariancji

Post autor: Emiel Regis »

A wiesz jaka jest definicja estymatora [nie]obciążonego?
Awatar użytkownika
divii
Użytkownik
Użytkownik
Posty: 57
Rejestracja: 9 gru 2006, o 17:45
Płeć: Mężczyzna
Lokalizacja: ja jestem?
Podziękował: 14 razy

Estymator wariancji

Post autor: divii »

\(\displaystyle{ \forall n\in N: E(U_n) = \theta}\)
To \(\displaystyle{ U_n}\) jest estymatorem nieobciążonym parametru \(\displaystyle{ \theta}\).
Awatar użytkownika
Emiel Regis
Użytkownik
Użytkownik
Posty: 1495
Rejestracja: 26 wrz 2005, o 17:01
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 71 razy
Pomógł: 225 razy

Estymator wariancji

Post autor: Emiel Regis »

Otóż to.

Także pozostaje tylko i aż do policzenia wartość oczekiwana naszego estymatora.
Nie będę sie znęcał i Ci policzę; )

\(\displaystyle{ X = (X_1, \ldots, X_n)}\) - próba prosta
Wtedy wiemy że statystyka
\(\displaystyle{ T(X)=\frac{1}{\sigma^2}\sum_{i=1}^n(X_i - \overline{X})^2}\)
ma rozkład chi kwadrat o n-1 stopniach swobody.

Z tablic odczytujemy że jej wartość oczekiwana to liczba stopni swobody czyli:
\(\displaystyle{ ET=n-1}\)

Teraz już możemy policzyć wartość oczekiwaną dwóch najczęsciej używanych estymatorów wariancji:
\(\displaystyle{ E ft ( \frac{1}{n-1}\sum_{i=1}^n(X_i - \overline{X})^2 \right) =\sigma^2\\
E ft (\frac{1}{n}\sum_{i=1}^n(X_i - \overline{X})^2 \right ) =\sigma^2 \frac{n-1}{n}}\)


Także widać od razu który z nich jest nieobciążony a który obciążony.
Oczywiście kluczowa tutaj była znajomość rozkładu statystyki T, jednak znalezienie tego rozkładu jest już mniej elementarne także może uwierz na słowo że tak jest.

Jako ciekawostke dodam że jednostajnie lepszym od obu powyższych jest estymator w którym dzielimy przez n+1.
Awatar użytkownika
divii
Użytkownik
Użytkownik
Posty: 57
Rejestracja: 9 gru 2006, o 17:45
Płeć: Mężczyzna
Lokalizacja: ja jestem?
Podziękował: 14 razy

Estymator wariancji

Post autor: divii »

Wielkie dzięki. Pewien problem jeszcze dla mnie stanowiło obliczenie tych wartości oczekiwanych.
Drizzt pisze: Teraz już możemy policzyć wartość oczekiwaną dwóch najczęsciej używanych estymatorów wariancji:
\(\displaystyle{ E ft ( \frac{1}{n-1}\sum_{i=1}^n(X_i - \overline{X})^2 \right) =\sigma^2\\
E ft (\frac{1}{n}\sum_{i=1}^n(X_i - \overline{X})^2 \right ) =\sigma^2 \frac{n-1}{n}}\)
Na szczęscie udało mi się w międzyczasie znaleźć ten dowód w jednej książce z szczegółowo rozpisanym tym działaniem, więc dalsza pomoc nie jest już mi potrzebna .
Awatar użytkownika
Emiel Regis
Użytkownik
Użytkownik
Posty: 1495
Rejestracja: 26 wrz 2005, o 17:01
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 71 razy
Pomógł: 225 razy

Estymator wariancji

Post autor: Emiel Regis »

Pomyślałem o tym jeszcze raz i stwierdzam że sobie uprościłem; )

Oczywiście wszystko to co było wcześniej jest dobrze, jednak... jest to przeciez dla szczególnego przypadku, ja tam sobie załozylem że to jest próba prosta z rozkładu normalnego. A ów estymator jest nieobciążony dla próby prostej z każdego rozkładu o skończonej wariancji.

To pomyśl jak to zrobić ogólniej (wtedy już nie mamy rozkładu chi kwadrat). Jak nie wymyślisz to powiedz to ja napiszę.

Może podpowiem jak zacząć:

\(\displaystyle{ X=(X_1, \ldots, X_n)}\) - próba prosta z pewnego rozkładu P (powyżej dowód dla \(\displaystyle{ P \mathcal{N}(m, \sigma^2)}\))
\(\displaystyle{ EX_i = m \\ Var(X_i)=\sigma^2 < }\)

\(\displaystyle{ E ft( \sum_{i=1}^n (X_i - \overline{X})^2 \right) = \sum_{i=1}^n E ft ( (X_i-m)+(m-\overline{X}) \right)^2}\)

Po takim sztucznym dopisaniu rozdziel to na trzy sumy i przyjrzyj się każdej bardzo dokładnie. Powinno wyjść oczywiscie \(\displaystyle{ (n-1)\sigma^2}\)
Awatar użytkownika
divii
Użytkownik
Użytkownik
Posty: 57
Rejestracja: 9 gru 2006, o 17:45
Płeć: Mężczyzna
Lokalizacja: ja jestem?
Podziękował: 14 razy

Estymator wariancji

Post autor: divii »

Ale dlaczego liczymy coś takiego?
Drizzt pisze: \(\displaystyle{ E ft( \sum_{i=1}^n (X_i - \overline{X})^2 \right) = \sum_{i=1}^n E ft ( (X_i-m)+(m-\overline{X}) \right)^2}\)
Nie można po prostu przyjąć, tak jak podałeś na początku, że estymator \(\displaystyle{ S^2=\frac{1}{n}\sum_{i=1}^n(X_i-\overline{X})^2}\).
Teraz policzyć według definicji \(\displaystyle{ E(\frac{1}{n}\sum_{i=1}^n(X_i-\overline{X})^2)}\) (to wiem już jak policzyć).
Wyjdzie nam \(\displaystyle{ \sigma^2\frac{n-1}{n}}\).
Oraz sprawdzić warunek czy \(\displaystyle{ E(U_n)=\theta}\) (oczywiście nie jest spełniony).
Awatar użytkownika
Emiel Regis
Użytkownik
Użytkownik
Posty: 1495
Rejestracja: 26 wrz 2005, o 17:01
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 71 razy
Pomógł: 225 razy

Estymator wariancji

Post autor: Emiel Regis »

Tzn. tak, w temacie spytałeś jak pokazać że dany estymator jest obciażony, tak więc to mozna zrobić po prostu przez kontrprzykład, wiec pokazałem Ci jako przyklad rozkład normalny.

Natomiast gdybyś chciał w ogólności pokazać jaki jest nieobciążony estymator to juz nie wolno nam zakładać normalnosci, a co za tym idzie że ta statystyka T ma rozkład chi kwadrat.
Mam nadzieje że jest to już jasne. Jeśli nie to pytaj.
ODPOWIEDZ