statystyki porządkowe, statystyka dostateczna

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
_radek
Użytkownik
Użytkownik
Posty: 97
Rejestracja: 23 gru 2008, o 16:34
Płeć: Mężczyzna
Lokalizacja: Janów Lubelski
Podziękował: 16 razy
Pomógł: 6 razy

statystyki porządkowe, statystyka dostateczna

Post autor: _radek »

Mam problem z zadaniem pochodzącym z książki Hogga, wklejam treść, bo może coś przekręciłem/źle zrozumiałem.

Let \(\displaystyle{ Y_{1}<...<Y_{5}}\) be the order statistics of a random sample of size 5 from the uniform distribution having pdf \(\displaystyle{ f(x; \theta) = 1/\theta, 0 < x < \theta, 0 < \theta < \infty}\), zero elsewhere. Show that \(\displaystyle{ 2Y_{3}}\) is an unbiased estimator of \(\displaystyle{ \theta}\). Determine the joint pdf of \(\displaystyle{ Y_{\#}}\) and the sufficient statistic \(\displaystyle{ Y_{5}}\) for \(\displaystyle{ \theta}\). Find the conditional expectation \(\displaystyle{ \mathbb{E}(2Y_{3} | y_{5} ) = \phi(y_{5} )}\) . Compare the variances of \(\displaystyle{ 2Y_{3}}\)and \(\displaystyle{ \phi(y_{1}).}\)

Z pokazaniem że to nie jest obciążony estymator nie mam problemów. Ale nie mam pojęcia co dalej
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5221 razy

statystyki porządkowe, statystyka dostateczna

Post autor: Premislav »

Dogrzebałem się w notatkach (jest też wyprowadzenie w książce Hogga, str. 240-241, jakoś tak) do takiego wzorku: mamy próbę losową prostą \(\displaystyle{ X_{1},...X_{n}}\) i statystyki pozycyjne z tej próby
\(\displaystyle{ Y_{1} \le Y_{2} \le ... \le Y_{n}}\). Zakładamy, że \(\displaystyle{ X_{i}}\) mają gęstość - oznaczmy ją \(\displaystyle{ f}\), \(\displaystyle{ (a,b)}\) jest nośnikiem gęstości (\(\displaystyle{ a}\) może też być \(\displaystyle{ -\infty}\), a \(\displaystyle{ b}\) może być \(\displaystyle{ +\infty}\), ponadto te przedziały mogą być też obustronnie domknięte lub jednostronnie domknięte - to nic nie zmienia z uwagi na abs. ciągłość rozkładu), ponadto niech \(\displaystyle{ F}\) - dystrybuanta wspólnego rozkładu \(\displaystyle{ X_{i}}\). Wtedy gęstość łączna i-tej i j-tej statystyki pozycyjnej (\(\displaystyle{ 1 \le i<j \le n}\)) wyraża się wzorem
\(\displaystyle{ g_{i, j}(y_{i}, y_{j})= \\=\frac{n!}{(i-1)!(j-i-1)!(n-j)!}(F(y_{i}))^{i-1} \cdot (F(y_{j})-F(y_{i}))^{j-i-1}(1-F(y_{j}))^{n-j}f(y_{i})f(y_{j})}\), gdy \(\displaystyle{ a<y_{i} \le y_{j}<b}\)
(poza tym jest wszędzie zero, oczywiście znowuż te nierówności skrajne mogą być nieostre).
Rany boskie, co za sieczka.
A zatem wychodziłoby na to, że w tym zadaniu gęstość rozkładu łącznego \(\displaystyle{ (Y_{3}, Y_{5})}\) to
\(\displaystyle{ g(y_{3}, y_{5})= \begin{cases}\frac{5!}{2!2!} \left(\frac{y_{3}}{\theta}\right)^{2}\left( \frac{y_{5}-y_{3}}{\theta} \right)^{2} \frac{1}{\theta^{2}}, \text{ gdy } 0<y_{3} \le y_{5}<\theta \\ 0, \text{ w przeciwnym wypadku } \end{cases}}\)

Dalej mamy \(\displaystyle{ \mathbb{E}(2Y_{3}|Y_{5}=y_{5})=2\mathbb{E}(Y_{3}|Y_{5}=y_{5})}\) i znajdujemy \(\displaystyle{ \mathbb{E}(Y_{3}|Y_{5}=y_{5})= \int_{0}^{y_{5}}y_{3} \frac{\frac{5!}{2!2!} \left(\frac{y_{3}}{\theta}\right)^{2}\left( \frac{y_{5}-y_{3}}{\theta} \right) \frac{1}{\theta^{2}}}{5 \left(\frac{y_{5}}{\theta}\right)^{4} \cdot \frac{1}{\theta} } \mbox{d}y_{3}= \frac{3}{5}y_{5}}\) (skracamy to, co się da, wyciągamy przed nawias to, co się da, a następnie podstawieniem \(\displaystyle{ y_{3}=y_{5}\cdot z}\) sprowadzamy tę całkę do przeskalowanej całki z gęstości rozkładu beta z odpowiednimi parametrami -\(\displaystyle{ \mathcal{\beta}(3,2)}\)).
Porównanie wariancji zostawiam Tobie, pamiętam, że prawie rozpłakałem się z frustracji, wykonując je przy tablicy, bo nie umiem szybko skracać ułamków. No ale idea tego porównania jest taka, żeby zobaczyć że
\(\displaystyle{ \mathbb{E}(2Y_{3}|Y_{5})}\) jest "fajniejszym" (może lepsze słowo to pewniejszym) estymatorem nieobciążonym parametru \(\displaystyle{ \theta}\) niż \(\displaystyle{ 2Y_{3}}\), gdyż ma mniejszą wariancję. To zadanko może się kojarzyć z twierdzeniem Rao-Blackwella - jest chyba swego rodzaju ilustracją.
_radek
Użytkownik
Użytkownik
Posty: 97
Rejestracja: 23 gru 2008, o 16:34
Płeć: Mężczyzna
Lokalizacja: Janów Lubelski
Podziękował: 16 razy
Pomógł: 6 razy

statystyki porządkowe, statystyka dostateczna

Post autor: _radek »

Dzięki
ODPOWIEDZ