Statystyka dostateczna

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
adam4990
Użytkownik
Użytkownik
Posty: 31
Rejestracja: 6 kwie 2017, o 08:59
Płeć: Mężczyzna
Lokalizacja: Polska
Podziękował: 1 raz

Statystyka dostateczna

Post autor: adam4990 »

Niech \(\displaystyle{ X_{1}, X _{2},..., X_{n}}\) - niezależne zmienne losowe o rozkładach \(\displaystyle{ N( a_{i}^{t}b,c)}\) dla \(\displaystyle{ i=1,2,...,n}\)

\(\displaystyle{ a_{i}^{t}}\) - znany wektor wymiaru k
\(\displaystyle{ b}\) - nieznany wektor parametrów wymiaru k
\(\displaystyle{ c}\) - nieznana wariancja

Jaka jest k+1 wymiarowa statystyka dostateczna ze względu na nieznane parametry \(\displaystyle{ b}\) i \(\displaystyle{ c}\)?

Czy jeśli statystyka ma być k+1 wymiarowa, to oznacza to, że musimy mieć \(\displaystyle{ T_{1}(x),..., T_{k+1}(x)}\)?

Atakowałbym to zadanie zaczynając od rozkładu łącznego: \(\displaystyle{ f_{b,c}(x)= \prod_{j=1}^{n}f_{b,c}( x_{j})= \frac{1}{(c \sqrt{2 \pi } ) ^{n} }exp[ \frac{-1}{2c} \sum_{j=1}^{n}(x_{j}-a_{i}^{t}b) ^{2}]}\) Dalej można rozwinąć ten kwadrat w \(\displaystyle{ exp}\), ale dalej nie ma pomysłu, jak to zrobić, żeby dostać wymiar k+1.
Ostatnio zmieniony 13 paź 2017, o 06:46 przez adam4990, łącznie zmieniany 1 raz.
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5220 razy

Re: Statystyka dyskretna

Post autor: Premislav »

Chyba w nazwie wątku miało być "dostateczna".
Co do rozwiązania, myślę, że dobrze zacząłeś i dalej kryterium faktoryzacji (Neymana) może pomóc.
adam4990
Użytkownik
Użytkownik
Posty: 31
Rejestracja: 6 kwie 2017, o 08:59
Płeć: Mężczyzna
Lokalizacja: Polska
Podziękował: 1 raz

Statystyka dostateczna

Post autor: adam4990 »

Rzeczywiście - nazwa powinna być "statystyka dostateczna".

Postępując analogicznie do znalezionych przykładów z faktoryzacji rozkładu normalnego dostajemy:
\(\displaystyle{ T(x)= (\sum_{j=1}^{n} x_{j}, \sum_{j=1}^{n} x_{j}^{2})}\), ale ta statystyka ma wymiar 2, a nie wymiar k+1.

Wymiar statystyki zależy od liczby nieznanych parametrów?

Wpadłem jeszcze na taki pomysł:w rozwinięciu kwadratu pojawia nam się wyraz \(\displaystyle{ -2 x_{j} a_{i}b}\). Wiemy, że a i b są wymiaru k. Możemy składniki pogrupować tak: \(\displaystyle{ -2 a_{1} b_{1} \sum_{j=1}^{n} x_{j} -2 a_{2} b_{2} \sum_{j=1}^{n}x_{j}-...-2 a_{k} b_{k} \sum_{j=1}^{n}x_{j}}\) takich składników jest k i jeszcze pozostaje nam składnik \(\displaystyle{ \sum_{j=1}^{n}x_{j}^{2}}\)

Czyli z tego wynikałoby, że \(\displaystyle{ T(x)= (\sum_{j=1}^{n} x_{j}, \sum_{j=1}^{n} x_{j}, \sum_{j=1}^{n} x_{j}, ..., \sum_{j=1}^{n} x_{j}, \sum_{j=1}^{n} x_{j}^{2})}\), gdzie składnik \(\displaystyle{ \sum_{j=1}^{n} x_{j}}\) występuje k razy. Czy to jest ok? Wtedy statystyka ma wymiar k+1
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5220 razy

Re: Statystyka dostateczna

Post autor: Premislav »

Wymiar statystyki zależy od liczby nieznanych parametrów?
No tak.
Tam jednak wyżej jakieś drobne uchybienia wystąpiły: jak na mój gust winno być
\(\displaystyle{ f_{b,c}(x)= \prod_{j=1}^{n}f_{b,c}( x_{j})= \frac{1}{(c \sqrt{2 \pi } ) ^{n} }\exp[ \frac{-1}{2c^{\red 2}} \sum_{j=1}^{n}(x_{j}-a_{{\red j}}^{t}b) ^{2}]}\)
bo chyba chodzi o to, że dla j-tej (czy tam i-tej, to akurat można zamienić, ale konsekwentnie) zmiennej losowej mamy j-ty (czy tam i-ty, jak wyżej) wektor, którego iloczyn skalarny z tym \(\displaystyle{ b}\) to jest średnia \(\displaystyle{ X_j}\).
Poza tym Twoje rozwiązanie wygląda dobrze. Odpowiadając na Twoje pytanie z PW - nieważne, czy dorzucimy jakieś \(\displaystyle{ a_j}\) w tej statystyce, \(\displaystyle{ a_j}\) są znane, więc nie musimy.
adam4990
Użytkownik
Użytkownik
Posty: 31
Rejestracja: 6 kwie 2017, o 08:59
Płeć: Mężczyzna
Lokalizacja: Polska
Podziękował: 1 raz

Re: Statystyka dostateczna

Post autor: adam4990 »

Ale chyba w \(\displaystyle{ exp}\) powinno być samo c, a nie kwadrat. C to jest już wariancja. W takim razie w ułamku przed \(\displaystyle{ exp}\) c powinno być pod pierwiastkiem. Mam rację?
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5220 razy

Re: Statystyka dostateczna

Post autor: Premislav »

Tak, sorry, ja nie wiem skąd wziąłem, że \(\displaystyle{ c}\) to odchylenie standardowe, przyzwyczajenia okazują się silniejsze.-- 14 paź 2017, o 16:14 --No po prostu czytać nie umiem, taka jest prawda.
ODPOWIEDZ