Ryby w stawie

Definicja klasyczna. Prawdopodobieństwo warunkowe i całkowite. Zmienne losowe i ich parametry. Niezależność. Prawa wielkich liczb oraz centralne twierdzenia graniczne i ich zastosowania.
max123321
Użytkownik
Użytkownik
Posty: 3388
Rejestracja: 26 maja 2016, o 01:25
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 975 razy
Pomógł: 3 razy

Ryby w stawie

Post autor: max123321 »

W celu oszacowania liczby ryb w stawie złowiono n ryb i po oznakowaniu wypuszczono je z powrotem. Następnie znowu złowiono \(\displaystyle{ n}\) ryb i okazało się, że \(\displaystyle{ k}\) ryb jest oznakowanych. Dla jakiej liczby \(\displaystyle{ N}\) ryb w stawie taki wynik jest najbardziej prawdopodobny?

Pierwszy mój pomysł był, żeby policzyć to prawdopodobieństwo dla pewnej liczby N i potem sprawdzić dla jakiego \(\displaystyle{ N}\) to wyrażenie przyjmuje największą wartość. No więc prawdopodobieństwo, że wśród złapanych ponownie \(\displaystyle{ n}\) ryb, \(\displaystyle{ k}\) będzie oznakowanych wynosi: \(\displaystyle{ \frac{ {N-n \choose n-k} {n \choose k} }{ {N \choose k} } }\), jednak nie potrafię tego wyrażenia zmaksymalizować, więc nie wiem czy tędy droga...

Drugi mój pomysł był oparty na założeniu, że procent ryb oznakowanych do ryb złapanych jest taki sam jak procent ryb oznakowanych do wszystkich ryb w stawie. Jeśli to założenie jest sensowne to można napisać: \(\displaystyle{ \frac{k}{n} \cdot N=n }\), co daje \(\displaystyle{ N= \frac{n^2}{k} }\). Pytanie jednak co jeśli ta liczba jest niecałkowita? Mam pewne wątpliwości czy to jest dobrze, poza tym to dość niedokładne rozumowanie.

Czy może się ktoś wypowiedzieć czy któraś z tych dróg jest dobra i jak ewentualnie dokończyć to zadanie?
Tmkk
Użytkownik
Użytkownik
Posty: 1718
Rejestracja: 15 wrz 2010, o 15:36
Płeć: Mężczyzna
Lokalizacja: Ostrołęka
Podziękował: 59 razy
Pomógł: 501 razy

Re: Ryby w stawie

Post autor: Tmkk »

Oba pomysły są ok.

Co do pierwszego, jest mały błąd, powinno byc \(\displaystyle{ p_N = \frac{ {N-n \choose n-k} {n \choose k} }{ {N \choose \color{red} n} }}\). Aby to zmaksymalizować, sprawdź kiedy ten ciąg rośnie / maleje, tzn policz sobie \(\displaystyle{ \frac{p_{N+1}}{p_{N}} \ge 1}\). Gdy rozpiszesz te symbole Newtona, prawie wszystko się skróci i będzie super prosto.

Co do drugiego, to tak, tak powinno być. Jeśli ta liczba nie jest całkowita, to pewnie trzeba zaokrąglić w górę lub w dół (a może jedno i drugie jest ok?), ale to wszystko będzie widać z obliczeń ze sposobu pierwszego.
janusz47
Użytkownik
Użytkownik
Posty: 7911
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1670 razy

Re: Ryby w stawie

Post autor: janusz47 »

Metoda największej wiarygodności (MNW).
max123321
Użytkownik
Użytkownik
Posty: 3388
Rejestracja: 26 maja 2016, o 01:25
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 975 razy
Pomógł: 3 razy

Re: Ryby w stawie

Post autor: max123321 »

Tak, racja, tam się pomyliłem, ale miałem to na myśli.

Wyszło mi, że \(\displaystyle{ \frac{P_{N+1}}{P_N} \ge 1 }\) dla \(\displaystyle{ N \le \frac{n^2-k}{k} }\), czyli z tego by wynikało, że największe \(\displaystyle{ P}\) jest w przybliżeniu dla \(\displaystyle{ \frac{n^2-k}{k}+1= \frac{n^2}{k} }\), ale nie wiem jak to będzie z tymi częściami całkowitymi. Na bazie przykładowych obliczeń wychodzi mi, że maksimum jest dla podłogi \(\displaystyle{ \left[ \frac{n^2}{k} \right] }\), ale nie wiem jak to jakoś sensownie wytłumaczyć. Możesz mi jakoś to wyjaśnić? A jeszcze druga rzecz skąd wiemy, że będzie jedno maksimum? Czy to wynika z tego, że wyrażenie \(\displaystyle{ \frac{n^2-k}{k} }\), to jakaś stała po prostu?
Tmkk
Użytkownik
Użytkownik
Posty: 1718
Rejestracja: 15 wrz 2010, o 15:36
Płeć: Mężczyzna
Lokalizacja: Ostrołęka
Podziękował: 59 razy
Pomógł: 501 razy

Re: Ryby w stawie

Post autor: Tmkk »

Trzeba na to na spokojnie popatrzeć. Podzielmy na dwa przypadki. Załóżmy najpierw, że \(\displaystyle{ \frac{n^2}{k}}\) jest liczbą całkowitą. Wtedy mamy, że dla \(\displaystyle{ N < \frac{n^2}{k} -1}\) zachodzi \(\displaystyle{ p_{N+1} > p_{N}}\), dla \(\displaystyle{ N = \frac{n^2}{k} - 1}\) jest \(\displaystyle{ p_{N+1} = p_N}\) oraz \(\displaystyle{ N > \frac{n^2}{k} - 1}\) jest \(\displaystyle{ p_{N+1} < p_N}\) - tak Ci wyszło badając ilorazy.

Napiszę to w jednym ciągu:

\(\displaystyle{ p_1 < p_2 < p_3 < \ldots < p_{\frac{n^2}{k}-2} < p_{\frac{n^2}{k}-1} = p_{\frac{n^2}{k}} > p_{\frac{n^2}{k} + 1} > p_{\frac{n^2}{k} + 2} > \ldots}\).

Myślę, że już stąd dobrze widać, że maksimum będzie przyjmowane w dwóch punktach, dla \(\displaystyle{ N = \frac{n^2}{k}-1}\) oraz \(\displaystyle{ N = \frac{n^2}{k}}\)


Ok, to teraz gdy \(\displaystyle{ \frac{n^2}{k}}\) nie jest całkowite, to musimy zapisać to w taki sposób: mamy, że dla \(\displaystyle{ N \le \left[ \frac{n^2}{k}\right] -1}\) zachodzi \(\displaystyle{ p_{N+1} > p_{N}}\), bo \(\displaystyle{ \left[ \frac{n^2}{k}\right] - 1 < \frac{n^2}{k} - 1}\) oraz dla \(\displaystyle{ N \ge \left[ \frac{n^2}{k}\right]}\) jest \(\displaystyle{ p_{N+1} < p_N}\), bo \(\displaystyle{ \left[ \frac{n^2}{k}\right] > \frac{n^2}{k} - 1}\). Wszędzie są ostre nierówności, bo równość była tylko dla \(\displaystyle{ N = \frac{n^2}{k}-1}\), a takiego \(\displaystyle{ N}\) nie można wziąć.

Jak się to zapisze znowu w takim ciągu:

\(\displaystyle{ p_1 < p_2 < p_3 < \ldots < p_{ \left[ \frac{n^2}{k}\right]-2} < p_{ \left[ \frac{n^2}{k}\right]-1} < p_{ \left[ \frac{n^2}{k}\right]} > p_{ \left[ \frac{n^2}{k}\right] + 1} > p_{ \left[ \frac{n^2}{k}\right] + 2} > \ldots}\).

to widać, żę maksimum będzie przyjmowane dla \(\displaystyle{ N = \left[ \frac{n^2}{k}\right]}\).


I tak, \(\displaystyle{ n,k}\) masz dane, to są jakieś liczby, więc wyrażenie \(\displaystyle{ \frac{n^2-k}{k}}\) to po prostu jakaś liczba. Maksimum szukasz globalnego, więc jeśli istnieje, to będzie jedno. Ale jak widać, może się zdarzyć, że będzie przyjmowane w dwóch różnych punktach.
janusz47
Użytkownik
Użytkownik
Posty: 7911
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1670 razy

Re: Ryby w stawie

Post autor: janusz47 »

Metoda Największej Wiarygodności

Tworzymy funkcję wiarygodności wyniku \(\displaystyle{ X^{T} = (x_{1}, x_{2},...,x_{N})}\)

\(\displaystyle{ L_{X}(N) = \frac{{k\choose x}{N-k \choose n-x}}{{N\choose n}} .}\)

gdzie \(\displaystyle{ N }\) jest nieznaną liczbą ryb w jeziorze, \(\displaystyle{ k }\) liczbą ryb oznakowanych, \(\displaystyle{ n }\) liczbą ryb wyłowionych, \(\displaystyle{ x }\) liczbą ryb wyłowionych i oznakowanych.

Tworzymy iloraz wiarygodności

\(\displaystyle{ \frac{L_{X}(N+1)}{L_{X}(N)}= \frac{(N+1 -k)(N+1-n)}{(N+1-k -n +x)(N+1)} }\)

\(\displaystyle{ \frac{L_{X}(N+1)}{L_{X}(N)} \leq 1 \Leftrightarrow N \geq \frac{k\cdot n}{x} -1 }\)

Stąd wynika rozwiązanie w postaci estymatora największej wiarygodności

\(\displaystyle{ \hat{N}(x) = \begin{cases} \lfloor \frac{k\cdot n}{x} \rfloor \ \ \text{gdy}, \ \ \frac{k\cdot n}{x} \notin \ZZ \\
\frac{k\cdot x}{n}, \ \ \text{gdy} \frac{k\cdot x}{n} \ \ \in \ZZ \end{cases} }\)
ODPOWIEDZ