Całka z rozkładu normalnego

matemix · Post autor: **matemix** » 11 sie 2011, o 08:50

Szukam dowodu twierdzenia, że dla rozkładu dwumianowego przy ilości prób \(\displaystyle{ n}\) dążącej do nieskończoności i \(\displaystyle{ p=0,5}\) suma jego wartości od wartości pierwszej do wartości \(\displaystyle{ n \cdot (0,5+y)}\) podzielona przez sumę wszystkich wartości (od 1 do n) czyli przez \(\displaystyle{ 2^{n}}\) dąży do 1. Przy czym \(\displaystyle{ y}\) to dowolna stała większa od 0 i mniejsza od 0,5.

Rozkład dwumianowy, gdy liczba prób \(\displaystyle{ n}\) dąży do nieskończoności jest zbieżny do rozkładu normalnego \(\displaystyle{ N~(np, np(1-p))}\). Możnaby zatem zbadać ile wynosi ta granica dla rozkładu normalnego przy \(\displaystyle{ \mu=n \cdot 0,5}\) oraz \(\displaystyle{ \sigma=n \cdot 0,25}\). Rozkład normalny dany jest wzorem:

\(\displaystyle{ f(\mu,\sigma,x) = \frac {1} {\sigma \cdot (2 \pi)^{0,5}} \cdot e^{\frac {-(x-\mu)^{2}}{2 \cdot (\sigma)^{2}}}}\)

Należałoby zatem obliczyć granicę:

\(\displaystyle{ \lim_{n\to\infty} \frac {\int\limits_{0}^{(0,5+y) \cdot n} \frac {1} {0,25 \cdot n \cdot (2 \pi)^{0,5}} \cdot e^{\frac {-(x-0,5 \cdot n)^{2}}{0,125 \cdot n^{2}}} dx} {\int\limits_{0}^{n} \frac {1} {0,25 \cdot n \cdot (2 \pi)^{0,5}} \cdot e^{\frac {-(x-0,5 \cdot n)^{2}}{0,125 \cdot n^{2}}} dx}}\)

I udowodnić, że wynosi ona \(\displaystyle{ 1}\), dla każdego \(\displaystyle{ 0,5>y>0}\). Nie wiem jednak jak to zrobić, wychodzą mi dziwne wyniki. Może gdzieś popełniam błąd w założeniach?

Post autor: **Chromosom** » 11 sie 2011, o 20:10

podstaw w każdej z całek \(\displaystyle{ \sqrt8\cdot\frac{x-\frac12n}{n}=t}\); otrzymasz w ten sposób znaną całkę

matemix · Post autor: **matemix** » 12 sie 2011, o 13:54

Hmm.

-- 12 sierpnia 2011, 15:44 --

Doszedłem do wniosku, że dolna granica całkowania powinna wynosić chyba minus nieskończoność, a nie 0.

Wychodzi mi, że:

\(\displaystyle{ \int\limits_{-\infty}^{\left(0,5+y\right) \cdot k} \frac {1} {0,25 \cdot n \cdot \left(2 \pi\right)^{0,5}} \cdot e^{\frac {-\left(x-0,5 \cdot n\right)^{2}}{0,125 \cdot n^{2}}} \,\text{d}x = \mathrm{erf}\left(2^{\frac {1} {2}}\right) - \frac {1} {2} \mathrm{erf}\left(2^{\frac {1} {2}} - \frac {k \cdot 2 \cdot 2^{\frac {1} {2}} \cdot \left(y+ \frac {1} {2}\right)} {n}\right) + \frac {1} {2}\mathrm{erfc}\left(2^{\frac {1} {2}}\right)}\)

Natomiast całka w mianowniku powinna być równa 1 niezależnie od \(\displaystyle{ n}\):

\(\displaystyle{ \int\limits_{-\infty}^{\infty} \frac {1} {0,25 \cdot n \cdot \left(2 \pi\right)^{0,5}} \cdot e^{\frac {-\left(x-0,5 \cdot n\right)^{2}}{0,125 \cdot n^{2}}} \,\text{d}x = 1}\)

No i w żaden sposób nie wynika z tego to co chciałem udowodnić, gdy \(\displaystyle{ k=n}\) to nie ma sensu liczyć nawet żadnej granicy, bo \(\displaystyle{ n}\) znika. Ponad to dla pewnego ustalonego \(\displaystyle{ y}\) zwiększanie \(\displaystyle{ n}\) wcale nie zwiększa wartości całki, a powinno. Albo to jest źle policzone albo te wzory nijak się mają do rozkładu dwumianowego.

Post autor: **Chromosom** » 13 sie 2011, o 22:55

Zwróć uwagę że wyrażenie \(\displaystyle{ n(0.5+y)}\) może przyjmować wartości nie należące do zbioru liczb naturalnych, a liczba prób musi się taką liczbą wyrażać. W tej chwili proponuję najpierw skorzystać z definicji rozkładu dwumianowego bez wykorzystania rozkładu normalnego; odwołanie się do przybliżenia być może będzie użyteczne w dalszej części rozwiązania. Ale najpierw popraw treść zadania.

matemix · Post autor: **matemix** » 14 sie 2011, o 04:18

Chromosom pisze:Zwróć uwagę że wyrażenie \(\displaystyle{ n(0.5+y)}\) może przyjmować wartości nie należące do zbioru liczb naturalnych, a liczba prób musi się taką liczbą wyrażać.

No tak, powinno tam być zaokrąglenie do liczby całkowitej z tej liczby.

W tej chwili proponuję najpierw skorzystać z definicji rozkładu dwumianowego bez wykorzystania rozkładu normalnego; odwołanie się do przybliżenia być może będzie użyteczne w dalszej części rozwiązania.

Właśnie z definicji rozkładu dwumianowego nie wiem jak to rozwiązać. Dlatego próbuję całkować ten rozkład normalny.

Post autor: **Chromosom** » 14 sie 2011, o 13:54

Mówiąc o rozkładzie dwumianowym miałem na myśli żeby najpierw zapisać wyrażenie, którego wartość jest szukana, za pomocą jego definicji. Bardziej odpowiadają mi rozwiązania na symbolach, zatem tutaj przyjmę \(\displaystyle{ 0.5=p}\); Ty możesz w swoim rozwiązaniu postąpić inaczej. Teza jest następująca:

\(\displaystyle{ \lim_{n\to\infty}\frac{\sum\limits^{\lfloor n(p+y)\rfloor}_{k=1}{n\choose k}p^k(1-p)^{n-k}}{\sum\limits^n_{k=1}{n\choose k}p^k(1-p)^{n-k}}=1}\)

wartość wyrażenia znajdującego się w mianowniku jest równa 1, co wynika z własności dystrybuanty (fakt ten można udowodnić za pomocą dwumianu Newtona), zatem wystarczy udowodnić, że wartość wyrażenia znajdującego się w liczniku również jest równa 1. I tutaj właśnie musisz obliczyć wartość tej całki, której postać już znalazłeś. Z moich obliczeń wynika że wartość tej całki rzeczywiście wynosi 1; pokaż dokładniejsze obliczenia, wtedy będzie można sprawdzić, gdzie popełniłeś błąd. Posłuż się standaryzacją rozkładu normalnego.

matemix · Post autor: **matemix** » 18 sie 2011, o 02:07

Chromosom pisze:[...] wystarczy udowodnić, że wartość wyrażenia znajdującego się w liczniku również jest równa 1. I tutaj właśnie musisz obliczyć wartość tej całki, której postać już znalazłeś. Z moich obliczeń wynika że wartość tej całki rzeczywiście wynosi 1; pokaż dokładniejsze obliczenia, wtedy będzie można sprawdzić, gdzie popełniłeś błąd. Posłuż się standaryzacją rozkładu normalnego.

Tylko mam wątpliwości ile powinna wynosić dolna granica tej całki. W rozkładzie dwumianowym mamy sumę od \(\displaystyle{ k=1}\), ale całka powinna być chyba co najmniej od 0, albo od minus nieskończoności, a nie od 1?

Poza tym czy wzór który mam całkować jest aby na pewno poprawny? Napisałem, że:

Rozkład dwumianowy, gdy liczba prób \(\displaystyle{ n}\) dąży do nieskończoności jest zbieżny do rozkładu normalnego \(\displaystyle{ N\sim\left(np, np\left(1-p\right)\right)}\).

Ale chyba we wzorze \(\displaystyle{ N\sim\left(np, np\left(1-p\right)\right)}\) jest błąd, ponieważ po przecinku powinno być odchylenie standardowe, a nie wariancja, zatem \(\displaystyle{ N\sim\left(np, \sqrt{np\left(1-p\right)\right)}}\). Wtedy \(\displaystyle{ \sigma=\sqrt{n \cdot 0,25}}\), a wzór przybiera postać:

\(\displaystyle{ f\left(x, n\right) = \frac {1} {\sqrt{0,25 \cdot n} \cdot \sqrt{2 \pi}} \cdot e^{\frac {-\left(x-0,5 \cdot n\right)^{2}}{0,5 \cdot n}}}\)

Teraz, gdy policzymy z tego całkę:

\(\displaystyle{ \int\limits_{0}^{\left(0.5+y\right) \cdot n} \frac {1} {\sqrt{0,25 \cdot n} \cdot \sqrt{2 \pi}} \cdot e^{\frac {-\left(x-0,5 \cdot n\right)^{2}}{0,5 \cdot n}} \text{d}x = 0.5 \cdot \mathrm{erf} \left(\frac {\sqrt{2}} {2} \cdot \sqrt{n}\right) + 0.5 \cdot \mathrm{erf} \left(\sqrt{2} \cdot y \cdot \sqrt{n}\right)}\)

Widać teraz, że dla każdego \(\displaystyle{ y}\) przy \(\displaystyle{ n}\) dążącym do nieskończoności otrzymujemy 1.

Zatem gwoli ścisłości - pozostaje pytanie, czy dolna granica ma wynosić 0, czy może \(\displaystyle{ -\infty}\) (choć i tak nie zmieni to wyniku)?

Post autor: **Chromosom** » 18 sie 2011, o 09:30

matemix pisze:Poza tym czy wzór który mam całkować jest aby na pewno poprawny? Napisałem, że:
Rozkład dwumianowy, gdy liczba prób \(\displaystyle{ n}\) dąży do nieskończoności jest zbieżny do rozkładu normalnego \(\displaystyle{ N\sim\left(np, np\left(1-p\right)\right)}\).
Ale chyba we wzorze \(\displaystyle{ N\sim\left(np, np\left(1-p\right)\right)}\) jest błąd, ponieważ po przecinku powinno być odchylenie standardowe, a nie wariancja, zatem \(\displaystyle{ N\sim\left(np, \sqrt{np\left(1-p\right)\right)}}\). Wtedy \(\displaystyle{ \sigma=\sqrt{n \cdot 0,25}}\), a wzór przybiera postać:

\(\displaystyle{ f\left(x, n\right) = \frac {1} {\sqrt{0,25 \cdot n} \cdot \sqrt{2 \pi}} \cdot e^{\frac {-\left(x-0,5 \cdot n\right)^{2}}{0,5 \cdot n}}}\)

Zgadza się, też miałem Ci zwrócić na to uwagę, nie wiem dlaczego w końcu o tym nie napisałem. Odchylenie standardowe ma taką postać jaką podałeś teraz.

matemix pisze:Tylko mam wątpliwości ile powinna wynosić dolna granica tej całki. W rozkładzie dwumianowym mamy sumę od \(\displaystyle{ k=1}\), ale całka powinna być chyba co najmniej od 0, albo od minus nieskończoności, a nie od 1?
[...]
Zatem gwoli ścisłości - pozostaje pytanie, czy dolna granica ma wynosić 0, czy może \(\displaystyle{ -\infty}\) (choć i tak nie zmieni to wyniku)?

Dystrybuanta określa prawdopodobieństwo, że wynik doświadczenia losowego znajdzie się w przedziale od \(\displaystyle{ -\infty}\) do pewnej określonej liczby. Bardziej poprawne jest zatem całkowanie od \(\displaystyle{ -\infty}\)