O definicji dystrybuanty zmiennej losowej

Zbiór wzorów, definicji i najczęściej poruszanych problemów z probabilistyki oraz statystyki matematycznej.
szw1710

O definicji dystrybuanty zmiennej losowej

Post autor: szw1710 »

Niech \(\displaystyle{ X}\) będzie zmienną losową. W literaturze istnieją dwie równoprawne (ale - jak zaraz zobaczymy - nie równoważne) definicje dystrybuanty. Niech \(\displaystyle{ x\in\mathbb{R}.}\) Określmy

\(\displaystyle{ F_<(x)=P(X<x)\,,\qquad F_{\le}(x)=P(X\le x)\,.}\)

Z tej definicji widać natychmiast, że obie funkcje są niemalejące.

Mamy oczywiście

\(\displaystyle{ F_{\le}(x)=P(X\le x)=P(X<x)+P(X=x)=F_<(x)+P(X=x)\,.}\)

Dla zmiennych losowych ciągłych obie funkcje są więc identyczne, gdyż dla każdego \(\displaystyle{ x\in\mathbb{R}}\) mamy \(\displaystyle{ P(X=x)=0.}\) Ponadto dystrybuanta jest wtedy funkcją ciągłą.

Inaczej jest dla zmiennych losowych skokowych (dyskretnych), gdzie prawdopodobieństwa przyjmowania przez te zmienne konkretnych wartości mogą być niezerowe. Funkcja \(\displaystyle{ F_<}\) jest lewostronnie ciągła, a funkcja \(\displaystyle{ F_{\le}}\) jest prawostronnie ciągła.

Przykład. Rzucamy dwukrotnie symetryczną monetą. Niech \(\displaystyle{ X}\) będzie liczbą wyrzuconych orłów. Zmienna losowa \(\displaystyle{ X}\) ma następujący rozkład:
\(\displaystyle{
\begin{array}{|c|c|}
\hline
\text{Liczba orłów}&\text{Prawdopodobieństwo}\\
x_i&p_i\\\hline
0&0.25\\
1&0.50\\
2&0.25\\\hline
\end{array}}\)
Wyznaczymy obie dystrybuanty. Najpierw niech \(\displaystyle{ x<0.}\) Wtedy \(\displaystyle{ P(X\le x)=0,}\) więc tym bardziej \(\displaystyle{ P(X<x)=0}\) i \(\displaystyle{ F_<(x)=F_{\le}(x)=0.}\) Niech teraz \(\displaystyle{ x=0.}\) Wtedy \(\displaystyle{ F_<(x)=F_<(0)=P(X<0)=0,}\) ale \(\displaystyle{ F_{\le}(x)=F_{\le}(0)=P(X\le 0)=P(X<0)+P(X=0)=0.25.}\)

Niech \(\displaystyle{ 0<x<1}\). Mamy \(\displaystyle{ F_<(x)=P(X<x)=P(X=0)=0.25.}\) Druga dystrybuanta ma wartość \(\displaystyle{ F_{\le}(x)=P(X\le x)=P(X=0)=0.25}\). Ale sytuacja zmienia się dla \(\displaystyle{ x=1:}\) \(\displaystyle{ F_<(1)=P(X<1)=P(X=0)=0.25}\) wobec \(\displaystyle{ F_{\le}(1)=P(X=0)+P(X=1)=0.25+0.50=0.75.}\)

Rozumując podobnie dla \(\displaystyle{ 1<x<2,}\) \(\displaystyle{ x=2}\) oraz \(\displaystyle{ x>2,}\) dochodzimy do postaci obu dystrybuant. Sporządzimy ich wykresy.
\(\displaystyle{ $\footnotesize
\begin{tikzpicture}[>=stealth,thick]
\draw[gray!50,step=0.5] (-2.5,-0.5) grid (4,1.5);
\draw[->] (-2.5,0)--(4,0) node[right,below]{$x$};
\draw[->] (0,-0.5)--(0,1.5) node[right]{$y$};
\draw (0.1,1)--(0,1) node[left]{$1.00$};
\draw (0.1,0.75)--(0,0.75) node[left]{$0.75$};
\draw (0.1,0.50)--(0,0.50) node[left]{$0.50$};
\draw (0.1,0.25)--(0,0.25) node[left]{$0.25$};
\node[below] at (0.1,0) {$0$};
\draw (1,0.1)--(1,0) node[below]{$1$};
\draw (2,0.1)--(2,0) node[below]{$2$};
\draw[green!40!black] (-2.5,0)--(0,0);
\fill[green!40!black] (0,0) circle(2pt);
\draw[green!40!black] (0,0.25) circle(2pt) (2pt,0.25)--(1,0.25);
\fill[green!40!black] (1,0.25) circle(2pt);
\draw[green!40!black] (1,0.75) circle(2pt) (1cm+2pt,0.75)--(2,0.75);
\fill[green!40!black] (2,0.75) circle(2pt);
\draw[green!40!black] (2,1) circle(2pt) (2cm+2pt,1)--(4,1) node[below]{$y=F_<(x)$};
\end{tikzpicture}
\begin{tikzpicture}[>=stealth,thick]
\draw[gray!50,step=0.5] (-2.5,-0.5) grid (4,1.5);
\draw[->] (-2.5,0)--(4,0) node[right,below]{$x$};
\draw[->] (0,-0.5)--(0,1.5) node[right]{$y$};
\draw (0.1,1)--(0,1) node[left]{$1.00$};
\draw (0.1,0.75)--(0,0.75) node[left]{$0.75$};
\draw (0.1,0.50)--(0,0.50) node[left]{$0.50$};
\draw (0.1,0.25)--(0,0.25) node[left]{$0.25$};
\node[below] at (0.1,0) {$0$};
\draw (1,0.1)--(1,0) node[below]{$1$};
\draw (2,0.1)--(2,0) node[below]{$2$};
\draw[red!50!black] (-2.5,0)--(-2pt,0) (0,0) circle(2pt);
\fill[red!50!black] (0,0.25) circle(2pt);
\draw[red!50!black] (2pt,0.25)--(1cm-2pt,0.25) (1,0.25) circle(2pt);
\fill[red!50!black] (1,0.75) circle(2pt);
\draw[red!50!black] (1cm+2pt,0.75)--(2cm-2pt,0.75) (2,0.75) circle(2pt);
\fill[red!50!black] (2,1) circle(2pt);
\draw[red!50!black] (2cm+2pt,1)--(4,1) node[below]{$y=F_{\le}(x)$};
\end{tikzpicture}}\)
Funkcja \(\displaystyle{ F_{\le}}\) bardziej odpowiada temu, co w statystyce opisowej nazywamy częstościami skumulowanymi. Mianowicie utożsamiając wartości zmiennej losowej skokowej z wartościami badanej w statystyce cechy, wartości dystrybuanty \(\displaystyle{ F_{\le}}\) w punktach skoków są częstościami skumulowanymi wartości cechy. Być może dlatego niektóre podręczniki statystyki preferują nazywać dystrybuantą funkcję \(\displaystyle{ F_{\le}}\) (np. Jóźwiak, Podgórski, Statystyka od podstaw, PWE Warszawa, 2000).

Widzimy, że dystrybuanty \(\displaystyle{ F_<}\) i \(\displaystyle{ F_{\le}}\) różnią się tylko w punktach skoków. Ma to jednak swoje konsekwencje.

Wróćmy na moment do dystrybuanty zmiennej losowej ciągłej (oznaczmy ją teraz przez \(\displaystyle{ F}\)). Otóż mamy

\(\displaystyle{ P(a<X<b)=P(a\le X<b)=P(a<X\le b)=P(a\le X\le b)=F(b)-F(a).}\)

I znów dla zmiennych losowych skokowych notujemy inne zachowanie. Niech \(\displaystyle{ f(x_+)}\) oznacza granicę prawostronną funkcji \(\displaystyle{ f}\) w punkcie \(\displaystyle{ x}\). Przez \(\displaystyle{ f(x_-)}\) oznaczymy granicę lewostronną. Ponieważ obie dystrybuanty \(\displaystyle{ F_<}\) i \(\displaystyle{ F_{\le}}\) są monotoniczne, więc mają w każdym punkcie obie granice jednostronne. Można zauważyć, że

\(\displaystyle{ F_{\le}(x)=F_<(x_+)\,,\qquad F_<(x)=F_{\le}(x_-)\,.}\)

Zachodzą następujące wzory:

\(\displaystyle{ \begin{aligned}
P(a<X<b)&=F_<(b)-F_{\le}(a)=F_<(b)-F_<(a_+)=F_{\le}(b_-)-F_{\le}(a)\\
P(a\le X<b)&=F_<(b)-F_<(a)=F_{\le}(b_-)-F_{\le}(a_-)\\
P(a<X\le b)&=F_{\le}(b)-F_{\le}(a)=F_<(b_+)-F_<(a_+)\\
P(a\le X\le b)&=F_{\le}(b)-F_<(a)=F_<(b_+)-F_<(a)=F_{\le}(b)-F_{\le}(a_-)
\end{aligned}}\)
ODPOWIEDZ