Centralne twierdzenie graniczne

Definicja klasyczna. Prawdopodobieństwo warunkowe i całkowite. Zmienne losowe i ich parametry. Niezależność. Prawa wielkich liczb oraz centralne twierdzenia graniczne i ich zastosowania.
Karka20
Użytkownik
Użytkownik
Posty: 27
Rejestracja: 24 lis 2021, o 15:33
Płeć: Mężczyzna
wiek: 20
Podziękował: 8 razy

Centralne twierdzenie graniczne

Post autor: Karka20 »

W budynku są dwie szatnie: A i B, z których chce skorzystać 900 osób. Wybierają między A i B losowo i niezależnie.
• Niech \(\displaystyle{ X_{A}}\) , \(\displaystyle{ X_{B}}\) oznaczają liczbę osób, którzy skorzystali odpowiednio z szatni \(\displaystyle{ A}\) lub \(\displaystyle{ B}\). Przybliż prawdopodobieństwo, że \(\displaystyle{ |X_{A}-X_{B}|}\) jest większa niż \(\displaystyle{ 30}\) i znajdź błąd tego przybliżenia.
• Załóżmy, że jest \(\displaystyle{ N}\) osób (zamiast \(\displaystyle{ 900}\)). Przybliż najmniejszą wartość \(\displaystyle{ N}\), dla której \(\displaystyle{ P(|X_{A}-X_{B}|>30)}\) jest większe niż \(\displaystyle{ 0,1}\).

Nie do końca wiem co zrobić z wartością bezwzględna. Proszę o wskazówkę :)
3a174ad9764fefcb
Użytkownik
Użytkownik
Posty: 272
Rejestracja: 18 lip 2022, o 17:46
Płeć: Mężczyzna
wiek: 41
Podziękował: 3 razy
Pomógł: 43 razy

Re: Centralne twierdzenie graniczne

Post autor: 3a174ad9764fefcb »

Warunek \(|X_A-X_B|>30\) zamienia się na alternatywę dwóch nierówności: \(X_A-X_B>30\) lub \(X_A-X_B<-30\). Wiemy, że \(X_B=900-X_A\), stąd możemy dostać nierówności tylko ze zmienną \(X_A\).
janusz47
Użytkownik
Użytkownik
Posty: 8035
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1707 razy

Re: Centralne twierdzenie graniczne

Post autor: janusz47 »

Jaką dostajemy nierówność tylko ze zmienną losową \(\displaystyle{ X_{A} ? }\)
3a174ad9764fefcb
Użytkownik
Użytkownik
Posty: 272
Rejestracja: 18 lip 2022, o 17:46
Płeć: Mężczyzna
wiek: 41
Podziękował: 3 razy
Pomógł: 43 razy

Re: Centralne twierdzenie graniczne

Post autor: 3a174ad9764fefcb »

Nie spodziewałem się tego pytania, ale spróbuję coś wymyślić. Równość \(X_B=900-X_A\) oznacza, że wszędzie, gdzie występuje \(X_B\), możemy je zastąpić przez \((900-X_A)\). W takim razie wspomniane wcześniej nierówności możemy zamienić na: \(X_A-(900-X_A)>30\) lub \(X_A-(900-X_A)<-30\). To już są nierówności, w których występuje tylko zmienna \(X_A\).

Podsumowując, jeśli \(X_A\) i \(X_B\) spełniają którąś z nierówności: \(X_A-X_B>30\) lub \(X_A-X_B<-30\), to warunki zadania pozwalają stwierdzić, że \(X_A-(900-X_A)>30\) lub \(X_A-(900-X_A)<-30\). Czy do tej pory wszystko jest jasne?

Przejdźmy do sprawy trudniejszej. Jeśli \(X_A-(900-X_A)>30\) lub \(X_A-(900-X_A)<-30\), to korzystając z równości \(X_B=900-X_A\) możemy stwierdzić w drugą stronę, że \(X_A-X_B>30\) lub \(X_A-X_B<-30\). Zatem przy założeniu warunków zadania oba zestawy nierówności są równoważne.

Możemy już zająć się sprawą najtrudniejszą. Powyższe nierówności możemy zastąpić przez: \(X_A>465\) lub \(X_A<435\). Wydaje mi się to prawdą, ale jeszcze myślę nad dowodem. Jeśli to się uda, to potem już wystarczy skorzystać z Centralnego Twierdzenia Granicznego (o ile znamy prawdopodobieństwa, z jakimi ktoś wybiera szatnię \(A\) lub \(B\)).
janusz47
Użytkownik
Użytkownik
Posty: 8035
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1707 razy

Re: Centralne twierdzenie graniczne

Post autor: janusz47 »

Zdarzenie \(\displaystyle{ |X_{A} -X_{B}|> 30 }\) przedstawiamy w postaci sumy zdarzeń:

\(\displaystyle{ \{X_{B}-X_{A} > 30\} \cup \{X_{B} -X_{A} \leq -30 \} \ \ (S) }\)

Stosujemy Integralne Twierdzenie Graniczne de'Moivre'a Laplace'a dla różnicy zmiennych losowych o rozkładach Bernoulliego:

\(\displaystyle{ X_{1}\sim\mathcal{B}_{1} \left (450,\frac{1}{2}\right), \ \ X_{2}\sim \mathcal{B} \left (450, \frac{1}{2}\right). }\)

Wartość średnia różnicy zmiennych losowych:

\(\displaystyle{ \mu_{X_{A}-X_{B}} = \mu_{X_{A}} - \mu_{X_{B}} = 450\cdot \frac{1}{2} - 450\cdot \frac{1}{2}=0. }\)

Wariancja różnicy zmiennych losowych:

\(\displaystyle{ \sigma^2_{X_{1} - X_{2}} = 450\cdot \frac{1}{2}\cdot \frac{1}{2} + 450\cdot \frac{1}{2}\cdot \frac{1}{2} = 900\cdot \frac{1}{4}= 225.}\)

Odchylenie standardowe różnicy zmiennych losowych:

\(\displaystyle{ \sigma_{X_{1} - X_{2}} = \sqrt{225} = 15.}\)

Zmienna losowa standaryzowana o rozkładzie normalnym \(\displaystyle{ \mathcal{N}(0,1):}\)

\(\displaystyle{ Z = \frac{(X_{A}- X_{B}) - (\mu_{X_{A}- X_{B}})}{\sigma_{X_{1} - X_{2}}}}\)

Proszę obliczyć wartość prawdopodobieństwa sumy zdarzeń \(\displaystyle{ (S), }\) korzystając ze standaryzacji \(\displaystyle{ Z.}\)
3a174ad9764fefcb
Użytkownik
Użytkownik
Posty: 272
Rejestracja: 18 lip 2022, o 17:46
Płeć: Mężczyzna
wiek: 41
Podziękował: 3 razy
Pomógł: 43 razy

Re: Centralne twierdzenie graniczne

Post autor: 3a174ad9764fefcb »

janusz47 pisze: 4 wrz 2022, o 20:06 Wariancja różnicy zmiennych losowych:

\(\displaystyle{ \sigma^2_{X_{1} - X_{2}} = 450\cdot \frac{1}{2}\cdot \frac{1}{2} + 450\cdot \frac{1}{2}\cdot \frac{1}{2} = 900\cdot \frac{1}{4}= 225.}\)
Nie wiem, o co tu chodzi. Przypuszczam że stały się tu trzy rzeczy:
  • zmienne \(X_A\) i \(X_B\) zmieniły nazwy na \(X_1\) i \(X_2\),
  • we wzorze na wariancję każdej z tych zmiennych wzięto wartość średnią zamiast liczby prób,
  • błędnie założono, że zmienne te są niezależne.
Wariancja zmiennej \(X_A-X_B=2X_A-900\) jest równa:
\(4\mathrm{Var}(X_A)=4\cdot900\cdot\frac12\cdot\frac12=900.\)
janusz47
Użytkownik
Użytkownik
Posty: 8035
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1707 razy

Re: Centralne twierdzenie graniczne

Post autor: janusz47 »

- jak obliczamy wariancję zmiennej losowej o rozkładzie Bernoulliego?

- jakie własności ma wariancja ?

-jak obliczamy wariancję różnicy dwóch zmiennych losowych ?

\(\displaystyle{ 1, 2, }\) zamiast \(\displaystyle{ A, B, }\) to literówka ?

- jaka jest postać CTG dla różnicy dwóch zmiennych losowych ?

- z treści zadania wynika, że wybór szatni przez osoby jest losowy, czy jest zależny od innych osób ?

\(\displaystyle{ P(\{|X_{A} -X_{B}| > 30\})= P (\{X_{B}-X_{A} > 30\} \cup \{X_{B} -X_{A} \leq -30 \} ) = P (\{X_{B}-X_{A} > 30\}) + P(\{X_{B} -X_{A} \leq -30 \})}\)

\(\displaystyle{ P(\{|X_{A} -X_{B}| > 30\}) = 1 - P(\{X_{B} -X_{A} \leq 30 \}) + 1 -P(\{X_{B} -X_{A} \leq 30 \}) = 2 - 2[P(\{X_{B} -X_{A} \leq 30 \}] = 2[1-P(\{X_{B} -X_{A} \leq 30 \}] }\)

\(\displaystyle{ P(\{|X_{A} -X_{B}| > 30\}) = 2 \left[1 -P \left( Z< \frac{30-0}{15}\right)\right] \approx 0,06.}\)

Program R

Kod: Zaznacz cały

> P = 2*(1-pnorm(2))
> P
[1] 0.04550026
janusz47
Użytkownik
Użytkownik
Posty: 8035
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1707 razy

Re: Centralne twierdzenie graniczne

Post autor: janusz47 »

Błędem w Pańskim rozumowaniu jest to, że zaczął Pan "kombinować " dążąc do wyrażenie jednej zmiennej losowej od drugiej.

W tym zadaniu należąło zastosować CTG dla różnicy dwóch zmiennych losowych.
3a174ad9764fefcb
Użytkownik
Użytkownik
Posty: 272
Rejestracja: 18 lip 2022, o 17:46
Płeć: Mężczyzna
wiek: 41
Podziękował: 3 razy
Pomógł: 43 razy

Re: Centralne twierdzenie graniczne

Post autor: 3a174ad9764fefcb »

janusz47 pisze: 5 wrz 2022, o 08:40 - jak obliczamy wariancję zmiennej losowej o rozkładzie Bernoulliego?
Można dość łatwo wyprowadzić wzór, a jeszcze łatwiej sprawdzić na przykład w Wikipedii.

Kod: Zaznacz cały

https://pl.wikipedia.org/wiki/Rozk%C5%82ad_dwumianowy
Wikipedia pisze: Parametry
\(\displaystyle{ n\geqslant 0}\) liczba prób (liczba całkowita)
\(\displaystyle{ 0\leqslant p\leqslant 1}\) prawdopodobieństwo sukcesu (liczba rzeczywista)

Wariancja \(\displaystyle{ np(1-p)}\)
janusz47 pisze: 5 wrz 2022, o 08:40 -jak obliczamy wariancję różnicy dwóch zmiennych losowych ?
Uwzględniając ich korelację. W szczególności \(\mathrm{Var}(X-(-X))=4\mathrm{Var}(X)\) oraz \(\mathrm{Var}(X-X)=0\).
janusz47 pisze: 5 wrz 2022, o 08:40 - z treści zadania wynika, że wybór szatni przez osoby jest losowy, czy jest zależny od innych osób ?
Akurat tu dyskutujemy o czym innym. Czy wybór szatni \(A\) przez osobę \(o_1\) jest zależny od wyboru szatni \(B\) przez osobę \(o_1\)? Tak, bo jeśli ta osoba wybrała szatnię \(A\), to nie wybrała szatni \(B\), a jeśli nie wybrała szatni \(A\), to wybrała szatnię \(B\). Jest to dość wyraźnie napisane w treści zadania:
Karka20 pisze: 3 wrz 2022, o 12:12 Wybierają między A i B
janusz47 pisze: 5 wrz 2022, o 08:48 Błędem w Pańskim rozumowaniu jest to, że zaczął Pan "kombinować " dążąc do wyrażenie jednej zmiennej losowej od drugiej.
Błędem w Pańskim działaniu jest to, że zamiast przeczytać po ludzku treść zadania, kombinuje Pan jak komputerek.
janusz47
Użytkownik
Użytkownik
Posty: 8035
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1707 razy

Re: Centralne twierdzenie graniczne

Post autor: janusz47 »

Zaaokrąglenie wyniku:

\(\displaystyle{ P(\{|X_{A} -X_{B}| > 30\}) = 2 \left[1 -P \left( Z< \frac{30-0}{15}\right)\right] \approx 0,05.}\)

Proszę przedstawić swoje rozwiązanie.
janusz47
Użytkownik
Użytkownik
Posty: 8035
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1707 razy

Re: Centralne twierdzenie graniczne

Post autor: janusz47 »

Błąd bezwzględny tego przybliżenia wnosi \(\displaystyle{ 0,01. }\)
janusz47
Użytkownik
Użytkownik
Posty: 8035
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1707 razy

Re: Centralne twierdzenie graniczne

Post autor: janusz47 »

2.
Obliczymy jakie powinno być \(\displaystyle{ N, }\) aby prawdopodobieństwo zdarzenia spełniało nierówność:

\(\displaystyle{ P(\{|X_{B}-X_{A}|>30\}) > 0,1 \ \ (*)}\)

W tym celu wracamy do końcowych obliczeń prawdopodobieństwa dla \(\displaystyle{ N = 900. }\)

Mamy

\(\displaystyle{ 2\left[1- \phi\left(\frac{30}{\sqrt{\frac{N}{4}}}\right) \right] > 0,1}\)

\(\displaystyle{ \left[1- \phi\left(\frac{30}{\sqrt{\frac{N}{4}}}\right) \right] > 0,05}\)

\(\displaystyle{ \phi\left(\frac{30}{\sqrt{\frac{N}{4}}}\right) < 0,95.}\)

Program R

Kod: Zaznacz cały

> qnorm(0.95)
[1] 1.644854
Z własności monotoniczności dystrybuanty standaryzowanego rozkładu normalnego

\(\displaystyle{ \phi\left(\frac{30}{\sqrt{\frac{N}{4}}}\right) < \phi(1,64)}\)

\(\displaystyle{ \frac{60}{\sqrt{N}} < 1,64 }\)

\(\displaystyle{ N > 1338,5. }\)

Należy uwzględnić co namniej \(\displaystyle{ N = 1339 }\) osób, aby prawdopodobieństwo zdarzenia spełniało nierówność \(\displaystyle{ (*).}\)
3a174ad9764fefcb
Użytkownik
Użytkownik
Posty: 272
Rejestracja: 18 lip 2022, o 17:46
Płeć: Mężczyzna
wiek: 41
Podziękował: 3 razy
Pomógł: 43 razy

Re: Centralne twierdzenie graniczne

Post autor: 3a174ad9764fefcb »

janusz47 pisze: 5 wrz 2022, o 10:16 Zaaokrąglenie wyniku:

\(\displaystyle{ P(\{|X_{A} -X_{B}| > 30\}) = 2 \left[1 -P \left( Z< \frac{30-0}{15}\right)\right] \approx 0,05.}\)
Świetne podejście: „Nie obchodzi mnie, że wcześniej zrobiłem dwa błędy, które mają wpływ na wynik. Będę kontynuował pisanie tych durnych cyferek. W ogóle co mnie obchodzi, że \(900\) osób chce skorzystać z szatni? Niech co czwarty nie skorzysta, a co czwarty niech skorzysta z dwóch. Będę stosował własny wzór na wariancję rozkładu dwumianowego, pomimo że różni się on od wzoru ogólnie uznanego.”
Karka20
Użytkownik
Użytkownik
Posty: 27
Rejestracja: 24 lis 2021, o 15:33
Płeć: Mężczyzna
wiek: 20
Podziękował: 8 razy

Re: Centralne twierdzenie graniczne

Post autor: Karka20 »

Rozwiązanie pierwszego punktu:

\(\displaystyle{ X _{A}>465 }\)
\(\displaystyle{ X _{B} <435 }\)
\(\displaystyle{ P(| X_{A}-X _{B}|>30)=P(X_{A}>465)+P(X_{B}<435)=1-ϕ( \frac{465-np}{ \sqrt{npq} })+ϕ (\frac{435-np}{ \sqrt{npq} })=1-ϕ( \frac{465-450}{ \sqrt{15} })+ϕ (\frac{435-450}{ \sqrt{15} })=1-ϕ(1)+ϕ(-1)=2(1-ϕ(1))
}\)


W drugim punkcie wynik powinien wynosić \(\displaystyle{ ( \frac{30}{1,64}) ^{2} \approx 335 }\) , natomiast nie wiem jak do niego dojść (dlaczego \(\displaystyle{ ( \frac{30}{1,64}) ^{2}}\), a nie \(\displaystyle{ ( \frac{60}{1,64}) ^{2}}\)?)
janusz47
Użytkownik
Użytkownik
Posty: 8035
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1707 razy

Re: Centralne twierdzenie graniczne

Post autor: janusz47 »

W tym rozwiązaniu zadania nie jest uwględniony drugi przypadek modułu różnicy zmiennych losowych.
ODPOWIEDZ