rozkład normalny

Definicja klasyczna. Prawdopodobieństwo warunkowe i całkowite. Zmienne losowe i ich parametry. Niezależność. Prawa wielkich liczb oraz centralne twierdzenia graniczne i ich zastosowania.
Sarken
Użytkownik
Użytkownik
Posty: 25
Rejestracja: 19 wrz 2012, o 18:25
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 1 raz

rozkład normalny

Post autor: Sarken »

Wzrost pewnej grupy studentów ma rozkład normalny o \(\displaystyle{ m=175, \sigma=7}\).
a) jaki procent studentów ma wzrost między \(\displaystyle{ 170}\) a \(\displaystyle{ 190\, cm}\);
b) obliczyć pstwo, że w \(\displaystyle{ 10}\)-osobowej grupie studentów będzie co najmniej jeden o wzroście większym
niż \(\displaystyle{ 2\,m.}\)

a) zrobiłem ze standaryzacji, ale nie wiem jak ugryźć b). Rozumiem, że trzeba skorzystać z CTG będziemy mieć \(\displaystyle{ P( \mbox{coś} > 2) = 1 - P( \mbox{coś} \le 2)}\). Ale jak uwzględnić tutaj to co najmniej \(\displaystyle{ 1}\)?
Ostatnio zmieniony 10 gru 2016, o 20:53 przez Jan Kraszewski, łącznie zmieniany 1 raz.
Powód: Poprawa wiadomości.
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5221 razy

rozkład normalny

Post autor: Premislav »

Gdybyśmy nie mieli normalności rozkładu, to \(\displaystyle{ 10}\) osób to zdecydowanie za mało, by dostać dobre przybliżenie z CTG, natomiast ja bym tu wykorzystał to, że jeśli \(\displaystyle{ X_1,\dots X_n}\) są niezależnymi zmiennymi losowymi o rozkładach \(\displaystyle{ \mathcal{N}(\mu_1, \sigma_1),\dots \mathcal{N}(\mu_n,\sigma_n)}\)
odpowiednio, to \(\displaystyle{ Y=X_1+\dots+X_n}\) ma rozkład \(\displaystyle{ \mathcal{N}(\mu_1+\dots+ \mu_n, \sqrt{\sigma^2_1+\dots \sigma^2_n})}\) oraz standaryzację. To, co nazywasz CTG, to w przypadku sumy niezależnych zmiennych o tym samym rozkładzie normalnym zwykła standaryzacja.
No czyli suma \(\displaystyle{ X_1+\dots x_{10}}\) (zakładam stochastyczną niezależność)
ma rozkład \(\displaystyle{ \mathcal{N}(1750,7\sqrt{10})}\), zatem zmienna losowa
\(\displaystyle{ Z= \frac{X_1+\dots x_{10}-1750}{7\sqrt{10}}}\)
ma standardowy rozkład normalny \(\displaystyle{ \mathcal{N}(0,1).}\)
Sarken
Użytkownik
Użytkownik
Posty: 25
Rejestracja: 19 wrz 2012, o 18:25
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 1 raz

rozkład normalny

Post autor: Sarken »

Ok, ale jak powiązać równocześnie co najmniej jedną osobę i to, że ma mieć wzrost większy niż 2 metry.
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5221 razy

rozkład normalny

Post autor: Premislav »

A to przepraszam, za dużo piwa do meczu, a za mało czytania ze zrozumieniem, już więcej dziś nie piszę, tylko wyjaśnię tę sprawę.
Jeżeli mamy niezależne zmienne losowe \(\displaystyle{ X_1, \dots X_n}\) o tym samym rozkładzie (danym), to możemy znaleźć dystrybuantę zmiennej \(\displaystyle{ Y= \max\left\{ X_1, \dots X_n\right\}}\). Nie jest to trudne i pozostawiam to jako ćwiczenie, napiszę tylko jak zacząć.
\(\displaystyle{ \mathbf{P}(\max\left\{ X_1, \dots X_n\right\}\le x)=\mathbf{P}\left( X_1 \le x, \dots X_n \le x\right)}\) i teraz użyj niezależności. A mając dystrybuantę, znajdziesz i gęstość (z uwagi na to, że u Ciebie \(\displaystyle{ X_i}\) mają rozkłady ciągłe, to również maksimum ma rozkład ciągły), różniczkując.

No to fakt, że z próby \(\displaystyle{ 10}\) osób jedna ma wzrost co najmniej \(\displaystyle{ 2}\) m, oznacza innymi słowy, ze maksimum tych wzrostów owych osób jest nie mniejsze niż \(\displaystyle{ 2}\) m (czyli \(\displaystyle{ 200}\) cm oczywiście, bo w tych terminach podano średnią i odchylenie standardowe). Jeśli będziesz mieć rozkład maksimum, to łatwo to wyliczysz.

-- 21 cze 2016, o 19:58 --

Jeezu, ja naprawdę nie jestem w formie. Nie musisz się użerać ze znajdowaniem gęstości maksimum, starczy, że policzysz wartość dystrybuanty maksimum.
Bo to, czego szukasz, to \(\displaystyle{ 1-F_Y(200)}\), gdzie \(\displaystyle{ F_Y}\) jest dystrybuantą \(\displaystyle{ \max\left\{ X_1, \dots X_{10}\right\}}\)
Oczywiście z \(\displaystyle{ 200}\) chodzi mi znów o \(\displaystyle{ 200}\) centymetrów, bo średnia i odchylenie standardowe podane są w centymetrach.-- 21 cze 2016, o 20:00 --Obliczeń za Ciebie nie wykonam, mogę je sprawdzić.
Sarken
Użytkownik
Użytkownik
Posty: 25
Rejestracja: 19 wrz 2012, o 18:25
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 1 raz

rozkład normalny

Post autor: Sarken »

No jako, że zmienne losowe są niezależne i jest ich 10 to dystrybuanta maksimum to będzie coś takiego:

\(\displaystyle{ F_{y}(x)=F_{max}(x)=(F_{X_{1}}(x))^{10}}\)

Dobrze to rozumiem? Tylko nie za bardzo widzę jak mam obliczyć tą dystrybuantę, bo nie znam jej wzoru. Nie twierdzę, że tak się nie da, ale pierwszy raz się z tym zetknąłem (dystrybuantą maksimum) i wydaję mi się, że autor miał chyba jakąś prostszą koncepcję jako rozwiązanie.

--------
Czy po prostu, mogę już ją traktować jako dystrybuantę rozkładu normalnego, którą przesuwam, żeby rozkład był typu N(0,1) i będzie coś takiego:

\(\displaystyle{ P(\max(X_{1},...,X_{n})>2)=1-(F_{X_{1}}( \frac{200-175}{7}))^{10} \approx 0}\)
Ostatnio zmieniony 21 cze 2016, o 21:41 przez Sarken, łącznie zmieniany 3 razy.
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5221 razy

rozkład normalny

Post autor: Premislav »

Tak, dobrze to rozumiesz. Czyli szukane prawdopodobieństwo to jest
\(\displaystyle{ 1-(F_{X_{1}}(200))^{10}}\)
To wcale nie jest nieprosta koncepcja. Teraz standaryzujesz, żeby
wyliczyć przybliżoną wartość \(\displaystyle{ F_{X_1}(200)=\mathb{P}(X_1 \le 200)}\) z użyciem tablic standardowego rozkładu normalnego, a następnie po prostu podnosisz tę wartość (czyli przybliżone \(\displaystyle{ \mathb{P}(X_1 \le 200)}\))do dziesiątej potęgi i wykonujesz to odejmowanie.
Co do standaryzacji, oczywiście skoro \(\displaystyle{ X \sim \mathcal{N}(\mu, \sigma),}\) to \(\displaystyle{ \frac{X-\mu}{\sigma}\sim \mathcal{N}(0,1)}\). Tuja po prostu bierzesz \(\displaystyle{ \mu=175, \sigma=7}\).
Sarken
Użytkownik
Użytkownik
Posty: 25
Rejestracja: 19 wrz 2012, o 18:25
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 1 raz

rozkład normalny

Post autor: Sarken »

Edytowałem post wyżej . Czy zapis jest ok, czy coś jest nie tak w nim?
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5221 razy

rozkład normalny

Post autor: Premislav »

\(\displaystyle{ P(\max(X_{1},...,X_{n})>2)=1-(F_{X_{1}}( \frac{200-175}{7}))^{10} \approx 0}\)
No, pewna nieścisłość w oznaczeniach tu wystąpiła (albo jakiś błąd). Powinno być:
\(\displaystyle{ P(\max(X_{1},...,X_{n})>2)=1-(F_{X_{1}}(200))^{10}=1-\left(\Phi\left( \frac{200-175}{7} \right) \right)^{10}}\),
gdzie \(\displaystyle{ \Phi}\) to dystrybuanta standardowego rozkładu normalnego.
Sarken
Użytkownik
Użytkownik
Posty: 25
Rejestracja: 19 wrz 2012, o 18:25
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 1 raz

rozkład normalny

Post autor: Sarken »

Okej, dzięki wielkie .

Mógłbyś mnie jeszcze naprowadzić jak rozwiązywać takie zadania:

Urządzenie składa się z n elementów. Urządzenie pracuje, jeżeli co najmniej 70% elementów jest
sprawnych. Prawdopodobieństwo awarii dla każdego z elementów jest równe 0,2. Wyznaczyć liczbę elementów tak, by z prawdopodobieństwem 0,95 urządzenie pracowało.

Rozpisuję to w taki sposób, ale ostatecznie wychodzi mi n<1, a w odpowiedziach jest n rzędu ponad 40.

\(\displaystyle{ EX=0,2n \\
D^{2}X=0,16n \\
P(S_{n} \le \frac{0,7n-0,2n}{0,4 \sqrt{n} })=0,95}\)
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5221 razy

rozkład normalny

Post autor: Premislav »

Moim skromnym zdaniem popełniłeś błąd w interpretacji danych.
Chcemy, aby urządzenie pracowało z prawodpdoobieństwem \(\displaystyle{ 0,95}\), a to ma miejsce ("to" tj. sytuacja, w której urządzenie działa), gdy co najmniej \(\displaystyle{ 70\%}\) elementów urządzenia działa, czyli mniej niż \(\displaystyle{ 30\%}\) nie działa. Tak więc jeżeli \(\displaystyle{ S_n}\) oznacza zmienną losową zliczającą niedziałające elementy, to powinieneś rozważać
\(\displaystyle{ \mathbf{P}(S_n < (1-0,7)n)}\), tj. \(\displaystyle{ \mathbf{P}(S_n < 0,3 n)}\)
Przy założeniu niezależności rozkładów dwupunktowych określających, czy dany element jest zepsuty
(i odpowiednio dużej liczbie elementów) możemy zastosować przybliżenie (z tw. de Moivre'a-Laplace'a, które w sumie jest szczególnym przypadkiem CTG)
\(\displaystyle{ \mathbf{P}(S_n <0,3 n)=\mathbf{P}\left( \frac{S_n -0,2 n}{0,4 \sqrt{n}}< \frac{0,3 n -0,2 n}{0,4 \sqrt{n}} \right)\approx \Phi\left(\frac{0,3 n -0,2 n}{0,4 \sqrt{n}} \right)}\)

Jako że \(\displaystyle{ \Phi(1,645) \approx 0,95}\) (pamiętam to, bo to jedna z najczęściej używanych wartości), mamy do rozwiązania w zasadzie takie równanie:
\(\displaystyle{ \frac{0,1 n}{0,4 \sqrt{n}}=1,645}\)
z czego wychodzi \(\displaystyle{ n \approx \frac{108241}{2500}}\) (to z wolframalpha.com - ta liczba jest gdzieś miedzy \(\displaystyle{ 43}\) a \(\displaystyle{ 44}\)), a z racji tego, że \(\displaystyle{ n}\) ma być naturalne... (dobierz podłogę lub sufit z tego, zastanów się, które lepiej).
Sarken
Użytkownik
Użytkownik
Posty: 25
Rejestracja: 19 wrz 2012, o 18:25
Płeć: Mężczyzna
Lokalizacja: Kraków
Podziękował: 1 raz

rozkład normalny

Post autor: Sarken »

Okej, dzięki. Odp. będzie 44, bo żeby wykonać pracę 43,x urządzeń, to potrzebujemy tego dodatkowego, więc zaokrąglamy w górę.

W kwestii znaków np. coś takiego:

\(\displaystyle{ P(S_{n} \ge 0,7n)}\) będzie równoważne Twojemu zapisowi? Zmieniając wartość średnią na 0,8n.
Awatar użytkownika
Premislav
Użytkownik
Użytkownik
Posty: 15687
Rejestracja: 17 sie 2012, o 13:12
Płeć: Mężczyzna
Lokalizacja: Warszawa
Podziękował: 196 razy
Pomógł: 5221 razy

rozkład normalny

Post autor: Premislav »

Tak można, tylko należy zaznaczyć, że zmienia się wówczas interpretacja \(\displaystyle{ S_n}\), więc można by to inaczej oznaczyć, choć może nie trzeba (w moim rozumowaniu ta zmienna losowa odzwierciedlała liczbę elementów, które nie będą działały, zaś w tym podejściu, o którym teraz piszesz, zlicza elementy, które działają).
ODPOWIEDZ