Pewna firma produkująca chipsy umieszcza losowo w każdej paczce jedną z 50 naklejek. Ile średnio trzeba kupić paczek chipsów, aby mieć wszystkie 50 naklejek?
Moja próba sformalizowania problemu:
Rozważmy taką przestrzeń probablistyczną:
\(\displaystyle{ \Omega=\{1,2,\ldots, 50\}, \mathcal{F}=2^{\Omega}, P(A)=\frac{|A|}{50}}\)
Teraz rozpatrujemy przeliczalny produkt przestrzeni \(\displaystyle{ \Omega}\) ze sobą i na tym produkcie tworzymy zmienną losową, która przypisuje liczbę od którego miejsca w danym ciągu pojawiły się wszystkie liczby ze zbioru \(\displaystyle{ \{1,2,\ldots, 50\}}\) lub \(\displaystyle{ +\infty}\) w przypadku, gdy w danym zdarzeniu elementarnym nie wystąpiły wszystkie liczby z tego zbioru (wydaje mi się, że to i tak bez znaczenia, bo prawdopodobieństwo, że któraś liczba nie zostanie wylosowana chyba wynosi \(\displaystyle{ 0}\)). Pozostaje teraz obliczyć wartość oczekiwaną tej zmiennej losowej.
Będę wdzięczny za wszelką pomoc, również wszelkie metody dające przybliżony wynik.
Naklejki w chipsach
-
- Użytkownik
- Posty: 1847
- Rejestracja: 8 lip 2008, o 21:16
- Płeć: Mężczyzna
- Lokalizacja: Staszów/Warszawa
- Podziękował: 7 razy
- Pomógł: 378 razy
Naklejki w chipsach
Do takiego zadania trzeba wykorzystać zmienne o rozkładzie geometrycznym.
Zmienna \(\displaystyle{ X_0}\) zawsze równa 1, \(\displaystyle{ X_1}\) z \(\displaystyle{ p=49/50}\). p oznacza prawdopodobieństwo trafienia naklejki innej niż do tej pory. Zmienna \(\displaystyle{ X_2}\) z \(\displaystyle{ p=48/50}\) i tak dalej. Na koniec obliczasz \(\displaystyle{ E(X_1+X_2+...X_{50})}\).
Bardzo podobne zadania pojawia się na egzaminach aktuarialnych.
Zmienna \(\displaystyle{ X_0}\) zawsze równa 1, \(\displaystyle{ X_1}\) z \(\displaystyle{ p=49/50}\). p oznacza prawdopodobieństwo trafienia naklejki innej niż do tej pory. Zmienna \(\displaystyle{ X_2}\) z \(\displaystyle{ p=48/50}\) i tak dalej. Na koniec obliczasz \(\displaystyle{ E(X_1+X_2+...X_{50})}\).
Bardzo podobne zadania pojawia się na egzaminach aktuarialnych.
-
- Użytkownik
- Posty: 2282
- Rejestracja: 14 cze 2011, o 11:34
- Płeć: Mężczyzna
- Lokalizacja: Sosnowiec
- Podziękował: 88 razy
- Pomógł: 351 razy
Naklejki w chipsach
Można prosić o wyjaśnienie dlaczego właśnie tak to się liczy? Czy wynik będzie taki sam jak wartość oczekiwana zmiennej losowej na przestrzeni probablistycznej, którą zaproponowałem?-- 2 lip 2016, o 16:52 --Jeśli się nie pomyliłem to twój sposób daje wynik:
\(\displaystyle{ \sum_{i=1}^{50}\frac{50}{i}\approx 224.96}\)
\(\displaystyle{ \sum_{i=1}^{50}\frac{50}{i}\approx 224.96}\)
- Santiago A
- Użytkownik
- Posty: 248
- Rejestracja: 22 sty 2016, o 20:56
- Płeć: Mężczyzna
- Lokalizacja: Zaragoza
- Podziękował: 9 razy
- Pomógł: 51 razy
Naklejki w chipsach
To klasyczny problem zbieracza kuponów, który można rozwiązać w ogólnym przypadku, a nie tylko dla \(\displaystyle{ n = 50}\).
Szukamy wartości oczekiwanej (nadziei) dla zmiennej losowej \(\displaystyle{ T}\), czasu potrzebnego na zebranie \(\displaystyle{ n}\) naklejek z czipsiorków. Niech \(\displaystyle{ t_i}\) będzie czasem potrzebnym na zebranie \(\displaystyle{ i}\)-tej naklejki, jeżeli mamy już \(\displaystyle{ i - 1}\) poprzednich. Prawdopodobieństwo dostania nowej etykietki wynosi \(\displaystyle{ p_i = (n - (i-1)) / n}\), zaś sama zmienna \(\displaystyle{ t_i}\) ma rozkład geometryczny (z nadzieją \(\displaystyle{ 1 / p_i}\) właśnie).
Ideolo, to wystarcza do rozwiązania problemu.
\(\displaystyle{ \mathbb E T = \sum_{k=1}^n \mathbb E t_k = \sum_{k=1}^n \frac 1 {p_k} = \sum_{k=1}^n \frac n k = n \cdot H_n}\),
gdzie \(\displaystyle{ H_n}\) to \(\displaystyle{ n}\)-ta liczba harmoniczna.
Szukamy wartości oczekiwanej (nadziei) dla zmiennej losowej \(\displaystyle{ T}\), czasu potrzebnego na zebranie \(\displaystyle{ n}\) naklejek z czipsiorków. Niech \(\displaystyle{ t_i}\) będzie czasem potrzebnym na zebranie \(\displaystyle{ i}\)-tej naklejki, jeżeli mamy już \(\displaystyle{ i - 1}\) poprzednich. Prawdopodobieństwo dostania nowej etykietki wynosi \(\displaystyle{ p_i = (n - (i-1)) / n}\), zaś sama zmienna \(\displaystyle{ t_i}\) ma rozkład geometryczny (z nadzieją \(\displaystyle{ 1 / p_i}\) właśnie).
Ideolo, to wystarcza do rozwiązania problemu.
\(\displaystyle{ \mathbb E T = \sum_{k=1}^n \mathbb E t_k = \sum_{k=1}^n \frac 1 {p_k} = \sum_{k=1}^n \frac n k = n \cdot H_n}\),
gdzie \(\displaystyle{ H_n}\) to \(\displaystyle{ n}\)-ta liczba harmoniczna.