Strona 1 z 1

Jakie jest prawdopodobieństwo odchylenia skrajnego.

: 17 paź 2007, o 19:07
autor: Gru
Po pierwsze witam bo to mój pierwszy post.

Muszę obliczyć prawdopodobieństwo zdarzenia ekstremalnego. Badaniu podlegają dzienne notowania DJI, od 1 stycznia 1900 do 21 września 2007. Moim zadaniem jest obalić teorię o normalności rozkładu stóp zwrotu z na tym indeksie. Stożyłem już rozkład prawdopodobieństw w na tle krzywej Gaussa. Potrzebuję jeszcze obliczyć prawdopodobieństwo wystąpienia takich odchyleń do jakich doszło w czasie wielkiego kryzysu i czarnego poniedziałku. Wiem z notatki, nieoficjalnego źródła ze to około -1*10^127, ale muszę to obliczyć dokładnie i poprzeć obliczeniami.

By udowodnić ze DJI nie podlega rozkładowi normalnemu, poza statystyką standardową i pokazaniem go na tle krzywej Gaussa, chcę obliczyć prawdopodobieństwo zdarzeń bardzo dalekich od średniej, i skonfrontować to ze stanem rzeczywistym.
Do tej pory obliczyłem to:

Excelem:
Obliczyłem zlogarytmowane stopy zwrotu(miesięczne). (Potem obliczenia zorbie na danych dziennych).
Gretlem:
Statystyki opisowe, wykorzystane obserwacje 1900:01 - 2007:09
dla zmiennej 'ln_p_dji' (1288 prawidłowych obserwacji)

średnia 0,0041364
Mediana 0,0081211
Minimalna -0,37906
Maksymalna 0,40833
Odchylenie standardowe 0,045778
Wsp. zmienności 11,067
Skośność -0,84574
Kurtoza 12,763

Wykres rozkładu prawdopodobieństw - link - b166er.nazwa.pl/inne/dji.png

P.S. Zastanawiam się nad znormalizowaniem tych danych by średnia wyszła na 0.

P.S2. Przeniosłem temat z działu prawdopodobieństwo bo tam jakos nie pasował...

Jakie jest prawdopodobieństwo odchylenia skrajnego.

: 17 paź 2007, o 19:32
autor: kadykianus
Witaj. Po pierwsze jesli Twoim zadaniem bylo pokazac, ze rozklad stop zwrotu nie jest normalny to juz to zrobiles i zadanie skonczone (test chi-kwadrat). Rozklad stop DJI nie jest normalny bo ma tzw. dlugie ogony czyli wartosci ekstremalne. Przy pomocy tablic rozkladu normalnego (lub Excela) mozesz obliczyc, ile powinno byc wartosci oddalonych od sredniej o, dajmy na to, 4-5 odchylen standardowych albo inne i skonfrontowac to z iloscia takich wystapien w realnym rozkladzie stop DJI. Masz wiec wartosci oczekiwane (z rozkladu normalnego) i obserwowane (z rozkladu stop DJI) i testem chi - kwadrat pokazesz, ze te odchylki nie sa przypadkowe co potwierdza, ze rozklad stop zwrotu nie jest normalny. Tak wiec znormalizowanie stop do sredniej 0 i wariancji 1 jest konieczne. Proponuje nastepujace przedzialy dla testu chi-kwadrat:
2-3
3-4
4-5
5-6
7-nieskonczonosc
powinno wystarczyc

Jakie jest prawdopodobieństwo odchylenia skrajnego.

: 17 paź 2007, o 19:44
autor: Gru
1. Jak wstawić do exela kolumnę w zartościami oczekiwanymi?
Znormalizowałem już do średniej zero przed odięcie od wszystkich wyliczonych wartości wartość średnią arytmetyczną. Nowa średnia arytmetyczna wychodzi na zero.

2. Jak znormalizować wariancję do 1.

Sory za tak głupie pytania... ale ja mialem statysytke 4 lata temu i ni w ząb nie pamiętam podstaw...

Jakie jest prawdopodobieństwo odchylenia skrajnego.

: 17 paź 2007, o 20:11
autor: kadykianus
Okej to od poczatku. Normalizacja do sredniej 0 i wariancji 1 polega na tym, ze od kazdej wartosci odejmujesz srednią i dzielisz przez odchylenie standardowe. wtedy Srednia bedzie 0 a odchylenie 1 (wariancja tez bedzie jeden).

Mając już stopy znormalizowane policz ile z nich wpada do przedzialow o ktorych pisalem czyli na przyklad ile jest takich stop ktore po normalizacji są miedzy 2 a 3 i miedzy -2 a -3. Dodaj do siebie te liczebnosci - to są Twoje wartości OBSERWOWANE. Nastepnie policz ile jest takich ktore wpadaja do przedziału 3-4 i tak dalej. Do testu chi-kwadrat potrzebujesz jeszcze liczebnosci oczekiwanych czyli ile POWINNO być w tych przedzialach jesli rozkład jest normalny. Aby policzyć musicz policzyc z rozkladu normalnego, jakie jest prawdopodobienstwo tego, ze dostaniesz liczbe z tego rozkladu ktora bedzie miedzy 2 i 3. To sie liczy z tablic dystrybuanty rozkladu normalnego zamieszczanych w kazdej ksiazce do statsyki albo w internecie. Jak nie masz tablic to mozesz wyliczyc to w Excelu za pomoca funkcji ROZKLAD.NORMALNY.S. Trzeba tam wpisac liczbe "Z". to jest wlasnie to, co wyszlo po normalizacji. Na przyklad jak wpiszesz "z = 3" to wynik bedzie 0,99865 co oznacza, ze prawdopodobienstwo tego, ze w rozkladzie normalnym pojawi sie liczba odlegla od sredniej o nie wiecej niz 3 odchylenia standardowe wynosi 0,99865 (czyli prawie jeden bo w rozkladzie normalym nie ma wiekszych odchylek) Zatem pojawienie sie liczby WIEKSZEJ od 3 wyniosi 1-0,99865 czyli 0,00135. Teraz mnozysz te liczbe przez liczbe wszystkich stop zwrotu i otrzymasz wartosci OCZEKIWANE. To znaczy tyle powinienes miec tych liczb w swoim zbiorze jesli rozklad stop zwrotu jest normalny. Podobnie wyznaczasz pozostale liczebnosci oczekiwane.

Oczywiscie aby policzyc prawdopodobienstwo pojawienia sie liczby z przedzialu 3 a 4 nalze odjac Z(4) - Z(3) i dostaniemy 0,001318. Teraz trzeba pomnozyc to przez liczbe wszystkich stop zwrotu ktore masz (1200 czy iles)