kurtoza dwoch zbiorow danych

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
poozy
Użytkownik
Użytkownik
Posty: 46
Rejestracja: 5 gru 2016, o 15:17
Płeć: Mężczyzna
Lokalizacja: Wrocław
Podziękował: 7 razy

kurtoza dwoch zbiorow danych

Post autor: poozy »

Witam, piszę raport ze statystyki i mam dwie grupy danych. Natrafiłem w internecie na taką interpretacje kurtozy: "Jeżeli występuje znaczna koncentracja wyników wokół średniej (kurtoza przyjmuje wartość powyżej 0) możemy powiedzieć, że znaczna część wyników / obserwacji jest podobna do siebie a obserwacji znacznie różniących się od średniej jest mało. Jeżeli występuje słaba koncentracja wyników wokół średniej (kurtoza przyjmuje wartość poniżej 0) możemy powiedzieć, że istnieje spora część wyników, które są znacznie oddalone od średniej.". Jest tylko mały problem, gdyż dla moich danych1 kurtoza wyszła ujemna, mimo iż dane są z przedziału (20,45) a ich wartosc srednia to około 29 a dla danych2 kurtoza wyszła dodatnia a dane te są z przedziału (3,105) a ich wartosc srednia to również około 29. Czy to w ogóle możliwe? Obliczenia wykonywałem w matlabie więc raczej nie ma mowy o pomyłce. Zastanawia mnie dlaczego niby te drugie dane są bardziej skoncentrowane wokół średniej skoro juz sam przedział ich wystepowania powinien wskazywac na coś odwrotnego...
janusz47
Użytkownik
Użytkownik
Posty: 7917
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1671 razy

kurtoza dwoch zbiorow danych

Post autor: janusz47 »

Jaki rozkład mają dane należące przedziałów?
Jest to możliwe, bo zależne od rozkładu danych w danym przedziale. Dla pewności proszę powtórzyć obliczenia w Matlab.
poozy
Użytkownik
Użytkownik
Posty: 46
Rejestracja: 5 gru 2016, o 15:17
Płeć: Mężczyzna
Lokalizacja: Wrocław
Podziękował: 7 razy

Re: kurtoza dwoch zbiorow danych

Post autor: poozy »

Nie mają konkretnego rozkładu, są to dane finansowe pobrane z internetu, chciałem wrzucić tutaj jakiegoś screena z nimi ale nie wiem czy jest to możliwe...
janusz47
Użytkownik
Użytkownik
Posty: 7917
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1671 razy

Re: kurtoza dwoch zbiorow danych

Post autor: janusz47 »

Czy na pewno? W praktyce dane finansowe (np. stopy zwrotów) modeluje się rozkładem normalnym.
poozy
Użytkownik
Użytkownik
Posty: 46
Rejestracja: 5 gru 2016, o 15:17
Płeć: Mężczyzna
Lokalizacja: Wrocław
Podziękował: 7 razy

Re: kurtoza dwoch zbiorow danych

Post autor: poozy »

Nie wiem jak to sprawdzić, są to poprostu ceny akcji z ostatnich 5 lat dwóch firm. W jaki sposób mogłoby to przypominać rozkład normalny to nie potrafie sobie wyobrazić.
janusz47
Użytkownik
Użytkownik
Posty: 7917
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1671 razy

Re: kurtoza dwoch zbiorow danych

Post autor: janusz47 »

Proszę wykonać na przykład diagramy słupkowe danych.
poozy
Użytkownik
Użytkownik
Posty: 46
Rejestracja: 5 gru 2016, o 15:17
Płeć: Mężczyzna
Lokalizacja: Wrocław
Podziękował: 7 razy

Re: kurtoza dwoch zbiorow danych

Post autor: poozy »

Wykonałem histogram jak i gęstość empiryczną, te dane nie są nawet symetryczne wokół wartości oczekiwanej więc chyba nie mogą mieć nic wspólnego z rozkładem normalnym.

Czy kurtoza opisuje to samo co odchylenie standardowe?
janusz47
Użytkownik
Użytkownik
Posty: 7917
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1671 razy

Re: kurtoza dwoch zbiorow danych

Post autor: janusz47 »

To dlatego mogą mieć rozkład normalny. Kurtoza nie opisuje tego samego co odchylenie standardowe.
Jest to miara koncentracji wokół średniej, spłaszczenia rozkładu.
poozy
Użytkownik
Użytkownik
Posty: 46
Rejestracja: 5 gru 2016, o 15:17
Płeć: Mężczyzna
Lokalizacja: Wrocław
Podziękował: 7 razy

Re: kurtoza dwoch zbiorow danych

Post autor: poozy »

Nie rozumiem dlaczego to, że nie przypominają rozkładu normalnego ma znaczyć, że dlatego mają rozkład normalny? A apropo kurtozy i odchylenia standardowego to nie moge zrozumieć dlaczego nie jest tak, że jeśli odchylenie standardowe jest wieksze czyli wartosci sa rozrzucone daleko od sredniej nie implikuje tego, że wykres gęstości jest odrazu bardziej spłaszczony czyli kurtoza jest mniejsza?
janusz47
Użytkownik
Użytkownik
Posty: 7917
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1671 razy

kurtoza dwoch zbiorow danych

Post autor: janusz47 »

Rozumowanie Pańskie jest słuszne. Dla rozkładu normalnego \(\displaystyle{ Kurt=0.}\) Obliczając wartość tego parametru z próby, proszę skorzystać z postaci estymatora nieobciążonego.
poozy
Użytkownik
Użytkownik
Posty: 46
Rejestracja: 5 gru 2016, o 15:17
Płeć: Mężczyzna
Lokalizacja: Wrocław
Podziękował: 7 razy

Re: kurtoza dwoch zbiorow danych

Post autor: poozy »

Ale właśnie w tym przypadku jest tak, że mimo większego odchylenia standardowego czyli większego rozrzutu wartości kurtoza jest też większa czyli wykres bardziej szpiczasty i nie potrafie zrozumieć czemu. Jeżeli dobrze policzyłem estymator nieobciążony to wychodzi mi około 0.52 dokladnie tak jak przy obciążonym, nie wiem co za różnica. A dla drugich danych wychodzi około -1.1 czyli też tyle samo co wychodziło poprostu przy użyciu kurtosis.

Szczerze to nie rozumiem o co chodziło Panu w tej ostatniej odpowiedzi i jaki był jej cel.
janusz47
Użytkownik
Użytkownik
Posty: 7917
Rejestracja: 18 mar 2009, o 16:24
Płeć: Mężczyzna
Podziękował: 30 razy
Pomógł: 1671 razy

kurtoza dwoch zbiorow danych

Post autor: janusz47 »

Z jakiego wzoru na estymator nieobciążony Kurt Pan korzysta?
ODPOWIEDZ