Centralne twierdzenie graniczne

lotka888 · Post autor: **lotka888** » 22 lis 2012, o 18:06

no i mam nastepny problem...
musze napisac co to jest i jak moga byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi:
1. standaryzacja
2. Centralne twierdzenie graniczne
3. Przedział ufności
4. Weryfikacja hipotez statystycznych

czy ktos moze to wytlumaczyc jezykiem prostym a nie matematycznym?

wiem wiem ze jestem glupia.... ale nie kazdy jest zdolny do rozumienia statystyki....

miodzio1988 · Post autor: **miodzio1988** » 22 lis 2012, o 19:53

definicje możesz znaleźć w necie, więc jaki jest problem?

lotka888 · Post autor: **lotka888** » 22 lis 2012, o 20:12

'standaryzacja jest w statystyce rodzajem normalizacji zmiennej losowej, w wyniku której zmienna uzyskuje średnią wartość oczekiwaną zero i wariancję jeden. Najczęściej spotykanym sposobem standaryzacji jest tzw. standaryzacja Z'

przeczytalam i dalej nie rozumie..... szczegolnie do pytania :
jak standaryzacja moze byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi?

nie da sie jakos powiedziec tego po ludzku????

miodzio1988 · Post autor: **miodzio1988** » 22 lis 2012, o 20:17

Ale czego nie rozumiesz w zacytowanym tekście?

lotka888 · Post autor: **lotka888** » 22 lis 2012, o 20:30

co to jest normalizacja zmiennej losowej?
dlaczego normalizacja jest uzyteczna do sprawdzenia zaleznosci pomiedzy zmiennymi?

btw... miodzio1988 zaloze sie ze Ty jestes nauczycielem.... moja nauczycielka tez tak pytala: "czego ty tu nie rozumiesz???????" OMG jak ja jej nienawidzilam.....

miodzio1988 · Post autor: **miodzio1988** » 22 lis 2012, o 20:32

Ojej.

... tystyka%29

wszystko google. Tak jestem nauczycielem.

lotka888 · Post autor: **lotka888** » 22 lis 2012, o 20:36

super :-D
znaczy jako nauczyciel potrafisz mi to wytlumaczyc wlasnymi slowami bo cytowac z internetu to kazdy potrafi i nie trzeba do tego studiow konczyc ....

miodzio1988 · Post autor: **miodzio1988** » 22 lis 2012, o 20:38

Super

Jak napiszesz konkretnie czego nie rozumiesz to Ci bardzo chętnie to wytłumaczę;. Oczywiście jesli odpowiedzi nie da się w necie znaleźć. A póki co widzę, że się ciągle da

lotka888 · Post autor: **lotka888** » 22 lis 2012, o 20:44

czego nie rozumiesz z mojej wypowiedzi????

jak standaryzacja moze byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi

miodzio1988 · Post autor: **miodzio1988** » 22 lis 2012, o 20:49

Pierwsza informacja po wpisaniu zdania w google to:

Najwazniejszych rzeczy nie napisales, mianowicie jaki jest rozklad badanych cech.
W zaleznosci od tego rozkladu mozesz
1. sprawdzic korelacje Pearsona
2. sprawdzic korelacje Spearmana
3. podzielic menadzerow na efektywnych i nie oraz wykonac test Wilcoxona
4. wykonac analize kanoniczna
...

W których z tych rzeczy może występować standaryzacja? Oczywiście nie są to jedynie tematy związane z zależnością zmiennych

lotka888 · Post autor: **lotka888** » 22 lis 2012, o 21:14

wiesz... wydaje mi sie ze mowimy dwoma roznymi jezykami....
ale dzieki za probe pomocy....

kieubass · Post autor: **kieubass** » 17 sie 2013, o 16:01

To może ja odpowiem prostym językiem

1. Standaryzacja

Jest w statystyce taki rozkład zwany normalnym Ma on bardzo szerokie zastosowanie w statystyce, ponieważ wiele zjawisk do niego pasuje (np. IQ w określonych regionach świata). Ma on dwa podstawowe parametry: \(\displaystyle{ \mu}\) czyli wartość oczekiwaną (średnią jakiej oczekujemy przeprowadzając badanie) oraz \(\displaystyle{ \sigma ^{2}}\) czyli wariancję (odchylenie wyników badania od próby - im większa wariancja tym wyniki bardziej rozrzucone) Oglądałem program na Discovery gdzie była mowa o IQ dla różnych nacji i tam była mowa o rozkładzie normalnym (pamiętam tylko, że najwyższą wartość oczekiwaną, bo aż 128 mieli Żydzi Aszkenazyjscy - oznacza to, że teoretycznie są najbardziej inteligentni). Trzymając się już tego IQ, przypuśćmy, że w Polsce wartość oczekiwana wynosi 115 (nie wiem ile naprawdę ). Jeżeli wariancja byłaby duża, to znaczy, że wyniki bardzo od niej odskakują, po polsku - mamy wielu "idiotów" i wielu "geniuszy", a mało "przeciętniaków", natomiast, gdyby wariancja była mała, to właściwie są w Polsce sami "przeciętniacy"

Ale co to standaryzacja? Rozkład normalny o parametrach \(\displaystyle{ \mu}\) oraz \(\displaystyle{ \sigma ^{2}}\) jest trudny do odczytania. Powstał więc pomysł by wprowadzić standaryzowany rozkład Gaussa (czyli normalny, bo to ma dwie nazwy), dla którego \(\displaystyle{ \mu = 0}\) oraz \(\displaystyle{ \sigma ^{2} = 1}\)
Dla takiego rozkładu mamy już gotowe tablice, do odczytywania jego wartości
Standaryzować możemy dowolną zmienną o rozkładzie \(\displaystyle{ \mu}\) oraz \(\displaystyle{ \sigma ^{2}}\), odejmując od niej jej wartość oczekiwaną, a następnie dzieląc ją przez pierwiastek z wariancji Tak otrzymana nowa zmienna, ma już na pewno rozkład standaryzowany Gaussa

-- 17 sie 2013, o 16:15 --

2. Centralne Twierdzenie Graniczne (CTG)

Twierdzenie, które mówi, że jeżeli mamy jakiś ciąg \(\displaystyle{ X _{n}}\) n prób, wiedząc że każda ma ten sam rozkład oraz że wszystkie próby są od siebie niezależne (dobrymi przykładami jest rzucanie n-razy tą samą symetryczną kostką, albo badanie u n-osób ich IQ, albo ilości włosów na ich głowach) to oznaczając przez \(\displaystyle{ S _{n}}\) sumę każdego z tych wyników i przekształcając tą sumę odpowiednio, będziemy mogli wartość prawdopodobieństwa odczytać z tablic standaryzowanego rozkładu normalnego

Jakich przekształceń dokonujemy? Mając już \(\displaystyle{ S _{n}}\) odejmujemy od niego \(\displaystyle{ n\mu}\) gdzie \(\displaystyle{ \mu}\) to wartość oczekiwana zmiennej \(\displaystyle{ X _{i}}\) (a ponieważ, zmienne te mają te same rozkłady zgodnie z założeniem to pierwsza, druga, trzecia itd. jak i ostatnia zmienna mają taką samą wartość oczekiwaną). Następnie dzielimy tą zmienną przez \(\displaystyle{ \sqrt{n} \sigma}\), gdzie \(\displaystyle{ \sigma}\) to pierwiastek z wariancji zmiennej \(\displaystyle{ X _{i}}\) (a ponieważ, zmienne te mają te same rozkłady zgodnie z założeniem to pierwsza, druga, trzecia itd. jak i ostatnia zmienna mają taką samą wariancję). Definiując naszą nową zmienną:

\(\displaystyle{ Y:= \frac{S _{n} - n\mu}{\sqrt{n} \sigma}}\)

I teraz prawdopodobieństwo tego, że wartość zmiennej \(\displaystyle{ Y}\) jest mniejsza równa od jakiejś liczby \(\displaystyle{ t}\), można odczytać z tablic wartości dystrybuanty rozkładu normalnego standaryzowanego, bo w nieskończoności będą się ze sobą pokrywać Zapis formalny:
\(\displaystyle{ P\left( Y \le t\right)}\) w nieskończoności dąży do \(\displaystyle{ \Phi \left( t\right)}\)
Gdzie \(\displaystyle{ \Phi(x)}\) to wartość dystrybuanty rozkładu normalnego dla argumentu \(\displaystyle{ x}\) (ten znaczek, to duża litera Phi czytana jako fi )

-- 17 sie 2013, o 16:27 --

3. Przedział ufności

Opowiem na prostym przykładzie Mamy wybory. Siedzimy w rządzie jednego z kandydatów X, który usilnie chce się dowiedzieć, ile procent poparcia otrzyma w tych wyborach. Wiadomo, że przecież, nie da się przepytać przed wyborami wszystkich Polaków Ale jest na to sposób Akurat w tym przypadku bierze się tysiąc osób (dla prawidłowości wyników powinno się pytać 1067 osób ale ciężko by się liczyło) na kogo oddadzą swój głos. Faktyczna wartość procentowego poparcia jest jakaś dajmy na to \(\displaystyle{ \beta}\), my jej nie znamy, ale po wyborach będzie znana Na podstawie danych zebranych po przepytaniu tych osób jesteśmy w stanie podać przedział, który prawie na pewno (zazwyczaj na 95%) będzie nam pokrywał ten wynik osiągnięty po wyborach

Dlaczego 95% a nie 100%? Otóż sprawa jest bardzo prosta, im bardziej chcemy być pewni, tym bardziej się poszerzy nasz przedział, a czy satysfakcjonowałaby nas odpowiedź, że na 100%, otrzymamy od 20% do 80% poparcia? No nie sądzę Chcąc mieć za to wąziutki przedział, będziemy mieli małe prawdopodobieństwo że będzie on dobry, czyli na przykład mając przedział od 49,7% do 50,3% będzie duże prawdopodobieństwo, że się pomyliliśmy, a tego nie chcemy Zazwyczaj więc przedział ufności, na poziomie istotności 95% zadowala nas wszystkich

I też bardzo ważna rzecz! To nie \(\displaystyle{ \beta}\) wskakuje do przedziału, bo \(\displaystyle{ \beta}\) przecież, po wyborach będzie ustalona. To nasz przedział ma na 95% pokrywać tą prawdziwą wartość \(\displaystyle{ \beta}\)

Oczywiście sondaż to jeden z przykładów, gdzie zgadujemy wartość parametru oznaczającego procentowe poparcie. Do każdej sytuacji są inne wzory, dla wartości oczekiwanej gdy znamy wariancję - jeden wzór, dla wartości oczekiwanej gdy nie znamy wariancji drugi wzór, a dla wariancji jeszcze inny -- 17 sie 2013, o 16:36 --4. Testowanie hipotez statystycznych

To jest dość ciężki kawałek chleba na statystyce, na przykładach z życia wziętych wygląda to znacznie prościej niż na studiach

Załóżmy, że mamy monetę. Bardzo nam się nudzi i chcemy sprawdzić czy aby na pewno, jest ona symetryczna (czyli sprawiedliwa, tzn. grając nią w orzeł czy reszka, mamy takie samo prawdopodobieństwo wyrzucenia jednego i drugiego - jednym słowem, taka moneta gdybyśmy nią grali na kasę, nie będzie faworyzowała któregoś z graczy )

Przyjmujemy więc hipotezę zerową: TAK, MONETA JEST SYMETRYCZNA, przeciwko hipotezie alternatywnej: NIE, NIE JEST SYMETRYCZNA. Pamiętamy, że w takiej sytuacji nie ruszamy hipotezy alternatywnej, sprawdzamy tylko tą zerową, jeżeli okaże się błędna, to musimy przyjąć tą alternatywną

Zatem, badamy monetę patrząc na hipotezę zerową i staramy się znaleźć przesłanki które nam powiedzą coś o jej prawdziwości Porzucajmy więc trochę tą monetą, powiedzmy z 10000 razy jeżeli ilość orłów i reszek będą subiektywnie do siebie zbliżone np. 5400 orłów 4600 reszek (tu właśnie wkracza subiektywna ocena, bo dla niektórych to może być duża rozbieżność ) to będziemy raczej twierdzić, że hipoteza zerowa jest prawdziwa, więc moneta jest symetryczna Ale jeżeli mamy 8000 orłów a tylko 2000 reszek to znaczy, że z naszą monetą jest coś nie tak I wtedy odrzucamy hipotezę zerową, czyli moneta nie jest symetryczna

Mam nadzieję, że troszkę się rozjaśniło

Pozdrawiam