Centralne twierdzenie graniczne
-
- Użytkownik
- Posty: 14
- Rejestracja: 15 lis 2012, o 14:53
- Płeć: Kobieta
- Lokalizacja: United Kingdom
- Podziękował: 2 razy
Centralne twierdzenie graniczne
no i mam nastepny problem...
musze napisac co to jest i jak moga byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi:
1. standaryzacja
2. Centralne twierdzenie graniczne
3. Przedział ufności
4. Weryfikacja hipotez statystycznych
czy ktos moze to wytlumaczyc jezykiem prostym a nie matematycznym?
wiem wiem ze jestem glupia.... ale nie kazdy jest zdolny do rozumienia statystyki....
musze napisac co to jest i jak moga byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi:
1. standaryzacja
2. Centralne twierdzenie graniczne
3. Przedział ufności
4. Weryfikacja hipotez statystycznych
czy ktos moze to wytlumaczyc jezykiem prostym a nie matematycznym?
wiem wiem ze jestem glupia.... ale nie kazdy jest zdolny do rozumienia statystyki....
-
- Użytkownik
- Posty: 14
- Rejestracja: 15 lis 2012, o 14:53
- Płeć: Kobieta
- Lokalizacja: United Kingdom
- Podziękował: 2 razy
Centralne twierdzenie graniczne
'standaryzacja jest w statystyce rodzajem normalizacji zmiennej losowej, w wyniku której zmienna uzyskuje średnią wartość oczekiwaną zero i wariancję jeden. Najczęściej spotykanym sposobem standaryzacji jest tzw. standaryzacja Z'
przeczytalam i dalej nie rozumie..... szczegolnie do pytania :
jak standaryzacja moze byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi?
nie da sie jakos powiedziec tego po ludzku????
przeczytalam i dalej nie rozumie..... szczegolnie do pytania :
jak standaryzacja moze byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi?
nie da sie jakos powiedziec tego po ludzku????
-
- Użytkownik
- Posty: 14
- Rejestracja: 15 lis 2012, o 14:53
- Płeć: Kobieta
- Lokalizacja: United Kingdom
- Podziękował: 2 razy
Centralne twierdzenie graniczne
co to jest normalizacja zmiennej losowej?
dlaczego normalizacja jest uzyteczna do sprawdzenia zaleznosci pomiedzy zmiennymi?
btw... miodzio1988 zaloze sie ze Ty jestes nauczycielem.... moja nauczycielka tez tak pytala: "czego ty tu nie rozumiesz???????" OMG jak ja jej nienawidzilam.....
dlaczego normalizacja jest uzyteczna do sprawdzenia zaleznosci pomiedzy zmiennymi?
btw... miodzio1988 zaloze sie ze Ty jestes nauczycielem.... moja nauczycielka tez tak pytala: "czego ty tu nie rozumiesz???????" OMG jak ja jej nienawidzilam.....
-
- Użytkownik
- Posty: 14
- Rejestracja: 15 lis 2012, o 14:53
- Płeć: Kobieta
- Lokalizacja: United Kingdom
- Podziękował: 2 razy
Centralne twierdzenie graniczne
super :-D
znaczy jako nauczyciel potrafisz mi to wytlumaczyc wlasnymi slowami bo cytowac z internetu to kazdy potrafi i nie trzeba do tego studiow konczyc ....
znaczy jako nauczyciel potrafisz mi to wytlumaczyc wlasnymi slowami bo cytowac z internetu to kazdy potrafi i nie trzeba do tego studiow konczyc ....
Centralne twierdzenie graniczne
Super
Jak napiszesz konkretnie czego nie rozumiesz to Ci bardzo chętnie to wytłumaczę;. Oczywiście jesli odpowiedzi nie da się w necie znaleźć. A póki co widzę, że się ciągle da
Jak napiszesz konkretnie czego nie rozumiesz to Ci bardzo chętnie to wytłumaczę;. Oczywiście jesli odpowiedzi nie da się w necie znaleźć. A póki co widzę, że się ciągle da
-
- Użytkownik
- Posty: 14
- Rejestracja: 15 lis 2012, o 14:53
- Płeć: Kobieta
- Lokalizacja: United Kingdom
- Podziękował: 2 razy
Centralne twierdzenie graniczne
czego nie rozumiesz z mojej wypowiedzi????
jak standaryzacja moze byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi
jak standaryzacja moze byc uzyteczne do sprawdzenia statystycznej zaleznosci pomiedzy zmiennymi
Centralne twierdzenie graniczne
Pierwsza informacja po wpisaniu zdania w google to:
W których z tych rzeczy może występować standaryzacja? Oczywiście nie są to jedynie tematy związane z zależnością zmiennychNajwazniejszych rzeczy nie napisales, mianowicie jaki jest rozklad badanych cech.
W zaleznosci od tego rozkladu mozesz
1. sprawdzic korelacje Pearsona
2. sprawdzic korelacje Spearmana
3. podzielic menadzerow na efektywnych i nie oraz wykonac test Wilcoxona
4. wykonac analize kanoniczna
...
-
- Użytkownik
- Posty: 14
- Rejestracja: 15 lis 2012, o 14:53
- Płeć: Kobieta
- Lokalizacja: United Kingdom
- Podziękował: 2 razy
Centralne twierdzenie graniczne
wiesz... wydaje mi sie ze mowimy dwoma roznymi jezykami....
ale dzieki za probe pomocy....
ale dzieki za probe pomocy....
-
- Użytkownik
- Posty: 226
- Rejestracja: 15 gru 2010, o 23:04
- Płeć: Mężczyzna
- Lokalizacja: Kutno
- Podziękował: 58 razy
- Pomógł: 9 razy
Centralne twierdzenie graniczne
To może ja odpowiem prostym językiem
1. Standaryzacja
Jest w statystyce taki rozkład zwany normalnym Ma on bardzo szerokie zastosowanie w statystyce, ponieważ wiele zjawisk do niego pasuje (np. IQ w określonych regionach świata). Ma on dwa podstawowe parametry: \(\displaystyle{ \mu}\) czyli wartość oczekiwaną (średnią jakiej oczekujemy przeprowadzając badanie) oraz \(\displaystyle{ \sigma ^{2}}\) czyli wariancję (odchylenie wyników badania od próby - im większa wariancja tym wyniki bardziej rozrzucone) Oglądałem program na Discovery gdzie była mowa o IQ dla różnych nacji i tam była mowa o rozkładzie normalnym (pamiętam tylko, że najwyższą wartość oczekiwaną, bo aż 128 mieli Żydzi Aszkenazyjscy - oznacza to, że teoretycznie są najbardziej inteligentni). Trzymając się już tego IQ, przypuśćmy, że w Polsce wartość oczekiwana wynosi 115 (nie wiem ile naprawdę ). Jeżeli wariancja byłaby duża, to znaczy, że wyniki bardzo od niej odskakują, po polsku - mamy wielu "idiotów" i wielu "geniuszy", a mało "przeciętniaków", natomiast, gdyby wariancja była mała, to właściwie są w Polsce sami "przeciętniacy"
Ale co to standaryzacja? Rozkład normalny o parametrach \(\displaystyle{ \mu}\) oraz \(\displaystyle{ \sigma ^{2}}\) jest trudny do odczytania. Powstał więc pomysł by wprowadzić standaryzowany rozkład Gaussa (czyli normalny, bo to ma dwie nazwy), dla którego \(\displaystyle{ \mu = 0}\) oraz \(\displaystyle{ \sigma ^{2} = 1}\)
Dla takiego rozkładu mamy już gotowe tablice, do odczytywania jego wartości
Standaryzować możemy dowolną zmienną o rozkładzie \(\displaystyle{ \mu}\) oraz \(\displaystyle{ \sigma ^{2}}\), odejmując od niej jej wartość oczekiwaną, a następnie dzieląc ją przez pierwiastek z wariancji Tak otrzymana nowa zmienna, ma już na pewno rozkład standaryzowany Gaussa
-- 17 sie 2013, o 16:15 --
2. Centralne Twierdzenie Graniczne (CTG)
Twierdzenie, które mówi, że jeżeli mamy jakiś ciąg \(\displaystyle{ X _{n}}\) n prób, wiedząc że każda ma ten sam rozkład oraz że wszystkie próby są od siebie niezależne (dobrymi przykładami jest rzucanie n-razy tą samą symetryczną kostką, albo badanie u n-osób ich IQ, albo ilości włosów na ich głowach) to oznaczając przez \(\displaystyle{ S _{n}}\) sumę każdego z tych wyników i przekształcając tą sumę odpowiednio, będziemy mogli wartość prawdopodobieństwa odczytać z tablic standaryzowanego rozkładu normalnego
Jakich przekształceń dokonujemy? Mając już \(\displaystyle{ S _{n}}\) odejmujemy od niego \(\displaystyle{ n\mu}\) gdzie \(\displaystyle{ \mu}\) to wartość oczekiwana zmiennej \(\displaystyle{ X _{i}}\) (a ponieważ, zmienne te mają te same rozkłady zgodnie z założeniem to pierwsza, druga, trzecia itd. jak i ostatnia zmienna mają taką samą wartość oczekiwaną). Następnie dzielimy tą zmienną przez \(\displaystyle{ \sqrt{n} \sigma}\), gdzie \(\displaystyle{ \sigma}\) to pierwiastek z wariancji zmiennej \(\displaystyle{ X _{i}}\) (a ponieważ, zmienne te mają te same rozkłady zgodnie z założeniem to pierwsza, druga, trzecia itd. jak i ostatnia zmienna mają taką samą wariancję). Definiując naszą nową zmienną:
\(\displaystyle{ Y:= \frac{S _{n} - n\mu}{\sqrt{n} \sigma}}\)
I teraz prawdopodobieństwo tego, że wartość zmiennej \(\displaystyle{ Y}\) jest mniejsza równa od jakiejś liczby \(\displaystyle{ t}\), można odczytać z tablic wartości dystrybuanty rozkładu normalnego standaryzowanego, bo w nieskończoności będą się ze sobą pokrywać Zapis formalny:
\(\displaystyle{ P\left( Y \le t\right)}\) w nieskończoności dąży do \(\displaystyle{ \Phi \left( t\right)}\)
Gdzie \(\displaystyle{ \Phi(x)}\) to wartość dystrybuanty rozkładu normalnego dla argumentu \(\displaystyle{ x}\) (ten znaczek, to duża litera Phi czytana jako fi )
-- 17 sie 2013, o 16:27 --
3. Przedział ufności
Opowiem na prostym przykładzie Mamy wybory. Siedzimy w rządzie jednego z kandydatów X, który usilnie chce się dowiedzieć, ile procent poparcia otrzyma w tych wyborach. Wiadomo, że przecież, nie da się przepytać przed wyborami wszystkich Polaków Ale jest na to sposób Akurat w tym przypadku bierze się tysiąc osób (dla prawidłowości wyników powinno się pytać 1067 osób ale ciężko by się liczyło) na kogo oddadzą swój głos. Faktyczna wartość procentowego poparcia jest jakaś dajmy na to \(\displaystyle{ \beta}\), my jej nie znamy, ale po wyborach będzie znana Na podstawie danych zebranych po przepytaniu tych osób jesteśmy w stanie podać przedział, który prawie na pewno (zazwyczaj na 95%) będzie nam pokrywał ten wynik osiągnięty po wyborach
Dlaczego 95% a nie 100%? Otóż sprawa jest bardzo prosta, im bardziej chcemy być pewni, tym bardziej się poszerzy nasz przedział, a czy satysfakcjonowałaby nas odpowiedź, że na 100%, otrzymamy od 20% do 80% poparcia? No nie sądzę Chcąc mieć za to wąziutki przedział, będziemy mieli małe prawdopodobieństwo że będzie on dobry, czyli na przykład mając przedział od 49,7% do 50,3% będzie duże prawdopodobieństwo, że się pomyliliśmy, a tego nie chcemy Zazwyczaj więc przedział ufności, na poziomie istotności 95% zadowala nas wszystkich
I też bardzo ważna rzecz! To nie \(\displaystyle{ \beta}\) wskakuje do przedziału, bo \(\displaystyle{ \beta}\) przecież, po wyborach będzie ustalona. To nasz przedział ma na 95% pokrywać tą prawdziwą wartość \(\displaystyle{ \beta}\)
Oczywiście sondaż to jeden z przykładów, gdzie zgadujemy wartość parametru oznaczającego procentowe poparcie. Do każdej sytuacji są inne wzory, dla wartości oczekiwanej gdy znamy wariancję - jeden wzór, dla wartości oczekiwanej gdy nie znamy wariancji drugi wzór, a dla wariancji jeszcze inny -- 17 sie 2013, o 16:36 --4. Testowanie hipotez statystycznych
To jest dość ciężki kawałek chleba na statystyce, na przykładach z życia wziętych wygląda to znacznie prościej niż na studiach
Załóżmy, że mamy monetę. Bardzo nam się nudzi i chcemy sprawdzić czy aby na pewno, jest ona symetryczna (czyli sprawiedliwa, tzn. grając nią w orzeł czy reszka, mamy takie samo prawdopodobieństwo wyrzucenia jednego i drugiego - jednym słowem, taka moneta gdybyśmy nią grali na kasę, nie będzie faworyzowała któregoś z graczy )
Przyjmujemy więc hipotezę zerową: TAK, MONETA JEST SYMETRYCZNA, przeciwko hipotezie alternatywnej: NIE, NIE JEST SYMETRYCZNA. Pamiętamy, że w takiej sytuacji nie ruszamy hipotezy alternatywnej, sprawdzamy tylko tą zerową, jeżeli okaże się błędna, to musimy przyjąć tą alternatywną
Zatem, badamy monetę patrząc na hipotezę zerową i staramy się znaleźć przesłanki które nam powiedzą coś o jej prawdziwości Porzucajmy więc trochę tą monetą, powiedzmy z 10000 razy jeżeli ilość orłów i reszek będą subiektywnie do siebie zbliżone np. 5400 orłów 4600 reszek (tu właśnie wkracza subiektywna ocena, bo dla niektórych to może być duża rozbieżność ) to będziemy raczej twierdzić, że hipoteza zerowa jest prawdziwa, więc moneta jest symetryczna Ale jeżeli mamy 8000 orłów a tylko 2000 reszek to znaczy, że z naszą monetą jest coś nie tak I wtedy odrzucamy hipotezę zerową, czyli moneta nie jest symetryczna
Mam nadzieję, że troszkę się rozjaśniło
Pozdrawiam
1. Standaryzacja
Jest w statystyce taki rozkład zwany normalnym Ma on bardzo szerokie zastosowanie w statystyce, ponieważ wiele zjawisk do niego pasuje (np. IQ w określonych regionach świata). Ma on dwa podstawowe parametry: \(\displaystyle{ \mu}\) czyli wartość oczekiwaną (średnią jakiej oczekujemy przeprowadzając badanie) oraz \(\displaystyle{ \sigma ^{2}}\) czyli wariancję (odchylenie wyników badania od próby - im większa wariancja tym wyniki bardziej rozrzucone) Oglądałem program na Discovery gdzie była mowa o IQ dla różnych nacji i tam była mowa o rozkładzie normalnym (pamiętam tylko, że najwyższą wartość oczekiwaną, bo aż 128 mieli Żydzi Aszkenazyjscy - oznacza to, że teoretycznie są najbardziej inteligentni). Trzymając się już tego IQ, przypuśćmy, że w Polsce wartość oczekiwana wynosi 115 (nie wiem ile naprawdę ). Jeżeli wariancja byłaby duża, to znaczy, że wyniki bardzo od niej odskakują, po polsku - mamy wielu "idiotów" i wielu "geniuszy", a mało "przeciętniaków", natomiast, gdyby wariancja była mała, to właściwie są w Polsce sami "przeciętniacy"
Ale co to standaryzacja? Rozkład normalny o parametrach \(\displaystyle{ \mu}\) oraz \(\displaystyle{ \sigma ^{2}}\) jest trudny do odczytania. Powstał więc pomysł by wprowadzić standaryzowany rozkład Gaussa (czyli normalny, bo to ma dwie nazwy), dla którego \(\displaystyle{ \mu = 0}\) oraz \(\displaystyle{ \sigma ^{2} = 1}\)
Dla takiego rozkładu mamy już gotowe tablice, do odczytywania jego wartości
Standaryzować możemy dowolną zmienną o rozkładzie \(\displaystyle{ \mu}\) oraz \(\displaystyle{ \sigma ^{2}}\), odejmując od niej jej wartość oczekiwaną, a następnie dzieląc ją przez pierwiastek z wariancji Tak otrzymana nowa zmienna, ma już na pewno rozkład standaryzowany Gaussa
-- 17 sie 2013, o 16:15 --
2. Centralne Twierdzenie Graniczne (CTG)
Twierdzenie, które mówi, że jeżeli mamy jakiś ciąg \(\displaystyle{ X _{n}}\) n prób, wiedząc że każda ma ten sam rozkład oraz że wszystkie próby są od siebie niezależne (dobrymi przykładami jest rzucanie n-razy tą samą symetryczną kostką, albo badanie u n-osób ich IQ, albo ilości włosów na ich głowach) to oznaczając przez \(\displaystyle{ S _{n}}\) sumę każdego z tych wyników i przekształcając tą sumę odpowiednio, będziemy mogli wartość prawdopodobieństwa odczytać z tablic standaryzowanego rozkładu normalnego
Jakich przekształceń dokonujemy? Mając już \(\displaystyle{ S _{n}}\) odejmujemy od niego \(\displaystyle{ n\mu}\) gdzie \(\displaystyle{ \mu}\) to wartość oczekiwana zmiennej \(\displaystyle{ X _{i}}\) (a ponieważ, zmienne te mają te same rozkłady zgodnie z założeniem to pierwsza, druga, trzecia itd. jak i ostatnia zmienna mają taką samą wartość oczekiwaną). Następnie dzielimy tą zmienną przez \(\displaystyle{ \sqrt{n} \sigma}\), gdzie \(\displaystyle{ \sigma}\) to pierwiastek z wariancji zmiennej \(\displaystyle{ X _{i}}\) (a ponieważ, zmienne te mają te same rozkłady zgodnie z założeniem to pierwsza, druga, trzecia itd. jak i ostatnia zmienna mają taką samą wariancję). Definiując naszą nową zmienną:
\(\displaystyle{ Y:= \frac{S _{n} - n\mu}{\sqrt{n} \sigma}}\)
I teraz prawdopodobieństwo tego, że wartość zmiennej \(\displaystyle{ Y}\) jest mniejsza równa od jakiejś liczby \(\displaystyle{ t}\), można odczytać z tablic wartości dystrybuanty rozkładu normalnego standaryzowanego, bo w nieskończoności będą się ze sobą pokrywać Zapis formalny:
\(\displaystyle{ P\left( Y \le t\right)}\) w nieskończoności dąży do \(\displaystyle{ \Phi \left( t\right)}\)
Gdzie \(\displaystyle{ \Phi(x)}\) to wartość dystrybuanty rozkładu normalnego dla argumentu \(\displaystyle{ x}\) (ten znaczek, to duża litera Phi czytana jako fi )
-- 17 sie 2013, o 16:27 --
3. Przedział ufności
Opowiem na prostym przykładzie Mamy wybory. Siedzimy w rządzie jednego z kandydatów X, który usilnie chce się dowiedzieć, ile procent poparcia otrzyma w tych wyborach. Wiadomo, że przecież, nie da się przepytać przed wyborami wszystkich Polaków Ale jest na to sposób Akurat w tym przypadku bierze się tysiąc osób (dla prawidłowości wyników powinno się pytać 1067 osób ale ciężko by się liczyło) na kogo oddadzą swój głos. Faktyczna wartość procentowego poparcia jest jakaś dajmy na to \(\displaystyle{ \beta}\), my jej nie znamy, ale po wyborach będzie znana Na podstawie danych zebranych po przepytaniu tych osób jesteśmy w stanie podać przedział, który prawie na pewno (zazwyczaj na 95%) będzie nam pokrywał ten wynik osiągnięty po wyborach
Dlaczego 95% a nie 100%? Otóż sprawa jest bardzo prosta, im bardziej chcemy być pewni, tym bardziej się poszerzy nasz przedział, a czy satysfakcjonowałaby nas odpowiedź, że na 100%, otrzymamy od 20% do 80% poparcia? No nie sądzę Chcąc mieć za to wąziutki przedział, będziemy mieli małe prawdopodobieństwo że będzie on dobry, czyli na przykład mając przedział od 49,7% do 50,3% będzie duże prawdopodobieństwo, że się pomyliliśmy, a tego nie chcemy Zazwyczaj więc przedział ufności, na poziomie istotności 95% zadowala nas wszystkich
I też bardzo ważna rzecz! To nie \(\displaystyle{ \beta}\) wskakuje do przedziału, bo \(\displaystyle{ \beta}\) przecież, po wyborach będzie ustalona. To nasz przedział ma na 95% pokrywać tą prawdziwą wartość \(\displaystyle{ \beta}\)
Oczywiście sondaż to jeden z przykładów, gdzie zgadujemy wartość parametru oznaczającego procentowe poparcie. Do każdej sytuacji są inne wzory, dla wartości oczekiwanej gdy znamy wariancję - jeden wzór, dla wartości oczekiwanej gdy nie znamy wariancji drugi wzór, a dla wariancji jeszcze inny -- 17 sie 2013, o 16:36 --4. Testowanie hipotez statystycznych
To jest dość ciężki kawałek chleba na statystyce, na przykładach z życia wziętych wygląda to znacznie prościej niż na studiach
Załóżmy, że mamy monetę. Bardzo nam się nudzi i chcemy sprawdzić czy aby na pewno, jest ona symetryczna (czyli sprawiedliwa, tzn. grając nią w orzeł czy reszka, mamy takie samo prawdopodobieństwo wyrzucenia jednego i drugiego - jednym słowem, taka moneta gdybyśmy nią grali na kasę, nie będzie faworyzowała któregoś z graczy )
Przyjmujemy więc hipotezę zerową: TAK, MONETA JEST SYMETRYCZNA, przeciwko hipotezie alternatywnej: NIE, NIE JEST SYMETRYCZNA. Pamiętamy, że w takiej sytuacji nie ruszamy hipotezy alternatywnej, sprawdzamy tylko tą zerową, jeżeli okaże się błędna, to musimy przyjąć tą alternatywną
Zatem, badamy monetę patrząc na hipotezę zerową i staramy się znaleźć przesłanki które nam powiedzą coś o jej prawdziwości Porzucajmy więc trochę tą monetą, powiedzmy z 10000 razy jeżeli ilość orłów i reszek będą subiektywnie do siebie zbliżone np. 5400 orłów 4600 reszek (tu właśnie wkracza subiektywna ocena, bo dla niektórych to może być duża rozbieżność ) to będziemy raczej twierdzić, że hipoteza zerowa jest prawdziwa, więc moneta jest symetryczna Ale jeżeli mamy 8000 orłów a tylko 2000 reszek to znaczy, że z naszą monetą jest coś nie tak I wtedy odrzucamy hipotezę zerową, czyli moneta nie jest symetryczna
Mam nadzieję, że troszkę się rozjaśniło
Pozdrawiam