Chi-kwadrat w excelu

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
Beegos
Użytkownik
Użytkownik
Posty: 5
Rejestracja: 6 cze 2014, o 19:17
Płeć: Mężczyzna
Lokalizacja: Male
Podziękował: 3 razy

Chi-kwadrat w excelu

Post autor: Beegos »

Potrafię zweryfikować w excelu testem chi-kwadrat hipotezę, odnośnie zależności zjawiska od danej cechy(wyznaczenie wartości teoretycznych, zastosowanie funkcji TEST.CHI, interpretacja), natomiast mam problem ze sprawdzeniem stopnia zależności. Nie wiem czy dobrze ująłem mój problem, w każdym razie na dole załączyłem zadanie, którego nie umiem rozwiązać.

Przyjęto następujące hipotezy:
- osoby reprezentujące najwyższe wykształcenie w największym stopniu nabywają produkty regionalne (tabela 1),
- im wyższy poziom dochodu na członka rodziny, tym w większym stopniu osoby nabywają produkty regionalne (tabela 2),
- młodsi wiekiem nabywają więcej produktów regionalnych, niż starsi (tabela 3).

\(\displaystyle{ \begin{tabular}{ccccccc}
ważność nabywania produktów regionalnych & ogółem & w.podstawowe & w.zawodowe & w.średnie & w.wyższe \\
tak & 39 & 0 & 6 & 19 & 14 \\
nie & 61 & 7 & 5 & 27 & 22 \\
\end{tabular}}\)


\(\displaystyle{ \begin{tabular}{cccccccc}
ważność nabywania produktów regionalnych & ogółem & 0-500 & 501-1000 & 1001-1500 & 1501-2000 & 2000+ \\
tak & 39 & 4 & 7 & 12 & 14 & 2 \\
nie & 61 & 13 & 14 & 16 & 10 & 8 \\
\end{tabular}}\)


\(\displaystyle{ \begin{tabular}{ccccccc}
ważność nabywania produktów regionalnych & ogółem & 0-18l & 19-25l & 26-40l & 41l+ \\
tak & 39 & 15 & 10 & 8 & 6 \\
nie & 61 & 24 & 20 & 10 & 7 \\
\end{tabular}}\)



Proszę o pomoc. Byłbym bardzo wdzięczny, jeśli ktoś mógłby mi wytłumaczyć, jak mogę obliczyć tego tego typu zadania za pomocą testu chi-kwadrat w excelu.
SlotaWoj
Użytkownik
Użytkownik
Posty: 4211
Rejestracja: 25 maja 2012, o 21:33
Płeć: Mężczyzna
Lokalizacja: Kraków PL
Podziękował: 2 razy
Pomógł: 758 razy

Chi-kwadrat w excelu

Post autor: SlotaWoj »

Aby analizować stopień zależności (korelację) zmiennych losowych, należy tę zależność określić. Po przyjęciu modelu tej zależności najczęściej stosuje się jakąś metodę regresji, a w przypadku regresji liniowej metodę najmniejszych kwadratów, aby estymować parametry tego modelu. Oczywiście otrzymane wartości parametrów będą obarczone błędem, a tym samym wartości funkcji regresji będą się różnić zarówno od danych eksperymentalnych jak i zależności rzeczywistej, o ile taka istnieje. Przedziały ufności dla estymowanych parametrów modelu określa się przy pomocy rozkładu normalnego (dla bardzo licznych prób) lub t-Studenta (dla średnio- i małolicznych prób)

W przypadku modelu liniowego poziom zależności pomiędzy zmiennymi losowymi określa współczynnik korelacji liniowej Pearsona \(\displaystyle{ r}\), którego wartość możemy otrzymać „przy okazji” wyznaczania parametrów modelu i która zawiera się w przedziale \(\displaystyle{ [-1;1]}\). Wartości współczynnika \(\displaystyle{ r}\) bliskie \(\displaystyle{ 1}\) lub \(\displaystyle{ -1}\) oznaczają silną korelację; bliskie \(\displaystyle{ 0}\) – słabą korelację. Współczynnik korelacji Pearsona jest bardzo czuły na tzw. „dane odstające”, które zmniejszają jego wartość (bezwzględną) i fałszują ocenę silnych (w rzeczywistości) korelacji.

Ze współczynnikiem korelacji liniowej Pearsona jest powiązana zmienna losowa:
  • \(\displaystyle{ F=\frac{n-k}{\frac{1}{r^2}-1}}\)
o rozkładzie F-Snedecora o \(\displaystyle{ n-k}\) stopniach swobody

gdzie:
  • \(\displaystyle{ n}\) – liczba danych,
    \(\displaystyle{ k}\) – liczba parametrów modelu, które trzeba wyznaczyć; dla zależności liniowej \(\displaystyle{ 1}\) (gdy wyraz wolny \(\displaystyle{ =0}\)), lub \(\displaystyle{ 2}\).
Im wartość zmiennej \(\displaystyle{ F}\) jest większe, tym dopasowanie korelacja silniejsza.

Testy do badania istotności korelacji (przy przyjętym modelu) wykonuje się w oparciu rozkłady F-Snedecora lu t-Studenta.

W Excelu regresje można przeprowadzić przy pomocy funkcji RegLinP (liniową) lub RegExpP (wykładniczą – ta jest sprowadzana do liniowej przez logarytmowanie). Obie te funkcje zwracają tablicę zawierającą estymowane parametry modelu oraz inne dane, w tym \(\displaystyle{ r^2}\) (kwadrat współczynnika korelacji Pearsona) i ww. zmienną \(\displaystyle{ F}\).
ODPOWIEDZ