Selekcja cech (współczynnikk Fishera) - sprawdzenie zadań

Procesy stochastyczne. Sposoby racjonalizowania wielkich ilości informacji. Matematyka w naukach społecznych.
Kosynier
Użytkownik
Użytkownik
Posty: 40
Rejestracja: 17 maja 2009, o 18:19
Płeć: Mężczyzna
Podziękował: 2 razy

Selekcja cech (współczynnikk Fishera) - sprawdzenie zadań

Post autor: Kosynier » 3 sty 2016, o 16:11

Witam, szykuję się do testu ze statystyki i w moje ręce wpadł krążący wśród studentów pdf z rozwiązanym zadaniem z selekcji cech. Spróbowałem rozwiązać je samemu i oczywiście nie zgadzają się wyniki. Proszę o sprawdzenie moich obliczeń i rzucenie okiem na ten plik.

Zadanie polega na obliczeniu współczynnika Fishera dla przestrzeni jedno i dwu wymiarowych, czyli mając dane dwie cechy C0 i C1 obliczamy go dla każdej z osobna i dla obu naraz

Tu jest plik, chodzi o zadanie z pierwszej strony.
http://www.pdf-archive.com/2016/01/03/1/
Chcę zwrócić uwagę zwłaszcza na dzielenie jakie jest tu wykonywane przy obliczaniu macierzy kowariancji. Jest ona dzielona przez 1/3 czyli \(\displaystyle{ \ \ \frac{1}{ilosc \ probek} \ \}\) , czy jest to poprawne?

A tu moje obliczenia i wyniki

Dane są dwie klasy, gdzie każdy wektor odpowiada próbce:
\(\displaystyle{ x^{A} = \left\{ \left[\begin{array}{c}0\\1\end{array}\right]\left[\begin{array}{c}1\\1\end{array}\right]\left[\begin{array}{c}1\\0\end{array}\right] \right\} \ \ \ \ \ \ \ \ \ \ \ \ x^{B} = \left\{ \left[\begin{array}{c}-1\\0\end{array}\right]\left[\begin{array}{c}0\\-1\end{array}\right]\left[\begin{array}{c}-1\\-1\end{array}\right] \right\}}\)

wartości średnie cech to:
\(\displaystyle{ \overline{x^{A}} = \left[\begin{array}{c} \frac{2}{3}\\ \frac{2}{3}\end{array}\right] \ \ \ \ \ \ \ \ \ \overline{x^{B}} = \left[\begin{array}{c} -\frac{2}{3}\\ -\frac{2}{3}\end{array}\right]}\)

najpierw wartości współczynnika Fishera dla przestrzeni jednowymiarowej (pojedyncze cechy)
wariancje
\(\displaystyle{ \sigma_{AC0}^{2}=\frac{2}{9} \ \ \ \ \ \sigma_{AC1}^{2}=\frac{2}{9} \ \ \ \ \ \sigma_{BC0}^{2}=\frac{2}{9} \ \ \ \ \ \sigma_{BC1}^{2}=\frac{2}{9}}\)

odchylenia standardowe
\(\displaystyle{ \sigma_{AC0}=\sigma_{AC1}=\sigma_{BC0}=\sigma_{BC1}=\sqrt{\frac{2}{9}}}\)

wzór na współczynnik Fishera
\(\displaystyle{ F=\frac{|\overline{x^{B}}-\overline{x^{A}}|}{\sigma_{A}+\sigma_{B}}}\)

licznik i mianownik będą takie same dla obu cech, więc:
\(\displaystyle{ F_{C0}=F_{C1}=\frac{|-\frac{2}{3}-\frac{2}{3}|}{\frac{\sqrt{2}}{3}+\frac{\sqrt{2}}{3}}=\sqrt{2}\approx{1.4142}}\)

Współczynnik fishera dla przestrzeni dwuwymiarowej (obie cechy)
macierze kowarjancji
\(\displaystyle{ cov(A)=\left( \left[\begin{array}{ccc}0&1&1\\1&1&0\end{array}\right] - \left[\begin{array}{ccc}\frac{2}{3}&\frac{2}{3}&\frac{2}{3}\\\frac{2}{3}&\frac{2}{3}&\frac{2}{3}\end{array}\right] \right) \cdot \left( \left[\begin{array}{ccc}0&1&1\\1&1&0\end{array}\right] - \left[\begin{array}{ccc}\frac{2}{3}&\frac{2}{3}&\frac{2}{3}\\\frac{2}{3}&\frac{2}{3}&\frac{2}{3}\end{array}\right] \right)^{T} = \left[\begin{array}{cc}\frac{2}{3}&-\frac{1}{3}\\-\frac{1}{3}&\frac{2}{3}\end{array}\right]}\)

\(\displaystyle{ cov(B)=\left( \left[\begin{array}{ccc}-1&0&-1\\0&-1&-1\end{array}\right] - \left[\begin{array}{ccc}-\frac{2}{3}&-\frac{2}{3}&-\frac{2}{3}\\-\frac{2}{3}&-\frac{2}{3}&-\frac{2}{3}\end{array}\right] \right) \cdot \left( \left[\begin{array}{ccc}-1&0&-1\\0&-1&-1\end{array}\right] - \left[\begin{array}{ccc}-\frac{2}{3}&-\frac{2}{3}&-\frac{2}{3}\\-\frac{2}{3}&-\frac{2}{3}&-\frac{2}{3}\end{array}\right] \right)^{T} = \left[\begin{array}{cc}\frac{2}{3}&-\frac{1}{3}\\-\frac{1}{3}&\frac{2}{3}\end{array}\right]}\)

wyznaczniki
\(\displaystyle{ det(cov(A))=\frac{1}{3} \ \ \ \ \ det(cov(B))=\frac{1}{3}}\)

\(\displaystyle{ F_{C0C1}=\frac{\sqrt{(\frac{2}{3}-(-\frac{2}{3}))^2+(\frac{2}{3}-(-\frac{2}{3}))^2}}{\frac{1}{3}+\frac{1}{3}}=2\sqrt{2}\approx2.828}\)

Jako że współczynnik fishera jest największy dla połączenia obu klas najkorzystniejsze jest wybranie ich obu.

Piszcie więc kto ma dobrze i co jest źle.

ODPOWIEDZ