Metoda Hellwiga - dobór zmiennych do modelu ekonometrycznego

Zbiór wzorów, definicji i najczęściej poruszanych problemów z probabilistyki oraz statystyki matematycznej.
Awatar użytkownika
abrasax
Gość Specjalny
Gość Specjalny
Posty: 844
Rejestracja: 20 maja 2005, o 13:19
Płeć: Kobieta
Lokalizacja: Zabrze
Podziękował: 1 raz
Pomógł: 161 razy

Metoda Hellwiga - dobór zmiennych do modelu ekonometrycznego

Post autor: abrasax » 3 lip 2008, o 12:52

Dobór zmiennych do liniowego modelu ekonometrycznego
metodą Hellwiga
(metodą wskaźników pojemności informacyjnej)


W obliczeniach wykorzystywane są współczynniki korelacji między zmiennymi:
  • wektor współczynników korelacji między zmienną objaśnianą \(\displaystyle{ Y}\) a zmiennymi objaśniającymi \(\displaystyle{ X_1, X_2, \ldots, X_n}}\):
    \(\displaystyle{ R_0 = ft[\begin{array}{c}r_1\\r_2\\ \vdots \\r_n\end{array}\right]}\)
  • macierz współczynników korelacji między zmiennymi objaśniającymi \(\displaystyle{ X_1, X_2, \ldots, X_n}}\):
    \(\displaystyle{ R=\left[\begin{array}{cccc}1&r_{12}&\cdots&r_{1n}\\
    r_{12}&1&\ldots&r_{2n}\\
    \vdots &\vdots& \ddots &\vdots \\
    r_{1n}&r_{2n}&\ldots&1
    \end{array}\right]}\)
Szukamy najlepszej kombinacji zmiennych objaśniających - kombinacji o największym integralnym wskaźniku pojemności informacyjnej. Wybieramy zmienne objaśniające silnie skorelowane ze zmienną objaśnianą i słabo skorelowane między sobą. Do wyboru jest \(\displaystyle{ L=2^n-1}\) kombinacji zmiennych objaśniających \(\displaystyle{ X_1, X_2, \ldots, X_n}}\).
  1. Przykład dla 3 zmiennych objaśniających \(\displaystyle{ X_1, X_2, X_3}\):
  2. kombinacje 1-elementowe: \(\displaystyle{ C_1=\{ X_1\}, \ C_2=\{X_2\}, \ C_3=\{X_3\}}\)
  3. kombinacje 2-elementowe: \(\displaystyle{ C_4=\{X_1,X_2\}, \ C_5=\{X_1,X_3\}, \ C_6=\{X_2,X_3\}}\)
  4. kombinacja 3-elementowa: \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\)
Opis metody
  1. Wyznaczamy indywidualne wskaźniki pojemności informacyjnej dla każdej kombinacji
    \(\displaystyle{ h_{kj}=\frac{r_j^2}{1+ \sum\limits_{^{i=1}_{i j}}^m | r_{ij}|}}\)
    \(\displaystyle{ k}\) - numer kombinacji, \(\displaystyle{ k=1, 2, \ldots, l}\)
    \(\displaystyle{ j}\) - numer zmiennej w kombinacji, \(\displaystyle{ j=1, 2, \ldots, m}\)
    1. Przykład dla 3 zmiennych objaśniających:
    2. dla kombinacji \(\displaystyle{ C_1=\{ X_1\}}\):
      \(\displaystyle{ h_{11}=\frac{r_1^2}{1}}\)
    3. dla kombinacji \(\displaystyle{ C_4=\{X_1,X_2\}}\):
      \(\displaystyle{ h_{41}=\frac{r_1^2}{1+|r_{12}|} \\
      h_{42}=\frac{r_2^2}{1+|r_{12}|}}\)
    4. dla kombinacji \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\):
      \(\displaystyle{ h_{71}=\frac{r_1^2}{1+|r_{12}|+|r_{13}|} \\
      h_{72}=\frac{r_2^2}{1+|r_{12}|+|r_{23}|}\\
      h_{73}=\frac{r_3^2}{1+|r_{13}|+|r_{23}|}}\)


      Powyższe obliczenia wykonujemy dla wszystkich kombinacji C.
  2. Obliczamy integralne wskaźniki pojemności informacyjnej dla każdej kombinacji
    \(\displaystyle{ H_k=\sum_{j=1}^mh_{kj}, \ \ k=1, 2, \ldots, l}\)
    1. Przykład dla 3 zmiennych objaśniających:
    2. dla kombinacji \(\displaystyle{ C_1=\{ X_1\}}\):
      \(\displaystyle{ H_1=h_{11}}\)
    3. dla kombinacji \(\displaystyle{ C_4=\{X_1,X_2\}}\):
      \(\displaystyle{ H_4=h_{41}+h_{42}}\)
    4. dla kombinacji \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\):
      \(\displaystyle{ H_7=h_{71}+h_{72}+h_{73}}\)

      Powyższe obliczenia wykonujemy dla wszystkich kombinacji C.
  3. Wybieramy kombinację optymalną
    Wybieramy kombinację o największym integralnym wskaźniku pojemności informacyjnej H. Zmienne z tej kombinacji wchodzą do modelu ekonometrycznego.
Zobacz także przykłady zastosowania metody Hellwiga.
Rekrutacja Instytut Matematyczny, Uniwersytet Wrocławski (gif)

ODPOWIEDZ