Metoda Hellwiga - dobór zmiennych do modelu ekonometrycznego

abrasax · Post autor: **abrasax** » 3 lip 2008, o 12:52

Dobór zmiennych do liniowego modelu ekonometrycznego
metodą Hellwiga
(metodą wskaźników pojemności informacyjnej)

W obliczeniach wykorzystywane są współczynniki korelacji między zmiennymi:

wektor współczynników korelacji między zmienną objaśnianą \(\displaystyle{ Y}\) a zmiennymi objaśniającymi \(\displaystyle{ X_1, X_2, \ldots, X_n}}\):
\(\displaystyle{ R_0 = ft[\begin{array}{c}r_1\\r_2\\ \vdots \\r_n\end{array}\right]}\)
macierz współczynników korelacji między zmiennymi objaśniającymi \(\displaystyle{ X_1, X_2, \ldots, X_n}}\):
\(\displaystyle{ R=\left[\begin{array}{cccc}1&r_{12}&\cdots&r_{1n}\\
r_{12}&1&\ldots&r_{2n}\\
\vdots &\vdots& \ddots &\vdots \\
r_{1n}&r_{2n}&\ldots&1
\end{array}\right]}\)

Szukamy najlepszej kombinacji zmiennych objaśniających - kombinacji o największym integralnym wskaźniku pojemności informacyjnej. Wybieramy zmienne objaśniające silnie skorelowane ze zmienną objaśnianą i słabo skorelowane między sobą. Do wyboru jest \(\displaystyle{ L=2^n-1}\) kombinacji zmiennych objaśniających \(\displaystyle{ X_1, X_2, \ldots, X_n}}\).

Przykład dla 3 zmiennych objaśniających \(\displaystyle{ X_1, X_2, X_3}\):
kombinacje 1-elementowe: \(\displaystyle{ C_1=\{ X_1\}, \ C_2=\{X_2\}, \ C_3=\{X_3\}}\)
kombinacje 2-elementowe: \(\displaystyle{ C_4=\{X_1,X_2\}, \ C_5=\{X_1,X_3\}, \ C_6=\{X_2,X_3\}}\)
kombinacja 3-elementowa: \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\)

Opis metody

Wyznaczamy indywidualne wskaźniki pojemności informacyjnej dla każdej kombinacji
\(\displaystyle{ h_{kj}=\frac{r_j^2}{1+ \sum\limits_{^{i=1}_{i j}}^m | r_{ij}|}}\)
\(\displaystyle{ k}\) - numer kombinacji, \(\displaystyle{ k=1, 2, \ldots, l}\)
\(\displaystyle{ j}\) - numer zmiennej w kombinacji, \(\displaystyle{ j=1, 2, \ldots, m}\)
1. Przykład dla 3 zmiennych objaśniających:
2. dla kombinacji \(\displaystyle{ C_1=\{ X_1\}}\):
  \(\displaystyle{ h_{11}=\frac{r_1^2}{1}}\)
3. dla kombinacji \(\displaystyle{ C_4=\{X_1,X_2\}}\):
  \(\displaystyle{ h_{41}=\frac{r_1^2}{1+|r_{12}|} \\
  h_{42}=\frac{r_2^2}{1+|r_{12}|}}\)
4. dla kombinacji \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\):
  \(\displaystyle{ h_{71}=\frac{r_1^2}{1+|r_{12}|+|r_{13}|} \\
  h_{72}=\frac{r_2^2}{1+|r_{12}|+|r_{23}|}\\
  h_{73}=\frac{r_3^2}{1+|r_{13}|+|r_{23}|}}\)
  
  Powyższe obliczenia wykonujemy dla wszystkich kombinacji C.
Obliczamy integralne wskaźniki pojemności informacyjnej dla każdej kombinacji
\(\displaystyle{ H_k=\sum_{j=1}^mh_{kj}, \ \ k=1, 2, \ldots, l}\)
1. Przykład dla 3 zmiennych objaśniających:
2. dla kombinacji \(\displaystyle{ C_1=\{ X_1\}}\):
  \(\displaystyle{ H_1=h_{11}}\)
3. dla kombinacji \(\displaystyle{ C_4=\{X_1,X_2\}}\):
  \(\displaystyle{ H_4=h_{41}+h_{42}}\)
4. dla kombinacji \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\):
  \(\displaystyle{ H_7=h_{71}+h_{72}+h_{73}}\)
  
  Powyższe obliczenia wykonujemy dla wszystkich kombinacji C.
Wybieramy kombinację optymalną
Wybieramy kombinację o największym integralnym wskaźniku pojemności informacyjnej H. Zmienne z tej kombinacji wchodzą do modelu ekonometrycznego.

Zobacz także przykłady zastosowania metody Hellwiga.