Dobór zmiennych do liniowego modelu ekonometrycznego
metodą Hellwiga
(metodą wskaźników pojemności informacyjnej)
metodą Hellwiga
(metodą wskaźników pojemności informacyjnej)
W obliczeniach wykorzystywane są współczynniki korelacji między zmiennymi:
- wektor współczynników korelacji między zmienną objaśnianą \(\displaystyle{ Y}\) a zmiennymi objaśniającymi \(\displaystyle{ X_1, X_2, \ldots, X_n}}\):
\(\displaystyle{ R_0 = ft[\begin{array}{c}r_1\\r_2\\ \vdots \\r_n\end{array}\right]}\) - macierz współczynników korelacji między zmiennymi objaśniającymi \(\displaystyle{ X_1, X_2, \ldots, X_n}}\):
\(\displaystyle{ R=\left[\begin{array}{cccc}1&r_{12}&\cdots&r_{1n}\\
r_{12}&1&\ldots&r_{2n}\\
\vdots &\vdots& \ddots &\vdots \\
r_{1n}&r_{2n}&\ldots&1
\end{array}\right]}\)
- Przykład dla 3 zmiennych objaśniających \(\displaystyle{ X_1, X_2, X_3}\):
- kombinacje 1-elementowe: \(\displaystyle{ C_1=\{ X_1\}, \ C_2=\{X_2\}, \ C_3=\{X_3\}}\)
- kombinacje 2-elementowe: \(\displaystyle{ C_4=\{X_1,X_2\}, \ C_5=\{X_1,X_3\}, \ C_6=\{X_2,X_3\}}\)
- kombinacja 3-elementowa: \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\)
- Wyznaczamy indywidualne wskaźniki pojemności informacyjnej dla każdej kombinacji
\(\displaystyle{ h_{kj}=\frac{r_j^2}{1+ \sum\limits_{^{i=1}_{i j}}^m | r_{ij}|}}\)
\(\displaystyle{ k}\) - numer kombinacji, \(\displaystyle{ k=1, 2, \ldots, l}\)
\(\displaystyle{ j}\) - numer zmiennej w kombinacji, \(\displaystyle{ j=1, 2, \ldots, m}\)
- Przykład dla 3 zmiennych objaśniających:
- dla kombinacji \(\displaystyle{ C_1=\{ X_1\}}\):
\(\displaystyle{ h_{11}=\frac{r_1^2}{1}}\) - dla kombinacji \(\displaystyle{ C_4=\{X_1,X_2\}}\):
\(\displaystyle{ h_{41}=\frac{r_1^2}{1+|r_{12}|} \\
h_{42}=\frac{r_2^2}{1+|r_{12}|}}\) - dla kombinacji \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\):
\(\displaystyle{ h_{71}=\frac{r_1^2}{1+|r_{12}|+|r_{13}|} \\
h_{72}=\frac{r_2^2}{1+|r_{12}|+|r_{23}|}\\
h_{73}=\frac{r_3^2}{1+|r_{13}|+|r_{23}|}}\)
Powyższe obliczenia wykonujemy dla wszystkich kombinacji C.
- Obliczamy integralne wskaźniki pojemności informacyjnej dla każdej kombinacji
\(\displaystyle{ H_k=\sum_{j=1}^mh_{kj}, \ \ k=1, 2, \ldots, l}\)
- Przykład dla 3 zmiennych objaśniających:
- dla kombinacji \(\displaystyle{ C_1=\{ X_1\}}\):
\(\displaystyle{ H_1=h_{11}}\) - dla kombinacji \(\displaystyle{ C_4=\{X_1,X_2\}}\):
\(\displaystyle{ H_4=h_{41}+h_{42}}\) - dla kombinacji \(\displaystyle{ C_7=\{X_1,X_2,X_3\}}\):
\(\displaystyle{ H_7=h_{71}+h_{72}+h_{73}}\)
Powyższe obliczenia wykonujemy dla wszystkich kombinacji C.
- Wybieramy kombinację optymalną
Wybieramy kombinację o największym integralnym wskaźniku pojemności informacyjnej H. Zmienne z tej kombinacji wchodzą do modelu ekonometrycznego.