Wielomian charakterystyczny

Przestrzenie wektorowe, bazy, liniowa niezależność, macierze.... Formy kwadratowe, twierdzenia o klasyfikacji...
Awatar użytkownika
Mariusz M
Użytkownik
Użytkownik
Posty: 6910
Rejestracja: 25 wrz 2007, o 01:03
Płeć: Mężczyzna
Lokalizacja: 53°02'N 18°35'E
Podziękował: 2 razy
Pomógł: 1246 razy

Wielomian charakterystyczny

Post autor: Mariusz M »

Jak wiemy wielomian charakterystyczny możemy znaleźć licząc wyznacznik \(\displaystyle{ \det{\left( A-\lambda \cdot I\right) }}\)
jednak gdybyśmy chcieli użyć jakiegoś zaawansowanego kalkulatora czy programu komputerowego to
moglibyśmy mieć problem z policzeniem tego wyznacznika
Poniżej przedstawię wielomian charakterystyczny którego współczynniki wyrażone są za pomocą sumy minorów
Ukryta treść:    
\(\displaystyle{
=\det{ \begin{bmatrix} a_{11} &a_{12}&a_{13}&a_{14} \\ a_{21}&a_{22}&a_{23}&a_{24} \\a_{31}&a_{32}&a_{33}&a_{34}\\a_{41}&a_{42}&a_{43}&a_{44} \end{bmatrix} } \\-\lambda \cdot\left( \det{ \begin{bmatrix} a_{11}&a_{12}&a_{13} \\ a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33} \end{bmatrix} } +\det{ \begin{bmatrix} a_{11}&a_{12}&a_{14} \\a_{21}&a_{22}&a_{24}\\a_{41}&a_{42}&a_{44} \end{bmatrix} }+\det{ \begin{bmatrix} a_{11}&a_{13}&a_{14} \\ a_{31}&a_{33}&a_{34}\\a_{41}&a_{43}&a_{44}\end{bmatrix} } + \det{ \begin{bmatrix} a_{22} & a_{23}&a_{24} \\ a_{32}&a_{33} & a_{34} \\ a_{42}&a_{43}&a_{44} \end{bmatrix} }\right)\\+ \lambda^2\left( \det{\begin{bmatrix} a_{11}&a_{12} \\a_{21}&a_{22} \end{bmatrix} }+\det{ \begin{bmatrix} a_{11}&a_{13} \\ a_{31}&a_{33}\end{bmatrix} }+\det{ \begin{bmatrix} a_{11}&a_{14} \\a_{41}&a_{44}\end{bmatrix} } + \det{ \begin{bmatrix} a_{22} & a_{23} \\ a_{32}&a_{33} \end{bmatrix} }+\det{ \begin{bmatrix} a_{22}&a_{24} \\ a_{42}&a_{44} \end{bmatrix} } +\det{ \begin{bmatrix} a_{33}&a_{34} \\ a_{43}&a_{44} \end{bmatrix} }\right)\\-\lambda^3\left(a_{11}+a_{22}+a_{33}+a_{44}\right)+\lambda^4
}\)


Okazuje się że preferowany przez matematyków sposób obliczania współczynników równania charakterystycznego
jest nieefektywny jeżeli obliczenia chcemy wykonać na kalkulatorze lub w programie matematycznym

Z moich obserwacji wynika że liczba minorów stopnia \(\displaystyle{ n-k}\) potrzebna do policzenia \(\displaystyle{ k.}\) współczynnika wynosi \(\displaystyle{ {n \choose n-k} }\)
a liczba wszystkich potrzebnych minorów to \(\displaystyle{ 2^n}\)
Czy moje obserwacje są prawdziwe ?

Jak wyglądałby wybór minorów w przypadku wielomianu charakterystycznego stopnia \(\displaystyle{ n}\)
3a174ad9764fefcb
Użytkownik
Użytkownik
Posty: 287
Rejestracja: 18 lip 2022, o 17:46
Płeć: Mężczyzna
wiek: 40
Podziękował: 3 razy
Pomógł: 41 razy

Re: Wielomian charakterystyczny

Post autor: 3a174ad9764fefcb »

Żałuję, że kliknąłem przycisk „Pokaż”. Ciekawość, to pierwszy stopień do piekła.
mariuszm pisze: 31 lip 2022, o 21:18 Okazuje się że preferowany przez matematyków sposób obliczania współczynników równania charakterystycznego
jest nieefektywny jeżeli obliczenia chcemy wykonać na kalkulatorze lub w programie matematycznym
Nie wiem czy można to nazwać preferowanym sposobem obliczania. Są oczywiście zadania na znalezienie postaci Jordana, które studenci mogą obliczyć bez kalkulatora, ale tam zwykle nawet nie trzeba znajdować wielomianu charakterystycznego, bo pierwiastki są wymierne. Żeby móc zgadywać pierwiastki wymierne, wystarczy wyraz wolny tego wielomianu. Nie sądzę, żeby w matematyce obliczeniowej powyższe rozwinięcia były preferowaną metodą. Sądzę, że jeśli ktoś chciałby obliczyć wielomian charakterystyczny, obliczyłby numerycznie odpowiednie pochodne albo najpierw znalazłby numerycznie wartości własne. Natomiast w matematyce teoretycznej też chyba takie rozwijanie nie ma dużego zastosowania. W dowodach twierdzeń zwykle wystarczy ten wielomian zapisać jako \(\det( A-\lambda \cdot I)\) albo (\(\lambda_1-x)\cdot\ldots\cdot(\lambda_n-x)\), bez dalszego rozwijania.
mariuszm pisze: 31 lip 2022, o 21:18 Z moich obserwacji wynika że liczba minorów stopnia \(\displaystyle{ n-k}\) potrzebna do policzenia \(\displaystyle{ k.}\) współczynnika wynosi \(\displaystyle{ {n \choose n-k} }\)
a liczba wszystkich potrzebnych minorów to \(\displaystyle{ 2^n}\)
Czy moje obserwacje są prawdziwe ?
Zgadza się.
mariuszm pisze: 31 lip 2022, o 21:18 Jak wyglądałby wybór minorów w przypadku wielomianu charakterystycznego stopnia \(\displaystyle{ n}\)
Żeby obliczyć współczynnik przy \(x^k\), musisz uwzględnić każdy \(k\)-elementowy zbiór \(x\)-ów znajdujących się na przekątnej macierzy. Czyli bierzesz każdy \(k\)-elementowy podzbiór \(\{i_1, i_2,\ldots, i_k\}\subseteq\{1,2,\ldots,n\}\), z macierzy wykreślasz wiersze o indeksach \(i_1, i_2,\ldots, i_k\) oraz kolumny o tychże indeksach, obliczasz wyznacznik tak powstałej macierzy i mnożysz przez \((-1)^k\), bo przy każdym \(x\) jest minus. Łącznie więc współczynnik przy \(x^k\) będzie sumą \(\binom nk\) składników.
Awatar użytkownika
Mariusz M
Użytkownik
Użytkownik
Posty: 6910
Rejestracja: 25 wrz 2007, o 01:03
Płeć: Mężczyzna
Lokalizacja: 53°02'N 18°35'E
Podziękował: 2 razy
Pomógł: 1246 razy

Re: Wielomian charakterystyczny

Post autor: Mariusz M »

Pisząc o preferowanej metodzie miałem ma myśli właśnie liczenie wyznacznika \(\displaystyle{ \det{\left( A-\lambda I\right) }}\)
a to rozwinięcie ułatwiłoby policzenie go z wykorzystaniem kalkulatora lub programu komputerowego
Okazuje się że ten sposób liczenia jest mało efektywny gdybyśmy do obliczeń chcieli użyć kalkulatora czy programu matematycznego

Znam jeszcze dwa sposoby na znalezienie wielomianu charakterystycznego

1.

Postawmy następującą hipotezę

\(\displaystyle{ \mathrm{Tr}\left( A^{m}\right)=\sum_{k=1}^{n}{\lambda_{k}^m} }\)

Jak widzimy ślad potęgi macierzy daje sumę jednakowych potęg wartości własnych
Taka suma jest funkcją symetryczną i może być przedstawiona za pomocą funkcji symetrycznych podstawowych
Wzory Newtona-Girarda wiążą funkcje symetryczne podstawowe oraz funkcje symetryczne będące sumami jednakowych potęg

\(\displaystyle{ me_{m} = \sum_{j=1}^{m}{\left( -1\right)^{j-1}e_{m-j}p_{j} } \\}\)

Z wzorów Vieta wiemy że

\(\displaystyle{ e_{m}=\left( -1\right)^{m}a_{n-m} }\)
gdzie \(\displaystyle{ a_{m}}\) są współczynnikami następującego wielomianu
\(\displaystyle{ \lambda^n+a_{n-1}\lambda^{n-1}+\cdots+a_{1}\lambda+a_{0}}\)

Wstawiając powyższe zależności do wzorów Newtona-Girarda otrzymujemy

\(\displaystyle{
\begin{cases} a_{n}=1 \\ m\left( -1\right)^{m}a_{n-m} =\sum_{j=1}^{m}{\left( -1\right)^{j-1}\left( -1\right)^{m-j} a_{n-\left( m-j\right) } \mathrm{Tr}\left( A^{j}\right)} \end{cases} \\
\begin{cases} a_{n}=1 \\ ma_{n-m} =\sum_{j=1}^{m}{\left( -1\right)^{j-1}\left( -1\right)^{-j} a_{n-\left( m-j\right) } \mathrm{Tr}\left( A^{j}\right)} \end{cases} \\
\begin{cases} a_{n}=1 \\ ma_{n-m} =\sum_{j=1}^{m}{\left( -1\right)^{-1} a_{n-\left( m-j\right) } \mathrm{Tr}\left( A^{j}\right)} \end{cases} \\
\begin{cases} a_{n}=1 \\ ma_{n-m} =\sum_{j=1}^{m}{\left( -1\right)^{-1} a_{\left(n-m\right) +j } \mathrm{Tr}\left( A^{j}\right)} \end{cases} \\
\begin{cases} a_{n}=1 \\ma_{n-m} =-\left( \sum_{j=1}^{m}{a_{\left(n-m\right) +j } \mathrm{Tr}\left( A^{j}\right)} \right) \end{cases} \\
\begin{cases} a_{n}=1 \\ a_{n-m} =-\frac{1}{m}\left(\sum_{j=1}^{m}{ a_{\left(n- m\right)+j } \mathrm{Tr}\left( A^{j}\right)} \right) \end{cases} \\
k = n-m\\
m=n-k\\
\begin{cases} a_{n}=1 \\ a_{k} =-\frac{1}{n-k}\left(\sum_{j=1}^{n-k}{ a_{k + j} \mathrm{Tr}\left( A^{j}\right)} \right) \end{cases} \\
}\)


Tylko teraz jak wykazać prawdziwość postawionej przeze mnie hipotezy że

\(\displaystyle{ \mathrm{Tr}\left( A^{m}\right)=\sum_{k=1}^{n}{\lambda_{k}^m} }\)

I mamy złożoność \(\displaystyle{ O\left( n^4\right) }\) przy założeniu że złożoność mnożenia macierzy to \(\displaystyle{ O\left( n^3\right) }\)
zamiast złożoności wykładniczej w przypadku minorów
Tutaj mamy wprawdzie złożoność \(\displaystyle{ O\left( n^4\right) }\) ale za to w pierścieniu \(\displaystyle{ \mathbb{Z}}\)
czy ciałach \(\displaystyle{ \mathbb{Z_{p}}}\) będziemy mieli dokładne dzielenie


Złożoność czasową można jeszcze obniżyć stosując twierdzenie Cayleya-Hamiltona

Równanie charakterystyczne jest postaci

\(\displaystyle{ \lambda^{n}+ \sum_{k=0}^{n-1}b_{k}\lambda^{k} }\)

Z twierdzenia Cayleya-Hamiltona wiemy że
\(\displaystyle{ A^{n}+ \sum_{k=0}^{n-1}b_{k}A^{k} = 0 }\)
więc dla każdego wektora \(\displaystyle{ \vec{z}}\)
\(\displaystyle{ A^{n}\vec{z}+ \sum_{k=0}^{n-1}b_{k}A^{k}\vec{z} = 0 }\)
co sprowadza mam obliczanie współczynników wielomianu charakterystycznego do rozwiązania układu równań liniowych

Mnożenie macierzy przez wektor jest wykonalne w czasie \(\displaystyle{ O\left( n^2\right) }\) a mamy \(\displaystyle{ n}\)
takich mnożeń więc zapisanie układu równań zajmuje \(\displaystyle{ O\left( n^3\right) }\)
Układ równań także może być rozwiązany w czasie \(\displaystyle{ O\left( n^3\right) }\)
tak więc całkowita złożoność czasowa to \(\displaystyle{ O\left( n^3\right) }\)
Wadą może być to że dzielenia mogą być niedokładne jeżeli do obliczeń użyjemy kalkulatora czy programu komputerowego
3a174ad9764fefcb
Użytkownik
Użytkownik
Posty: 287
Rejestracja: 18 lip 2022, o 17:46
Płeć: Mężczyzna
wiek: 40
Podziękował: 3 razy
Pomógł: 41 razy

Re: Wielomian charakterystyczny

Post autor: 3a174ad9764fefcb »

mariuszm pisze: 1 sie 2022, o 00:41 Tylko teraz jak wykazać prawdziwość postawionej przeze mnie hipotezy że

\(\displaystyle{ \mathrm{Tr}\left( A^{m}\right)=\sum_{k=1}^{n}{\lambda_{k}^m} }\)
Macierz można zapisać w postaci Jordana \(A=SJS^{-1}\) i wtedy oczywiście \(A^m=SJ^mS^{-1}\). Ślad macierzy jest niezmiennikiem podobieństwa macierzy, więc \(\mathrm{Tr}(A^m)=\mathrm{Tr}(J^m)\), co już dalej jest łatwo sprowadzić do \(\displaystyle{ \sum_{k=1}^{n}\lambda_{k}^m}\).
Awatar użytkownika
Mariusz M
Użytkownik
Użytkownik
Posty: 6910
Rejestracja: 25 wrz 2007, o 01:03
Płeć: Mężczyzna
Lokalizacja: 53°02'N 18°35'E
Podziękował: 2 razy
Pomógł: 1246 razy

Re: Wielomian charakterystyczny

Post autor: Mariusz M »

To odpowiedz mi jeszcze na pytanie
Dlaczego metoda Kryłowa czyli znajdowanie wartości własnych jako pierwiastków równania charakterystycznego
nie jest obecnie zalecana w obliczeniach numerycznych
3a174ad9764fefcb
Użytkownik
Użytkownik
Posty: 287
Rejestracja: 18 lip 2022, o 17:46
Płeć: Mężczyzna
wiek: 40
Podziękował: 3 razy
Pomógł: 41 razy

Re: Wielomian charakterystyczny

Post autor: 3a174ad9764fefcb »

W tej kwestii wiem tylko tyle, ile przeczytam w Wikipedii

Kod: Zaznacz cały

en.wikipedia.org/wiki/Krylov_subspace
Nie znalazłem tam informacji, że te metody ogólnie nie są zalecane. Jest jednak powiedziane, że czasem trzeba w tych metodach wykonywać ortogonalizację, jak na przykład w metodzie Arnoldiego. Pytanie tylko, czy chcesz znaleźć wszystkie wartości własne, czy tylko kilka największych (co do wartości bezwzględnej). Jeśli dobrze rozumiem, to metoda Arnoldiego działa efektywnie, gdy nie zależy nam na wszystkich wartościach własnych. Skoro pytasz w kontekście wyznaczania wielomianu charakterystycznego, to pewnie chcesz znaleźć wszystkie wartości własne i wtedy ta metoda nie jest najefektywniejsza.
ODPOWIEDZ