Sposoby rozwiązywania równań wielomianowych wyższych stopni

Zbiór wzorów, definicji i najczęściej poruszanych problemów z Algebry.
Rogal
Użytkownik
Użytkownik
Posty: 5405
Rejestracja: 11 sty 2005, o 22:21
Płeć: Mężczyzna
Lokalizacja: a z Limanowej
Podziękował: 1 raz
Pomógł: 422 razy

Sposoby rozwiązywania równań wielomianowych wyższych stopni

Post autor: Rogal »

Równanie kwadratowe


Współczynniki rzeczywiste


Sposób rozwiązywania takich równań znany był już w starożytności, choć wtedy bez znajomości liczb ujemnych i zera rozpatrywano wiele przypadków, które dziś możemy bardzo łatwo objąć jedną metodą.

Mamy równanie w ogólnej postaci (gdzie \(\displaystyle{ a}\) jest większe od zera - gdyby było zerem, to mielibyśmy do czynienia z równaniem liniowym, a nie kwadratowym; a jeśli jest ujemne, to zawsze możemy podzielić stronami przez \(\displaystyle{ -1}\)):

\(\displaystyle{ ax^{2}+bx+c=0}\)

Wyciągnijmy \(\displaystyle{ a}\) przed nawias, a następnie przekształćmy nieco to równanie:

\(\displaystyle{ a \left(x^{2} + \frac{b}{a}x + \frac{c}{a} \right) = 0 \\ a \left(x^{2} + \frac{b}{a}x + \left(\frac{b}{2a} \right)^{2} - \frac{b^{2}}{4a^{2}} + \frac{c}{a} \right) = 0.}\)

Stąd trzy pierwsze wyrazy w nawiasie możemy zapisać jako kwadrat pewnego wyrażenia, na mocy wzoru skróconego mnożenia na kwadrat sumy, zaś dwa pozostałe sprowadźmy do wspólnego mianownika:

\(\displaystyle{ a \left( \left(x + \frac{b}{2a} \right)^{2} - \frac{b^{2}-4ac}{4a^{2}} \right) = 0.}\)

Oznaczmy (dla uproszczenia) \(\displaystyle{ \Delta = b^{2} - 4ac}\). Symbol \(\displaystyle{ \Delta}\) czytamy 'delta', a nazywać możemy wyróżnikiem.
Przemnóżmy (chwilowo) przez a i taka postać...

\(\displaystyle{ a \left(x+\frac{b}{2a} \right)^{2} - \frac{\Delta}{4a} = 0}\)

... jest nazywana postacią kanoniczną.

Wracamy do rozwiązywania. Zamiast mnożyć przez \(\displaystyle{ a}\), to się tego \(\displaystyle{ a}\) pozbywamy sprzed nawiasu, dzieląc stronami i otrzymujemy postać wyjściową do dyskusji rozwiązań:

\(\displaystyle{ \left(x+\frac{b}{2a} \right)^{2} = \frac{\Delta}{4a^{2}}.}\)

Mamy więc po lewej stronie kwadrat liczby rzeczywistej (który jak wiemy, nigdy nie jest ujemny), stąd też, gdy wyróżnik jest ujemny, to prawa strona tego równania jest liczbą ujemną i mamy sprzeczność, więc brak rozwiązań rzeczywistych.
Gdy wyróżnik się zeruje, to mamy jeden pierwiastek, tak zwany podwójny, oznaczany zazwyczaj \(\displaystyle{ x_{0}}\) i obliczamy go o tak:

\(\displaystyle{ \large \begin{array} {rcl} \left(x_{0} + \frac{b}{2a} \right)^{2} \! \! \! \! & = \! \! \! \! & 0 \\ x_{0} + \frac{b}{2a} \! \! \! \! & = \! \! \! \! & 0 \\ x_{0} \! \! \! \! & = \! \! \! \! & -\frac{b}{2a} \end{array}}\)

Jeśli natomiast nasz wyróżnik jest większy od zera, to kładąc obustronnie pierwiastek mamy:

\(\displaystyle{ \left|x + \frac{b}{2a} \right| = \frac{\sqrt{\Delta}}{2a}.}\)

Stąd z definicji wartości bezwzględnej otrzymujemy:

\(\displaystyle{ \large \begin{array} {rcl} x + \frac{b}{2a} = -\frac{\sqrt{\Delta}}{2a} & \vee & x + \frac{b}{2a} = \frac{\sqrt{\Delta}}{2a} \\ \\ x = \frac{-b - \sqrt{\Delta}}{2a} & \vee & x = \frac{-b + \sqrt{\Delta}}{2a}. \end{array}}\)

Zwyczajowo zapisuje się, że pierwiastkami tego równania kwadratowego w tym przypadku są liczby:

\(\displaystyle{ x_{1} = \frac{-b - \sqrt{\Delta}}{2a}, \ x_{2} = \frac{-b + \sqrt{\Delta}}{2a}.}\)


Na tym kończy się analiza rozwiązań równania kwadratowego o współczynnikach rzeczywistych.

Przykłady:

\(\displaystyle{ \mbox{(i)} \ x^{2} + 2x + 3 = 0}\)

Obliczamy wyróżnik: \(\displaystyle{ \Delta = 4 - 4 \cdot 3 = 4 - 12 = -8 < 0}\) i wnioskujemy, że równanie takie nie ma rozwiązań rzeczywistych.

\(\displaystyle{ \mbox{(ii)} \ 4x^{2} + 12x + 9 = 0}\)

Analogicznie, obliczamy wyróżnik: \(\displaystyle{ \Delta = 144 - 4 \cdot 4 \cdot 9 = 144 - 4 \cdot 36 = 144 - 144 = 0}\), mamy więc do czynienia z przypadkiem pierwiastka podwójnego.
Korzystamy ze wzoru: \(\displaystyle{ x_{0} = \frac{-12}{2 \cdot 4} = -\frac{3}{2}.}\)
Przy okazji zauważmy, że zerowanie się wyróżnika w tym przypadku mówi nam, że lewa strona równania jest kwadratem: \(\displaystyle{ \ 4x^{2} + 12x + 9 = (2x+3)^{2}}\) zgodnie ze sposobem wyprowadzenia tych wzorów.

\(\displaystyle{ \mbox{(iii)} \ 2x^{2} + x - 6 = 0}\)

Jak wyżej obliczamy wyróżnik: \(\displaystyle{ \Delta = 1 - 4 \cdot 2 \cdot (-6) = 1 + 48 = 49 > 0}\), wiemy więc, że są dwa pierwiastki rzeczywiste, korzystamy ze wzorów i otrzymujemy:

\(\displaystyle{ x_{1} = \frac{-1-7}{2 \cdot 2} = \frac{-8}{4} = -2 \\ \\ x_{2} = \frac{-1+7}{2 \cdot 2} = \frac{6}{2 \cdot 2} = \frac{3}{2}}\)

Współczynniki zespolone


Chcąc rozwiązać równanie \(\displaystyle{ \ az^{2} + bz + c = 0}\), gdzie \(\displaystyle{ a, b, c \in \mathbb{C} \wedge a \neq (0,0)}\) postępujemy dokładnie identycznie, jak w przypadku rzeczywistym (gdyż sposób wyprowadzenia wzorów nie zmienia się ani o jotę), natomiast pewien problem możemy napotkać przy obliczaniu pierwiastka z wyróżnika.
Rozważmy następujący przykład równania o współczynnikach zespolonych:
\(\displaystyle{ iz^{2} + (2+i)z + 2 = 0.}\)
Obliczmy jego wyróżnik: \(\displaystyle{ \Delta = (2+i)^{2} - 4 \cdot 2 i = 4 + 4i - 1 - 8i = 3 - 4i.}\)
Aby obliczyć pierwiastki kwadratowe z liczby zespolonej wystarczy skorzystać z metody opisanej tutaj.
Korzystając z podanych tam wzorów otrzymujemy dwa pierwiastki z wyróżnika:

\(\displaystyle{ \sqrt{\Delta} = \left \{ -\sqrt{\frac{\sqrt{9+16}+3}{2}} + i \sqrt{\frac{\sqrt{9+16}-3}{2}}, \ \sqrt{\frac{\sqrt{9+16}+3}{2}} - i \sqrt{\frac{\sqrt{9+16}-3}{2}} \right \} = \{ -2 + i, \ 2 - i \}.}\)

Ze wzoru na pierwiastki otrzymujemy ostatecznie rozwiązania tego równania:

\(\displaystyle{ z_{1} = \frac{-2-i -2 + i}{2i} = \frac{-4}{2i} = \frac{-2i}{-1} = 2i \\ z_{2} = \frac{-2-i + 2-i}{2i} = \frac{-2i}{2i} = -1.}\)

Na powyższym przykładzie widzimy, że istnieją równania kwadratowe o współczynnikach zespolonych, które posiadają pierwiastek rzeczywisty. Całkiem naturalnym jest więc pytanie o dogłębną analizę ilości rozwiązań rzeczywistych i typu rozwiązań zespolonych takich równań kwadratowych.
Postaramy się poniżej na to frapujące nas pytanie odpowiedzieć.

Powróćmy do wyjściowego równania:
\(\displaystyle{ az^{2} + bz + c = 0,}\) gdzie \(\displaystyle{ \ a, b, c \in \mathbb{C} \wedge a \neq 0.}\)
Podzielmy stronami przez \(\displaystyle{ a}\) i wprowadźmy nowe oznaczenia: \(\displaystyle{ b' := \frac{b}{a}, \ c' := \frac{c}{a}}\)
\(\displaystyle{ z^{2} + b' z + c' = 0.}\)
Skorzystajmy ze wzoru na kwadrat sumy:
\(\displaystyle{ \left( z+\frac{b'}{2} \right)^{2} + \frac{4c' - b'^{2}}{4} = 0.}\)
Wprowadźmy jeszcze jedne oznaczenia: \(\displaystyle{ p_{1} + ip_{2} := \frac{b'}{2}, \ q_{1} + iq_{2} := \frac{b'^{2}-4c'}{4}.}\)
Wtedy nasze równanie prezentuje się następująco:

\(\displaystyle{ (z + p_{1} + ip_{2})^{2} = q_{1} + iq_{2}.}\)

Ta właśnie postać jest dla nas najdogodniejszą do analizy pierwiastków tego równania.

\(\displaystyle{ \large \hbox{ I. } q_{2} = 0}\)

Mamy więc do czynienia z pierwiastkowaniem liczby rzeczywistej. W zależności od jej znaku otrzymujemy dwa przypadki:

\(\displaystyle{ 1. \ q_{1} \geq 0}\)
Obliczamy \(\displaystyle{ z}\) (przez pierwiastek rozumiemy pierwiastek arytmetyczny):

\(\displaystyle{ z + p_{1} + ip_{2} = \sqrt{q_{1}} \ \vee \ z + p_{1} + ip_{2} = - \sqrt{q_{1}} \\ \\ z_{1} = -p_{1} + \sqrt{q_{1}} - ip_{2}, \ z_{2} = -p_{1} - \sqrt{q_{1}} - ip_{2}.}\)

Zauważmy, że gdy \(\displaystyle{ p_{2} = 0,}\) to obydwa pierwiastki są rzeczywiste.

\(\displaystyle{ 2. \ q_{1} < 0}\)
Z definicji liczby \(\displaystyle{ i}\) otrzymamy wzory:

\(\displaystyle{ z + p_{1} + ip_{2} = i\sqrt{|q_{1}|} \ \vee \ z + p_{1} + ip_{2} = -i \sqrt{|q_{1}|} \\ \\ z_{1} = -p_{1} + i \left(-p_{2} + \sqrt{|q_{1}|} \right), \ z_{2} = -p_{1} + i \left(-p_{2} - \sqrt{|q_{1}|} \right).}\)

W tym przypadku, gdy \(\displaystyle{ p_{2} = 0,}\) to pierwiastki są zespolone sprzężone.


\(\displaystyle{ \hbox{II. } q_{2} \neq 0}\)

Możemy teraz skorzystać z wspomnianych w przykładzie wzorów na pierwiastki kwadratowe liczby zespolonej (wyprowadzenie w artykule) i otrzymujemy finalną postać:

\(\displaystyle{ z_{1} = \phantom{P} sgn(q_{2}) \sqrt{\frac{\sqrt{q_{1}^{2}+q_{2}^{2}}+q_{1}}{2}} - p_{1} + \left(\sqrt{\frac{\sqrt{q_{1}^{2}+q_{2}^{2}}-q_{1}}{2}} - p_{2} \right)i, \\ \\ z_{2} = -sgn(q_{2}) \sqrt{\frac{\sqrt{q_{1}^{2}+q_{2}^{2}}+q_{1}}{2}} - p_{1} - \left(\sqrt{\frac{\sqrt{q_{1}^{2}+q_{2}^{2}}-q_{1}}{2}} + p_{2} \right)i.}\)

Rozważmy teraz dwa przypadki:

\(\displaystyle{ 1. \ p_{2} = 0}\)

Wtedy obydwa pierwiastki są zespolone nierzeczywiste. Dlaczego żaden nie jest rzeczywisty? Aby tak było, część urojona musiałaby być równa \(\displaystyle{ 0}\):

\(\displaystyle{ \begin{array} {rcl} \sqrt{q_{1}^{2}+q_{2}^{2}}-q_{1} \! \! \! \! & = \! \! \! \! & 0 \\ \sqrt{q_{1}^{2} + q_{2}^{2}} \! \! \! \! & = \! \! \! \! & q_{1} \ / ^{2} \\ q_{2} \! \! \! \! & = \! \! \! \! & 0. \end{array}}\)
A to jest sprzeczność z naszym głównym założeniem.

Przeprowadzając podobne rozumowanie możemy się przekonać, że pierwiastki te nigdy nie są sprzężone (zakładając przeciwnie otrzymalibyśmy znowuż, że \(\displaystyle{ q_{2} = 0,}\) a zakładaliśmy coś przeciwnego).

\(\displaystyle{ 2. \ p_{2} \neq 0}\)

W tym przypadku możemy otrzymać pierwiastek rzeczywisty, ale co najwyżej jeden. Dlaczego?
Załóżmy, że to \(\displaystyle{ z_{1}}\) jest tym pierwiastkiem. Wtedy jego część urojona jest równa \(\displaystyle{ 0}\):

\(\displaystyle{ \sqrt{\frac{\sqrt{q_{1}^{2}+q_{2}^{2}}-q_{1}}{2}} = p_{2}.}\)

Jednak przy takim założeniu drugi z pierwiastków ma postać:

\(\displaystyle{ z_{2} = -sgn(q_{2})\sqrt{\frac{\sqrt{q_{1}^{2}+q_{2}^{2}}+q_{1}}{2}} - 2p_{2}i.}\)

A ponieważ \(\displaystyle{ p_{2} \neq 0}\), to ten pierwiastek nigdy nie będzie liczbą rzeczywistą.
Odwrotnie, gdyby założyć, że \(\displaystyle{ z_{2}}\) jest rzeczywisty, to otrzymamy analogiczną konkluzję dla \(\displaystyle{ z_{1}.}\)

W ogólności jednak obydwa pierwiastki są zespolone nierzeczywiste i w dodatku niesprzężone (wystarczy dobrze spojrzeć na ich postać).


Na koniec przeliczmy kilka

Przykładów:

\(\displaystyle{ \mbox{(ii)} \ (1+i)z^{2} + (2+2i)z - 1 - i = 0}\)

Obliczamy wyróżnik \(\displaystyle{ \Delta = 4 + 8i - 4 - 4(1+i)(-1-i) = 8i + 4(1 + 2i -1) = 16i}\)
i jeden z pierwiastków kwadratowych z niego wynosi \(\displaystyle{ 4 \left( \frac{\sqrt{2}}{2} + \frac{\sqrt{2}}{2}i \right) = 2\sqrt{2} (1+i).}\)
Wstawiamy do wzorów i otrzymujemy:

\(\displaystyle{ z_{1} = \frac{-(2+2i) - 2\sqrt{2} (1+i)}{2(1+i)} = \frac{-2 - 2\sqrt{2}}{2} = -1 - \sqrt{2} \\ z_{2} = \frac{-(2+2i) + 2\sqrt{2} (1+i)}{2(1+i)} = \frac{-2+2\sqrt{2}}{2} = -1 + \sqrt{2}.}\)

Otrzymane wyniki nie powinny nas dziwić - wystarczy przecież podzielić wyjściowe równanie przez \(\displaystyle{ 1+i}\) i otrzymamy "zwykłe" równanie kwadratowe.


\(\displaystyle{ \mbox{(ii)} \ z^{2} - (1+2i)z + i = 0}\)

Wyróżnik: \(\displaystyle{ \Delta = 1 + 4i - 4 - 4i = -3.}\)
Jeden z pierwiastków wyróżnika: \(\displaystyle{ i\sqrt{3}.}\)

Podstawiamy do wzorów:

\(\displaystyle{ z_{1} = \frac{1+2i - i\sqrt{3}}{2} = \frac{1}{2} + i \left( 1 - \frac{\sqrt{3}}{2} \right) \\ z_{2} = \frac{1+2i + i\sqrt{3}}{2} = \frac{1}{2} + i \left( 1 + \frac{\sqrt{3}}{2} \right).}\)


\(\displaystyle{ \mbox{(iii)} \ z^{2} + 4z - 3i = 0}\)

Wyróżnik: \(\displaystyle{ \Delta = 16 + 12i = 4(4+3i).}\)
Obliczamy jeden z pierwiastków z liczby \(\displaystyle{ 4+3i}\) (korzystając z wzorów na pierwiastki, wyprowadzanych we wspominanym wcześniej artykule):

\(\displaystyle{ w_{1} = \sqrt{\frac{\sqrt{16+9}+4}{2}} + i \sqrt{\frac{\sqrt{16+9}-4}{2}} = \sqrt{\frac{9}{2}} + i \sqrt{\frac{1}{2}} = \frac{3 \sqrt{2}}{2} + i \frac{\sqrt{2}}{2}.}\)

Wstawiamy do wzorów na pierwiastki:

\(\displaystyle{ z_{1} = \frac{4 - 2 \left( \frac{3 \sqrt{2}}{2} + i \frac{\sqrt{2}}{2} \right)}{2} = \frac{4 - 3\sqrt{2} - i \sqrt{2}}{2} = 2 - \frac{3\sqrt{2}}{2} - i \frac{\sqrt{2}}{2} \\ z_{2} = \frac{4 + 2 \left( \frac{3 \sqrt{2}}{2} + i \frac{\sqrt{2}}{2} \right)}{2} = \frac{4 + 3\sqrt{2} + i\sqrt{2}}{2} = 2 + \frac{3\sqrt{2}}{2} + i\frac{\sqrt{2}}{2}.}\)


\(\displaystyle{ \mbox{(iv)} \ z^{2} - z + 2 = 0}\)

Wyróżnik: \(\displaystyle{ \Delta = 1 - 8 = -7 = (i\sqrt{7}).}\)
Wstawiając do wzorów:

\(\displaystyle{ z_{1} = \frac{1 - i\sqrt{7}}{2} = \frac{1}{2} - i \frac{\sqrt{7}}{2} \\ z_{2} = \frac{1 + i\sqrt{7}}{2} = \frac{1}{2} + i \frac{\sqrt{7}}{2}.}\)

W tym więc przypadku otrzymaliśmy dwa pierwiastki zespolone nierzeczywiste sprzężone.


\(\displaystyle{ \mbox{(v)} \ iz^{2} - (\sqrt{3} - 2i)z - \sqrt{3} = 0}\)

Wyróżnik: \(\displaystyle{ \Delta = 3 - 4 i \sqrt{3} - 4 - 4i \cdot (-\sqrt{3}) = -1 - 4i\sqrt{3} + 4i\sqrt{3} = -1 = i^{2}.}\)

Podstawiamy do wzorów:

\(\displaystyle{ z_{1} = \frac{\sqrt{3} - 2i - i}{2i} = \frac{\sqrt{3} - 3i}{2i} = \frac{i\sqrt{3} + 3}{-2} = -\frac{3}{2} - i \frac{\sqrt{3}}{2} \\ z_{2} = \frac{\sqrt{3} - 2i + i}{2i} = \frac{\sqrt{3} - i}{2i} = \frac{i\sqrt{3} + 1}{-2} = -\frac{1}{2} - i\frac{\sqrt{3}}{2}.}\)

Na tym przykładzie widzimy, że równanie o dość nieprzyjemnych współczynnikach może mieć całkiem przyzwoite pierwiastki.


\(\displaystyle{ \mbox{(vi)} \ z^{2} + z - i = 0}\)

Obliczamy wyróżnik: \(\displaystyle{ \Delta = 1 + 4i}\) i pierwiastek z niego (korzystając ze znanych już wzorów):

\(\displaystyle{ w_{1} = \sqrt{\frac{\sqrt{1 + 16} + 1}{2}} + i \sqrt{\frac{\sqrt{1+16}-1}{2}} = \sqrt{\frac{\sqrt{17}+1}{2}} + i \sqrt{\frac{\sqrt{17}-1}{2}}.}\)

Podstawiamy do wzorów na pierwiastki:

\(\displaystyle{ z_{1} = \frac{-1 - \sqrt{\frac{\sqrt{17}+1}{2}} - i \sqrt{\frac{\sqrt{17}-1}{2}}}{2} = -\frac{1}{2} - \frac{\sqrt{2\sqrt{17}+2}}{4} - i \frac{\sqrt{2\sqrt{17}-2}}{4} \\ z_{2} = \frac{-1 + \sqrt{\frac{\sqrt{17}+1}{2}} + i \sqrt{\frac{\sqrt{17}-1}{2}}}{2} = -\frac{1}{2} + \frac{\sqrt{2\sqrt{17}+2}}{4} + i\frac{\sqrt{2\sqrt{17}-2}}{4}.}\)

Natomiast na tym przykładzie widzimy, że równanie o bardzo przyzwoitych współczynnikach może mieć całkiem nieprzyjemne pierwiastki.



Będę bardzo wdzięczny za wszelkie uwagi, pomysły, zauważone błędy i niejasności - proszę napisać Prywatną Wiadomość.


[Utworzono: 4 lutego 2005 o 15:39]
[Ostatnia modyfikacja: 26 marca 2009 o 23:13]



Równanie sześcienne


Postać kanoniczna


Mamy równanie w postaci ogólnej (gdzie \(\displaystyle{ a}\) nie jest zerem):

\(\displaystyle{ ax^{3}+bx^{2}+cx+d=0.}\)

Dzielimy je stronami przez \(\displaystyle{ a}\) i otrzymujemy:

\(\displaystyle{ x^{3} + \frac{b}{a}x^{2} + \frac{c}{a}x + \frac{d}{a} = 0.}\)

Teraz staramy się niejako "dopełnić" do wzoru na sześcian sumy \(\displaystyle{ ((a+b)^{3} = a^{3} + 3a^{2}b + 3ab^{2} + b^{3})}\), aby "zlikwidować" współczynnik stojący przy \(\displaystyle{ x^{2}}\), zupełnie analogicznie jak w przypadku równania kwadratowego, gdzie "znikał" nam współczynnik przy \(\displaystyle{ x}\). Mamy kolejno ciąg przekształceń:

\(\displaystyle{ x^{3} + \frac{b}{a}x^{2} + \frac{b^{2}}{3a^{2}}x + \frac{b^{3}}{27a^{3}} - \frac{b^{2}}{3a^{2}}x + \frac{c}{a}x - \frac{b^{3}}{27a^{3}} + \frac{d}{a} = 0 \\ \left( x+\frac{b}{3a} \right)^{3} - \frac{b^{2}-3ac}{3a^{2}}x + \frac{27a^{2}d}{27a^{3}} = 0.}\)

Jednak, inaczej niż równaniu kwadratowym, tutaj pozostaje jeszcze \(\displaystyle{ x}\) w pierwszej potędze i jego nie będziemy eliminować. Zamiast tak drastycznych metod przekształćmy to jeszcze nieco:

\(\displaystyle{ \left(x+\frac{b}{3a} \right)^{3} - \frac{b^{2}-3ac}{3a^{2}} \left(x+\frac{b}{3a} \right) + \frac{b^{3}-3abc}{9a^{3}} + \frac{27a^{2}d-b^{3}}{27a^{3}} = 0 \\ \left(x+\frac{b}{3a} \right)^{3} - \frac{b^{2}-3ac}{3a^{2}} \left(x+\frac{b}{3a} \right) + \frac{27a^{2}d-9abc+2b^{3}}{27a^{3}} = 0.}\)

Aby było wygodniej nam dalej działać i dalsze wzory były przejrzyste i jasne, wprowadzamy sobie następujące oznaczenia:

\(\displaystyle{ y = x + \frac{b}{3a}, \ p = -\frac{b^{2}-3ac}{3a^{2}}, \ q = \frac{27a^{2}d - 9abc + 2b^{3}}{27a^{3}}.}\)

Wtedy równanie nasze przedstawia się w swej najsłynniejszej postaci, zwanej kanoniczną:

\(\displaystyle{ y^{3} + py + q = 0.}\)

Historycznie pierwszy pomysł


O ile taka postać równania trzeciego stopnia była w ogólności dobrze znana, o tyle metoda rozwiązywania długo się opierała i nie chciała się ujawnić. Dopiero w szesnastym wieku sposób został odkryty i po różnych perypetiach wraz z finalnymi wzorami pojawił się w pracy "Ars magna" autorstwa Włocha Girolamo Cardano.
Na czym polega pomysł? Na wykorzystaniu wzoru na sześcian sumy (ma on również geometryczne uzasadnienie, znane od starożytności i to na nie powoływali się pierwsi pomysłodawcy).
Możemy bowiem zapisać, że \(\displaystyle{ y=u+v}\) i wtedy otrzymujemy równość:

\(\displaystyle{ (u+v)^{3} = -p(u+v) - q \\ u^{3} + v^{3} + 3uv(u+v) = -q - p(u+v).}\)

Widzimy więc teraz, że wystarczy nam, by zachodziły dwie równości:

\(\displaystyle{ u^{3} + v^{3} = -q \\ 3uv = -p.}\)

Teraz spokojnie możemy założyć, że \(\displaystyle{ p}\) jest różne od \(\displaystyle{ 0}\), gdyż w przeciwnym razie to nasze równanie staje się bardzo nieciekawe i myślę, że z takowym równaniem bez wyrazu \(\displaystyle{ px}\) nikt problemów nie miewa.
Wtedy też \(\displaystyle{ u}\) i \(\displaystyle{ v}\) są różne od \(\displaystyle{ 0}\) i możemy wyznaczyć \(\displaystyle{ v = \frac{-p}{3u}}\), następnie wstawiamy do pierwszego i mamy:
\(\displaystyle{ u^{3} + \left(\frac{-p}{3u} \right)^{3} = -q \\ u^{3} + \frac{-p^{3}}{27u^{3}} = -q.}\)

Teraz dla wygody rozwiązywania podstawmy \(\displaystyle{ t = u^{3}}\) i liczymy dalej:

\(\displaystyle{ t - \frac{p^{3}}{27t} + q = 0 / \ \cdot t \\ t^{2} + qt - \frac{p^{3}}{27} = 0 \\ \Delta = q^{2} + \frac{4p^{3}}{27} \\ t_{1} = \frac{-q-\sqrt{\Delta}}{2}, \ t_{2} = \frac{-q+\sqrt{\Delta}}{2} \\ t_{1} = \frac{-q}{2} - \frac{\sqrt{q^{2} + \frac{4p^{3}}{27}}}{2} = \frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}, \ t_{2} = \frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}.}\)

Czyli wracając do podstawienia otrzymujemy \(\displaystyle{ u^{3} = t_{1} \vee u^{3} = t_{2}}\), czyli:

\(\displaystyle{ u_{1}^{3} = \frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}} \ \vee \ u_{2}^{3} = \frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}.}\)

Teraz nim zaczniemy rozważać doniosłość faktu, że uzyskaliśmy dwa różne \(\displaystyle{ u}\), policzmy \(\displaystyle{ v}\):

\(\displaystyle{ v^{3} = -q - u^{3} \\ v_{1}^{3} = -q - \left(\frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}} \right) = \frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}} \\ v_{2}^{3} = - q - \left(\frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}} \right) = \frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}.}\)

No i cóż się okazuje? Że tak naprawdę mamy tylko jedną parę rozwiązań tego układu (przyjmijmy, że jest nią ta z jedynkami w indeksie), gdyż wersja druga różni się tylko nazwami zmiennych. No i można rzec klops - chcemy mieć trzy pary rozwiązań (bo wiemy, że równanie sześcienne może mieć trzy pierwiastki), a tutaj jest tylko jedna.
Jeśli nasz wyróżnik jest dodatni, to możemy sobie obliczyć jeden z pierwiastków i jak się później okaże, pozostałe dwa są zespolone sprzężone, więc w takich szesnastowiecznych zagadnieniach nie są nam one potrzebne (bo wtedy jeszcze liczby zespolone nie zaistniały w umysłach matematyków).
Pojawia się jednak problem, gdy wyróżnik jest ujemny - mamy do czynienia z pierwiastkiem kwadratowym z liczby ujemnej, a wiemy, że nie ma takiej liczby rzeczywistej, która podniesiona do kwadratu da nam liczbę ujemną. Jednak z drugiej strony wiedziano, że na przykład liczba \(\displaystyle{ 1}\) spełnia dane równanie sześcienne. Matematycy przed Cardano nazwali ten przypadek nieprzywiedlnym (casus irreducibilis) i nie zajmowali się analizą tej pozornej sprzeczności.
Cardano natomiast w swej pracy podjął się analizy tego przypadku, nie przejmując się "czym" jest pierwiastek z liczby ujemnej, tylko starał się liczyć, pamiętając o prawach działań. Był on jednym z nielicznych w tamtym czasie, którzy "uznawali" ujemne rozwiązania równań, więc jakoś łatwiej było mu pokonać opór umysłu przed pierwiastkami z takich liczb.
Spróbujmy teraz przenieść się w niejako w tamte czasy (choć stosując nowoczesny zapis) i rozwiążmy takie równanie sześcienne o ujemnym wyróżniku, które ma pierwiastki całkowite, pokonując ów "casus irreducibilis".
Tutaj muszę dodać, że nie opieram się na żadnych źródłach pisanych, jedynie intuicja mi podpowiada, że taką metodę musiał Cardano zastosować - osobiście sam bym tak liczył, a bardziej precyzyjnych i wyrafinowanych sposobów (które poznamy w dalszej części) nikt wtedy nie miał prawa znać.

\(\displaystyle{ x^{3} - 21x + 20 = 0}\) - zauważmy, że na pewno to równanie spełnia jedynka i zastosujmy przed chwilą opracowaną metodę do rozwiązania go:

\(\displaystyle{ \frac{\Delta}{4} = (\frac{20}{2})^{2} - (\frac{21}{3})^{3} = 100 - 343 = -243 = -3 \cdot 81.}\)

Otrzymujemy więc wspomniany wcześniej klops - pierwiastek z liczby ujemnej. Jednak Cardano się tego nie przestraszył, więc i my się nie bójmy, tylko liczmy dalej zgodnie ze wzorami:

\(\displaystyle{ x = u + v, \ u = \sqrt[3]{-10-\sqrt{-3 \cdot 81}} = \sqrt[3]{-10-9\sqrt{-3}}, \ v = \sqrt[3]{-10+9\sqrt{-3}} \\ x = \sqrt[3]{-10-9\sqrt{-3}} + \sqrt[3]{-10+9\sqrt{-3}}.}\)

Nieładne, prawda?
Jednak jest na to bardzo prosty sposób - liczmy, jak gdyby nigdy nic, po prostu przyjmując, że \(\displaystyle{ \sqrt[3]{-10-9\sqrt{-3}} = a + b\sqrt{-3},}\) (co jest dość intuicyjne) i wyznaczmy liczby \(\displaystyle{ a}\) i \(\displaystyle{ b}\). Podnosząc to równanie stronami do trzeciej potęgi otrzymujemy:

\(\displaystyle{ -10 - 9\sqrt{-3} = a^{3} + 3a^{2}b\sqrt{-3} + 3ab^{2} \cdot (-3) + b^{3} \cdot (-3)\sqrt{-3} \\ a^{3} - 9ab^{2} + (3a^{2}b - 3b^{3})\sqrt{-3} = -10 - 9\sqrt{-3}.}\)

Teraz (również intuicyjnie) widać, że to co stoi przy pierwiastku z \(\displaystyle{ -3}\) po lewej musi być równe temu co stoi przy pierwiastku z \(\displaystyle{ -3}\) po prawej, tak samo z tym, co nie stoi przy pierwiastku, więc dostajemy układzik równań:

\(\displaystyle{ \begin{cases} \begin{array} {rcl} a^{3}-9ab^{2} \! \! \! \! & = \! \! \! \! & -10 \ / : (-1) \\ 3a^{2}b - 3b^{3} \! \! \! \! & = \! \! \! \! & -9 \ / : (-3) \end{array} \end{cases} \\ \begin{cases} \begin{array} {rcl} 9ab^{2} - a^{3} \! \! \! \! & = \! \! \! \! & 10 \\ b^{3} - a^{2}b \! \! \! \! & = \! \! \! \! & 3 \end{array} \end{cases} \\ \begin{cases} \begin{array} {rcl} a(9b^{2} - a^{2}) \! \! \! \! & = \! \! \! \! & 10 \\ b(b^{2}-a^{2}) \! \! \! \! & = \! \! \! \! & 3 \end{array} \end{cases} \\ \begin{cases} \begin{array} {rcl} a(3b-a)(3b+a) \! \! \! \! & = \! \! \! \! & 10 \\ b(b-a)(b+a) \! \! \! \! & = \! \! \! \! & 3 \end{array} \end{cases}}\)
Nie są mi znane (więc Cardanowi wtedy też) żadne metody na rozwiązywanie ścisłe takich układów równań, ale gdy ograniczymy się tylko do liczb całkowitych, to po sprawdzeniu kilku możliwości okaże się, że układ ten spełniają tylko liczby:
\(\displaystyle{ \begin{cases} a = 2 \\ b= -1. \end{cases}}\)
Oczywiście rozpatrywaliśmy tylko możliwość, gdy te liczby są całkowite. Wystarczy nam jednak jedna para póki co. Wiemy więc, że \(\displaystyle{ \sqrt[3]{-10-9\sqrt{-3}} = 2 - \sqrt{-3}.}\)
Analogicznie możemy wyliczyć, że \(\displaystyle{ \sqrt[3]{-10+9\sqrt{-3}} = 2 + \sqrt{-3}.}\)
Stąd otrzymujemy jedno z rozwiązań \(\displaystyle{ x_{1} = 2 - \sqrt{-3} + 2 + \sqrt{-3} = 4}\).
Podstawiając znalezioną liczbę do równania wyjściowego przekonujemy się, że jest to istotnie pierwiastek tego równania.
Zauważmy teraz, że jeśli równanie postaci \(\displaystyle{ x^{3} + px + q = 0}\) miałoby mieć trzy pierwiastki całkowite, to jeden z nich musi być parzysty, pozostałe dwa nieparzyste (inaczej ich suma nie byłaby równa \(\displaystyle{ 0}\), a w naszym równaniu współczynnik przy \(\displaystyle{ x^{2}}\) jest równy właśnie \(\displaystyle{ 0}\)).
Zauważmy również, że jeśli \(\displaystyle{ \sqrt[3]{-10-9\sqrt{-3}} = a + b\sqrt{-3} \mbox{ i } \sqrt[3]{-10+9\sqrt{-3}} = a - b\sqrt{-3}}\) (co można łatwo sprawdzić), to wtedy \(\displaystyle{ x = 2a}\), więc w pozostałych dwóch przypadkach \(\displaystyle{ a}\) musi być postaci \(\displaystyle{ a = \frac{2k+1}{2}}\), gdzie \(\displaystyle{ k}\) jest całkowite, skoro \(\displaystyle{ x}\) jest nieparzysty. Wstawmy to więc do naszego układu równań:
\(\displaystyle{ \begin{cases} \begin{array} {rcl} \frac{2k+1}{2}(3b - \frac{1k+1}{2})(3b + \frac{2k+1}{2}) \! \! \! \! & = \! \! \! \! & 10 / \cdot 8 \\ b(b - \frac{2k+1}{2})(b + \frac{2k+1}{2}) \! \! \! \! & = \! \! \! \! & 3 / \cdot 4 \end{array} \end{cases} \\ \begin{cases} \begin{array} {rcl} (2k+1)(6b-2k-1)(6b+2k+1) \! \! \! \! & = \! \! \! \! & 80 \\ b(2b-2k-1)(2b+2k+1) \! \! \! \! & = \! \! \! \! & 12 \end{array} \end{cases}}\)
Po rozpatrzeniu możliwych \(\displaystyle{ k}\) całkowitych otrzymujemy dwie pary:
\(\displaystyle{ \begin{cases} k = 0 \\ b = \frac{3}{2} \end{cases} \vee \ \begin{cases} k = -3 \\ b = -\frac{1}{2}. \end{cases}}\)
A stąd mamy już pozostałe dwa rozwiązania \(\displaystyle{ x_{2} = 2 \cdot \frac{1}{2} = 1, x_{3} = 2 \cdot \frac{-5}{2} = -5}\) (również wstawione do wyjściowego równania dają równość prawdziwą).

Podsumowując: stosując oryginalny pomysł po dość żmudnych i długich obliczeniach znaleźliśmy rozwiązania danego równania. Zauważmy jednak, że tak naprawdę nie korzystaliśmy z żadnych wzorów, tylko stosowaliśmy sztuczki, które w dodatku stosują się tylko, gdy dane równanie sześcienne o współczynnikach całkowitych ma pierwiastki całkowite. W tym momencie każdy, kto już ukończył liceum powinien mi przerwać, przypominając istnienie wspaniałego twierdzenia Bezouta - jeśli równanie o współczynnikach całkowitych ma pierwiastek całkowity, to jest on dzielnikiem wyrazu wolnego. Po co więc zaprzęgać do tego tak skomplikowaną maszynerię? Cóż, Cardano też już znał to twierdzenie (mimo, że Bezout się jeszcze nie urodził bodajże :)), a jednak nie zniechęciło go to. Zapytacie więc, co jednak z innymi przypadkami? Nie poradzilibyśmy sobie w ten sposób, z czego zapewne doskonale zdawał sobie sprawę sam Cardano, dlatego próbował metodę uogólnić, by móc dać konkretny przepis na pierwiastki takich równań. Udało się mu, lecz niejako połowicznie, o czym przekonamy się poniżej.
Możecie spytać, dlaczego więc tyle pisałem na temat metody, która nie jest efektywna, nieścisła matematycznie (wiele rzeczy zgadliśmy, przyjęliśmy na wiarę, "wystarczało nam", używaliśmy intuicji)? Główną moją przesłanką było ukazanie pierwszego, historycznie udokumentowanego użycia liczb zespolonych w rozważaniach o liczbach jak najbardziej rzeczywistych, nieurojonych.
Jak widzieliśmy, było to nawet konieczne, a jak bardzo jest istotne, zobaczymy już za chwilkę.

Wzory Cardano


Przechodzimy do wspominanego uogólnienia i zapisania ostatecznej postaci wzorów, jakie odkrył Tartaglia (a przed nim del Ferro), a które dopracował (tak sądzę) Cardano.
Kluczową sprawą wydaje się być kwestia odkrycia, że poza znanym wszystkim pierwiastkiem sześciennym z jedynki rzeczywistym (czyli jedynce) są jeszcze dwa pierwiastki zespolone.
Twierdzę, że jest to możliwe bez jakiejkolwiek znajomości teorii liczb zespolonych, wystarczy opierać się na tej intuicji, na której polegał Cardano. Skąd ta moja pewność? Otóż sam tego "dokonałem" na pamiętnej dla mnie lekcji Wiedzy o Kulturze w pierwszej klasie ogólniaka, więc nie sądzę, by coś takiego przerosło tak doświadczonego matematyka, a zwłaszcza algebraika, jakim był Cardano.
Po kilku próbach doszedłem do czegoś takiego, co całkiem nieźle mnie zdumiało:

\(\displaystyle{ \left(\frac{-1 - \sqrt{-3}}{2} \right)^{3} = \frac{-1 - 3\sqrt{-3} + 9 + 3\sqrt{-3}}{8} = \frac{8}{8} = 1.}\)

Analogicznie otrzymujemy, że:

\(\displaystyle{ \left(\frac{-1 + \sqrt{-3}}{2} \right)^{3} = 1.}\)

Jak się później przekonałem, nic w tym dziwnego, wystarczy po prostu rozwiązać równanie (myślę, że raczej tak Cardano do tego doszedł, nie metodą prób i błędów):
\(\displaystyle{ w^{3} = 1 \Leftrightarrow (w-1)(w^{2} + w + 1) = 0.}\)
Od razu stąd widać, że pierwiastkami sześciennymi z jedynki jest oczywiście jeden, ale także dwa pierwiastki trójmianu w nawiasie równe tyle, co widzimy wyżej.
Przyjmijmy dla wygody oznaczenie:

\(\displaystyle{ \epsilon := \frac{-1-\sqrt{-3}}{2}.}\)

Zauważmy od razu, że \(\displaystyle{ \epsilon^{2} = -\epsilon - 1 = \frac{1+\sqrt{-3}}{2} - 1 = \frac{-1 + \sqrt{-3}}{2}, \ \epsilon^{3} = 1}\) (pierwsza równość wynika z faktu, że \(\displaystyle{ \epsilon}\) spełnia równość \(\displaystyle{ w^{2} + w + 1 = 0}\), druga zaś wprost z definicji - \(\displaystyle{ \epsilon}\) jest pierwiastkiem trzeciego stopnia z jedności).
Wróćmy teraz do rozwiązywania równania.
Jesteśmy w momencie pierwiastkowania sześciennego:

\(\displaystyle{ u^{3} = \frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}, \ v^{3} = \frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}.}\)

Wiedząc, że możliwe są trzy pierwiastki sześcienne z jedynki otrzymujemy możliwe wartości na \(\displaystyle{ u}\) i \(\displaystyle{ v}\):

\(\displaystyle{ u = \epsilon^{j} \sqrt[3]{\frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}}, \ v = \epsilon^{k} \sqrt[3]{\frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}}, \ j, k \in \{ 0, 1, 2 \}.}\)

Patrząc na ilość możliwości na \(\displaystyle{ j}\) i \(\displaystyle{ k}\) otrzymujemy teoretycznie aż dziewięć pierwiastków. Mamy jednak prosty sposób, by temu zapobiec - wiemy, ile musi wynosić iloczyn \(\displaystyle{ u}\) i \(\displaystyle{ v}\):

\(\displaystyle{ uv = -\frac{p}{3} \\ \\ \epsilon^{j+k} \sqrt[3] {\frac{q^{2}}{4} - \left( \frac{q^{2}}{4} + \frac{p^{3}}{27} \right)} = -\frac{p}{3} \\ \epsilon^{j+k} = 1.}\)

Stąd mamy prosty warunek na \(\displaystyle{ j}\) i \(\displaystyle{ k}\) - ich suma musi się dzielić przez \(\displaystyle{ 3}\). Możliwe są więc tylko pary \(\displaystyle{ (0, 0), (1, 2)}\) i \(\displaystyle{ (2, 1)}\). Są dokładnie trzy, więc otrzymamy trzy pierwiastki wzorami, które popularnie nazywają się właśnie wzorami Cardano:

\(\displaystyle{ y_{1} = \sqrt[3]{\frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}} + \sqrt[3]{\frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}} \\ \\ y_{2} = \epsilon \sqrt[3]{\frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}} + \epsilon^{2} \sqrt[3]{\frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}} \\ \\ y_{3} = \epsilon^{2} \sqrt[3]{\frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}} + \epsilon \sqrt[3]{\frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}}.}\)

W skrócie można to napisać tak:

\(\displaystyle{ y_{n+1} = \epsilon^{n} \sqrt[3]{\frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}} + \epsilon^{3-n} \sqrt[3]{\frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}}, \ n \in \{ 0, 1, 2 \}.}\)

Zróbmy tutaj jeszcze ważną rzecz, czyli sprawdzenie, że wzory te istotnie dają rozwiązania naszego równania. Dla uproszczenia przyjmijmy oznaczenia:

\(\displaystyle{ u_{0} = \sqrt[3]{\frac{-q}{2} - \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}}, \ v_{0} = \sqrt[3]{\frac{-q}{2} + \sqrt{\left(\frac{q}{2} \right)^{2} + \left(\frac{p}{3} \right)^{3}}}.}\)

Wtedy \(\displaystyle{ y_{n+1} = \epsilon^{n} u_{0} + \epsilon^{3-n} v_{0}, \ n \in \{ 0, 1, 2 \}.}\)

Sprawdzamy (pamiętając, że \(\displaystyle{ \epsilon}\) spełnia równanie \(\displaystyle{ w^{2} + w + 1 = 0)}\):

\(\displaystyle{ y_{1} + y_{2} + y_{3} = u_{0} + v_{0} + \epsilon u_{0} + \epsilon^{2} v_{0} + \epsilon^{2} u_{0} + \epsilon v_{0} = u_{0} (1 + \epsilon + \epsilon^{2}) + v_{0} (1 + \epsilon + \epsilon^{2}) = 0}\)

\(\displaystyle{ y_{1}y_{2} + y_{1}y_{3} + y_{2}y_{3} = (u_{0} + v_{0})(\epsilon u_{0} + \epsilon^{2} v_{0}) + (u_{0} + v_{0})(\epsilon^{2} u_{0} + \epsilon v_{0}) + (\epsilon u_{0} \mbox{+} \epsilon^{2} v_{0})(\epsilon^{2} u_{0} \mbox{+} \epsilon v_{0}) \mbox{ = } \\ \phantom{suma koczyników} = \epsilon u_{0}^{2} + \epsilon^{2} u_{0} v_{0} + \epsilon u_{0} v_{0} + \epsilon^{2} v_{0}^{2} + \epsilon^{2} u_{0}^{2} + \epsilon u_{0} v_{0} + \epsilon^{2} u_{0} v_{0} \mbox{+} \epsilon v_{0}^{2} \mbox{+} u_{0}^{2} \mbox{+} \epsilon^{2} u_{0} v_{0} \mbox{+} \epsilon u_{0} v_{0} \mbox{+} v_{0}^{2} \mbox{ = } \\ \phantom{suma koczyników} = u_{0}^{2} (1 + \epsilon + \epsilon^{2}) + v_{0}^{2} (1 + \epsilon + \epsilon^{2}) + 3u_{0} v_{0} (\epsilon + \epsilon^{2}) = -3 u_{0} v_{0} = p}\)

\(\displaystyle{ y_{1}y_{2}y_{3} = (u_{0} + v_{0})(\epsilon u_{0} + \epsilon^{2} v_{0})(\epsilon^{2} u_{0} + \epsilon v_{0}) = (\epsilon u_{0}^{2} + \epsilon^{2} u_{0} v_{0} \mbox{+} \epsilon u_{0} v_{0} \mbox{+} \epsilon^{2} v_{0}^{2})(\epsilon^{2} u_{0} \mbox{+} \epsilon v_{0}) \mbox{ = } \\ \phantom{uloczy} = u_{0}^{3} + \epsilon u_{0}^{2} v_{0} + u_{0}^{2} v_{0} + \epsilon u_{0} v_{0}^{2} + \epsilon^{2} u_{0}^{2} v_{0} + u_{0} v_{0}^{2} + \epsilon^{2} u_{0} v_{0}^{2} + v_{0}^{3} = \\ \phantom{uloczy} = u_{0}^{3} + v_{0}^{3} + u_{0}^{2} v_{0} (1 + \epsilon + \epsilon^{2}) + u_{0} v_{0}^{2} (1 + \epsilon + \epsilon^{2}) = -q.}\)

Jak więc widzimy, liczby \(\displaystyle{ y_{1}, y_{2}, y_{3}}\) spełniają wzory Viete'a równania \(\displaystyle{ y^{3} + py + q = 0}\), są więc wszystkimi jego pierwiastkami.

Zanim przejdziemy do dalszych, bardziej precyzyjnych rozważań, które ostatecznie wyczerpują tematykę rozwiązywania równań sześciennych (nad ciałem liczb zespolonych), warto zapoznać się z kilkoma

Przykładami:

\(\displaystyle{ \mbox{(i)} \ y^{3} + 9y + 26 = 0}\)
Obliczamy wyróżnik: \(\displaystyle{ \Delta = 4 \cdot (27 + 169) = 4 \cdot 14^{2}.}\)
Obliczamy pomocnicze \(\displaystyle{ u_{0} \mbox{ i } v_{0}: \ u_{0} = \sqrt[3]{-13 - 14} = -3, \ v_{0} = \sqrt[3]{-13+14} = 1.}\)
Czyli pierwiastkami tego równania są, zgodnie z wzorami, liczby:
\(\displaystyle{ y_{1} = u_{0} + v_{0} = -2, \ y_{2} = -3 \epsilon + \epsilon^{2} = \frac{3 + 3\sqrt{-3} - 1 + \sqrt{-3}}{2} = 1 + 2\sqrt{-3}, \\ y_{3} = -3 \epsilon^{2} + \epsilon = \frac{3 - 3\sqrt{-3} - 1 - \sqrt{-3}}{2} = 1 - 2\sqrt{-3}.}\)
Trzeba, dla porządku dodać, że pierwszy pierwiastek można było łatwo odgadnąć, wtedy do rozwiązania zostaje równanie kwadratowe i nie potrzeba nam żadnych nowych wzorów.
Jednak dobrze jest, gdy nowa metoda obejmuje starą. ;)

\(\displaystyle{ \mbox{(ii)} \ y^{3} - 6y + 6 = 0}\)
Postępujemy analogicznie jak wyżej:
\(\displaystyle{ u_{0} = \sqrt[3]{3 - \sqrt{9-8}} = \sqrt[3]{2}, \ v_{0} = \sqrt[3]{3 + 1} = \sqrt[3]{4}.}\)
I wyznaczamy pierwiastki:

\(\displaystyle{ y_{1} = \sqrt[3]{2} + \sqrt[3]{4},}\)

\(\displaystyle{ y_{2} = \epsilon \sqrt[3]{2} + \epsilon^{2} \sqrt[3]{4} = \frac{1}{2} \left(-1 - \sqrt{-3} \right) \sqrt[3]{2} + \frac{1}{2} \left(-1+\sqrt{-3} \right) \sqrt[3]{4} = -\frac{1}{2} \left( \sqrt[3]{2} + \sqrt[3]{4} \right) + \frac{1}{2} \left( \sqrt[3]{2} - \sqrt[3]{4} \right) \sqrt{-3},}\)

\(\displaystyle{ y_{3} = \epsilon^{2} \sqrt[3]{2} + \epsilon \sqrt[3]{4} = \frac{1}{2} \left(-1 + \sqrt{-3} \right) \sqrt[3]{2} + \frac{1}{2} \left(-1 - \sqrt{-3} \right) \sqrt[3]{4} = -\frac{1}{2} \left( \sqrt[3]{2} + \sqrt[3]{4} \right) - \frac{1}{2} \left( \sqrt[3]{2} - \sqrt[3]{4} \right) \sqrt{-3}}\)

Jak widzimy, w przypadku tego równania nie udałoby nam się odgadnąć pierwiastka, gdyż jest on niewymierny. Stąd wniosek, że w przypadku pewnych równań wzory te są praktyczne i przydatne.

\(\displaystyle{ \mbox{(iii)} \ y^{3} - 3y - 2 = 0}\)
Obliczamy wyróżnik: \(\displaystyle{ \Delta = 4 \cdot (1 - 1) = 0.}\)
Patrząc na analogię z równaniem kwadratowym spodziewalibyśmy się jakiegoś pierwiastka wielokrotnego. Istotnie, już za chwilkę przekonamy się o tym na własne oczy:
\(\displaystyle{ u_{0} = \sqrt[3]{-1} = -1, \ v_{0} = \sqrt[3]{-1} = -1 \\ y_{1} = -1-1 = -2, \ y_{2} = \epsilon + \epsilon^{2} = -1, \ y_{3} = \epsilon^{2} + \epsilon = -1.}\)
Jest więc przewidywany pierwiastek dwukrotny. Oczywiście wszystko ładnie sobie uogólnimy w następnym paragrafie, podamy ilość pierwiastków rzeczywistych w każdym przypadku i ich krotności - teraz tylko przykłady na stosowanie wzorów Cardano.

\(\displaystyle{ \mbox{(iv)} \ y^{3} - \frac{3}{4} y + \frac{1}{8} = 0}\)

Obliczamy:
\(\displaystyle{ u_{0} = \sqrt[3]{-\frac{1}{16} - \sqrt{ \left( \frac{1}{16} \right)^{2} - \left( \frac{1}{4} \right)^{3}}} = \sqrt[3]{-\frac{1}{16} - \sqrt{\frac{-3}{256}}} = \frac{1}{2}\sqrt[3]{\frac{-1-\sqrt{-3}}{2}} \\ \\ v_{0} = \frac{1}{2}\sqrt[3]{\frac{-1+\sqrt{-3}}{2}}.}\)

Doszliśmy więc do wspominanego wcześniej przypadku nieprzywiedlnego. I w istocie, jest on nieprzywiedlny w takim sensie, że o ile Cardano (i nam wyżej) udało się przedtem ten problem rozwikłać dla innego równania sześciennego, tak tutaj tego uczynić się nie da. Pierwiastki tego równania nie wyrażają się nawet przez tak zwane pierwiastniki rzeczywiste (rozumiemy przez to, że nie da się ich "zobaczyć" jako efektu czterech podstawowych działań i pierwiastkowania dowolnym stopniem liczb rzeczywistych). Jest to jednak fakt nieelementarny - zainteresowanym polecam zgłębiać teorię ciał, w szczególności teorię Galois - to właśnie jemu zawdzięczamy ten i wiele innych wyników, nad którymi ludzie łamali sobie przez długie lata głowy.
Matematycy jednak nie byliby sobą, gdyby zostawili ten problem tak, jak go widzimy. Właśnie w następnym paragrafie wskażemy metodę zamiany w taką postać, z której widać znacznie więcej, a także można łatwo liczyć przybliżone wartości tych pierwiastków, bo w tej postaci algebraicznej nie mamy bladego pojęcia, ile mniej więcej może być równy taki pierwiastek.

Analiza przypadku współczynników rzeczywistych


Powracamy do wyjściowego równania \(\displaystyle{ y^{3} + py + q = 0}\), gdzie \(\displaystyle{ p, q \in \mathbb{R}}\). Korzystając z kilku faktów o liczbach zespolonych, których tutaj nie będziemy dowodzić przeprowadzimy rzetelną analizę ilości i typu pierwiastków rzeczywistych takiego równania. Kluczową rolę będzie oczywiście grał wyróżnik, przy czym wystarczy nam badać znak nie samego wyróżnika, tylko wyrażenia \(\displaystyle{ \frac{\Delta}{4} = \left(\frac{q}{2} \right)^{2} + \left( \frac{p}{3} \right)^{3},}\) które nieco lepiej się prezentuje. Będziemy również stosowali oznaczenie \(\displaystyle{ i = \sqrt{-1},}\) na zasadzie takiej, że \(\displaystyle{ i}\) jest którymś z tych pierwiastków (drugim jest oczywiście \(\displaystyle{ -i).}\)

\(\displaystyle{ 1. \Delta > 0}\)

Korzystając z wzorów Cardano i wcześniejszych oznaczeń zapiszemy pierwiastki w przeformułowanej postaci:

\(\displaystyle{ y_{1} = u_{0} + v_{0} \\ y_{2} = \frac{-1-i\sqrt{3}}{2}u_{0} + \frac{-1+i\sqrt{3}}{2}v_{0} = -\frac{1}{2}(u_{0} + v_{0}) + i\frac{\sqrt{3}}{2}(v_{0} - u_{0}) \\ y_{3} = \frac{-1+i\sqrt{3}}{2}u_{0} + \frac{-1-i\sqrt{3}}{2}v_{0} = -\frac{1}{2}(u_{0}+v_{0}) - i\frac{\sqrt{3}}{2}(v_{0} - u_{0})}\)
Przy powyższym założeniu o wyróżniku, liczby \(\displaystyle{ u_{0} \mbox{ i } v_{0}}\) są rzeczywiste, a więc ich suma i iloczyn również. Stąd wniosek, że pierwszy pierwiastek jest rzeczywisty, pozostałe dwa są zaś zespolone sprzężone i nigdy nie są rzeczywiste (to już zostawiam jako obserwację).
Oczywiście wszystkie te pierwiastki są pierwiastkami pojedynczymi.

\(\displaystyle{ 2. \Delta = 0}\)
Gdy wyróżnik się zeruje, to zachodzi równość \(\displaystyle{ u_{0} = v_{0} = -\sqrt[3]{\frac{q}{2}}.}\) Korzystając więc z powyższych rozważań otrzymujemy wzory:
\(\displaystyle{ y_{1} = u_{0} +v_{0} = -2\sqrt[3]{\frac{q}{2}}, y_{2} = y_{3} = -\frac{1}{2}y_{1} = \sqrt[3]{\frac{q}{2}}.}\)
Stąd wnioskujemy, że wszystkie pierwiastki są rzeczywiste i zawsze jest pierwiastek podwójny. Może on się oczywiście stać pierwiastkiem potrójnym wtedy i tylko wtedy, gdy \(\displaystyle{ q}\) jest zerem, ale wtedy i \(\displaystyle{ p}\) jest zerem, czyli gdy pierwotne równanie ma postać: \(\displaystyle{ \left(x+\frac{b}{3a} \right)^{3} = 0.}\)

\(\displaystyle{ 3. \Delta < 0}\)

Dochodzimy do najbardziej interesującego przypadku - chcemy pokazać, że przy takich założeniach równanie ma dokładnie trzy pierwiastki rzeczywiste.
W tym celu w wyprowadzaniu wzorów Cardano cofamy się do momentu wyliczenia liczb \(\displaystyle{ u_{0}^{3} \mbox{ i } v_{0}^{3}}\), które, jako że wyróżnik jest ujemny, są zespolone nierzeczywiste sprzężone, więc zapiszmy je tak, by było to dobrze widać:

\(\displaystyle{ u_{0}^{3} = -\frac{q}{2} - i \sqrt{-\frac{q^{2}}{4} - \frac{p^{3}}{27}}, \ v_{0}^{3} = -\frac{q}{2} + i \sqrt{-\frac{q^{2}}{4} - \frac{p^{3}}{27}}.}\)
Do dalszych działań zapiszmy je w postaci trygonometrycznej:

\(\displaystyle{ u_{0}^{3} = r( \cos \phi - i \sin \phi), \ v_{0}^{3} = r( \cos \phi + i \sin \phi),}\) gdzie \(\displaystyle{ r}\) jest modułem tych liczb równym

\(\displaystyle{ r = \sqrt{\frac{q^{2}}{4} -\frac{q^{2}}{4} - \frac{p^{3}}{27} } = \sqrt{\left(-\frac{p}{3}\right)^{3}}}\) (pamiętamy, że wyróżnik jest ujemny, a warunkiem na to koniecznym jest \(\displaystyle{ p < 0}\)),
natomiast kąt \(\displaystyle{ \phi}\) odnajdujemy z zależności:

\(\displaystyle{ \sin \phi = \frac{\sqrt{-\frac{q^{2}}{4} - \frac{p^{3}}{27}}}{\sqrt{\left(-\frac{p}{3}\right)^{3}}}, \ \cos \phi = \frac{-\frac{q}{2}}{\sqrt{\left(-\frac{p}{3}\right)^{3}}}.}\)

Napisałem to oczywiście tylko dla formalności, gdyż każdy, kto miał styczność z liczbami zespolonymi powinien umieć zamieniać je na postać trygonometryczną, a nigdzie dalej z tego nie będę bynajmniej korzystał.
Teraz, aby znaleźć liczby \(\displaystyle{ u_{0}}\) i \(\displaystyle{ v_{0}}\) wystarczy skorzystać z wzoru de Moivre'a na pierwiastki liczby zespolonej. Pamiętamy jednak, że z liczby zespolonej (różnej od zera) istnieją zawsze trzy różne pierwiastki sześcienne, będziemy je oznaczać indeksem u góry:

\(\displaystyle{ u_{0}^{(k+1)} = \sqrt[3]{r} \left( \cos \frac{\phi + 2k \pi}{3} - i \sin \frac{\phi + 2k \pi}{3} \right), \ v_{0}^{(k+1)} = \sqrt[3]{r} \left( \cos \frac{\phi + 2k \pi}{3} + i \sin \frac{\phi + 2k \pi}{3} \right) \mbox{, k \in \{0, 1, 2 \}}.}\)

Pierwiastki naszego równania to miały być liczby będące sumą liczb \(\displaystyle{ u_{0}}\) i \(\displaystyle{ v_{0}}\). Ponieważ mamy trzy różne pary tych liczb, stąd otrzymamy trzy różne pierwiastki równania i jak zobaczymy, wszystkie będą rzeczywiste:

\(\displaystyle{ y_{k+1} = u_{0}^{(k+1)} \mbox{ + } v_{0}^{(k+1)} = 2\sqrt[3]{r} \cos \frac{\phi + 2k \pi}{3} = 2 \sqrt{-\frac{p}{3}} \cos \left( \frac{\phi}{3} + \frac{2k \pi}{3} \right) \mbox{, k \in \{0, 1, 2\}}.}\)

Wstawiając te liczby do równania możemy się przekonać, że istotnie są rozwiązaniami.

Udało się nam je zapisać w takiej postaci, dzięki której możemy obliczać je z dowolną dokładnością, co było naszym głównym celem.

Okazuje się jednak, że dzięki funkcjom trygonometrycznym możemy podać jedną ogólną metodę, która nadaje się również do analizy typów i krotności, rozwiązywania równań sześciennych o dziedzinie zespolonej (a więc w szczególności rzeczywistej).

Analiza przypadku współczynników zespolonych


Na samym początku chciałbym zaznaczyć, że o ile powyższe rozważania, wzory i pomysły można znaleźć w wielu źródłach (gdyby ktoś potrzebował namiary na owe źródła, proszę pisać na PW) i to z nich pochodziła w głównej mierze moja wiedza o zagadnieniu, o tyle te poniżej są w całości mojego autorstwa.
Nie należy oczywiście z tego wnioskować, że nie można tego nigdzie znaleźć - przypuszczam, że ktoś to już kiedyś zrobił. Jednak, gdyby nie, to deklaruję się jawnie jako autor.

Wracamy do postaci kanonicznej: \(\displaystyle{ x^{3} + px + q = 0}\), tylko że teraz współczynniki są liczbami zespolonymi - \(\displaystyle{ p, q \in \mathbb{C} \backslash \{ 0 \}}\).
Dokonujemy pierwszego podstawienia \(\displaystyle{ x = 2 \sqrt{-\frac{p}{3}} y,}\) gdzie \(\displaystyle{ \sqrt{-\frac{p}{3}}}\) jest ustalonym pierwiastkiem zespolonym (jednym z dwóch):

\(\displaystyle{ \left( 2\sqrt{-\frac{p}{3}}y \right)^{3} + 2p \sqrt{-\frac{p}{3}}y + q = 0 \\ -\frac{8p}{3} \sqrt{-\frac{p}{3}} y^{3} + 2p \sqrt{-\frac{p}{3}} y = -q \ / : \left( -\frac{2p}{3} \sqrt{-\frac{p}{3}} \right) \\ 4y^{3} - 3y = \frac{3}{2} \frac{q}{p\sqrt{ -\frac{p}{3}}}.}\)

Teraz dokonujemy drugiego podstawienia \(\displaystyle{ y = \cos z :}\)
\(\displaystyle{ 4 \cos^{3} z - 3 \cos z = \frac{\frac{q}{2}}{\frac{p}{3}\sqrt{ -\frac{p}{3}}}.}\)
Zauważmy, iż po lewej mamy wzór na cosinus potrojonego kąta i tak uzyskujemy równość:

\(\displaystyle{ \cos 3z = \frac{\frac{q}{2}}{\frac{p}{3}\sqrt{ -\frac{p}{3}}}.}\)

Wprowadzamy pomocnicze stałe, by uprościć zapis:

\(\displaystyle{ u + iv := \frac{\frac{q}{2}}{\frac{p}{3}\sqrt{ -\frac{p}{3}}}}\)

i tak otrzymujemy równanie \(\displaystyle{ \cos 3z = u + iv.}\)

Tutaj zaczynają się problemy, gdyż cosinus nie jest bynajmniej funkcją różnowartościową - jest parzysty jako funkcja zespolona i okresowy po osi rzeczywistej. W tym jednak momencie nam to nie przeszkadza. Dopiero, gdy będziemy potrzebowali odpowiednich założeń, to je poczynimy - tak będzie widać skąd się wzięły.
Od razu poczynimy umowę, że gdy argument cosinusa jest liczbą rzeczywistą, to rozumiemy go, jako "zwykły" rzeczywisty cosinus, a gdy argumentem jest liczba zespolona, to traktujemy go jak funkcję zespoloną. Zauważyć należy również, że wszelkie własności cosinusa argumentów rzeczywistych "dziedziczą się" na cosinusa o argumentach zespolonych. Wynika to z faktu jednoznacznego rozwijania funkcji w szereg Taylora. Dzięki temu też zachodzą tożsamości Eulera o postaci wykładniczej funkcji trygonometrycznych, które rozszerzamy na dziedzinę zespoloną. Wypiszmy te podstawowe:
\(\displaystyle{ \sin x = \frac{e^{ix} - e^{-ix}}{2i}, \ \cos x = \frac{e^{ix} + e^{-ix}}{2}.}\)
Teraz zastosujmy je do argumentów urojonych i otrzymamy przydatne za chwilę wzory:
\(\displaystyle{ \sin (ix) = \frac{e^{-x} - e^{x}}{2i} = i \frac{e^{-x} - e^{x}}{-2} = i \frac{e^{x} - e^{-x}}{2} = i \sinh x \\ \cos (ix) = \frac{e^{-x} + e^{x}}{2} = \cosh x.}\)
Gdzie \(\displaystyle{ \sinh x}\) i \(\displaystyle{ \cosh x}\) to funkcje hiperboliczne (odpowiednio sinus i cosinus hiperboliczny).

Zapiszmy \(\displaystyle{ 3z = a+ib}\) i mamy ciąg równości:

\(\displaystyle{ u + iv = \cos 3z = \cos(a + ib) = \cos a \cos (ib) - \sin a \sin (ib) = \cos a \cosh b - i \sin a \sinh b.}\)

Z definicji dwie liczby zespolone są sobie równe, gdy mają równe odpowiednio części rzeczywiste i urojone. Stąd wynika układ równań:

\(\displaystyle{ \begin{cases} \begin{array} {rcr} \cos a \cosh b \! \! \! \! & = \! \! \! \! & u \\ \sin a \sinh b \! \! \! \! & = \! \! \! \! & -v \end{array} \end{cases}}\)

Postaramy się go teraz rozwiązać. W tym celu podniesiemy obie strony każdego równania do kwadratu i skorzystamy z tożsamości \(\displaystyle{ \sin^{2} a + \cos^{2} a = 1, \ \cosh^{2} b - \sinh^{2} b = 1 :}\)

\(\displaystyle{ \begin{cases} \begin{array} {rcl} \cos^{2} a \cosh^{2} b \! \! \! \! & = \! \! \! \! & u^{2} \\ \sin^{2} a \sinh^{2} b \! \! \! \! & = \! \! \! \! & v^{2} \end{array} \end{cases} \!\! \Leftrightarrow \begin{cases} \begin{array} {rcl} \cos^{2} a \cosh^{2} b \! \! \! \! & = \! \! \! \! & u^{2} \\ (1 - \cos^{2} a)(\cosh^{2} b - 1) \! \! \! \! & = \! \! \! \! & v^{2} \end{array} \end{cases} \!\! \Leftrightarrow \begin{cases} \begin{array} {rcl} \cos^{2} a \cosh^{2} b \! \! \! \! & = \! \! \! \! & u^{2} \\ \cosh^{2} b + \cos^{2} a - 1 - \cos^{2} a \cosh^{2} b \! \! \! \! & = \! \! \! \! & v^{2} \end{array} \end{cases}}\)

Teraz do drugiego równania dodajmy pierwsze a otrzymamy układ, który potrafimy już rozwiązać:

\(\displaystyle{ \begin{cases} \begin{array} {rcl} \cos^{2} a \cosh^{2} b \! \! \! \! & = \! \! \! \! & u^{2} \\ \cos^{2} a + \cosh^{2} b \! \! \! \! & = \! \! \! \! & u^{2} + v^{2} + 1 \end{array} \end{cases} \! \! \! \! \Leftrightarrow \begin{cases} \begin{array} {rcl} \cosh^{2} b \! \! \! \! & = \! \! \! \! & u^{2} + v^{2} + 1 - \cos^{2} a \\ \cos^{2} a \cosh^{2} b \! \! \! \! & = \! \! \! \! & u^{2} \end{array} \end{cases}}\)

Podstawiamy więc wyliczoną wartość \(\displaystyle{ \cosh^{2} b}\) do drugiego równania i otrzymujemy równanie kwadratowe ze względu na \(\displaystyle{ \cos^{2} a :}\)

\(\displaystyle{ \begin{array} {rcl} \cos^{2} a (u^{2} + v^{2} + 1 - \cos^{2} a) \! \! \! \! & = \! \! \! \! & u^{2} \\ - (\cos^{2} a)^{2} + (u^{2} + v^{2} + 1) \cos^{2} a \! \! \! \! & = \! \! \! \! & u^{2} \\ (\cos^{2} a)^{2} - (u^{2} + v^{2} + 1) \cos^{2} a + u^{2} \! \! \! \! & = \! \! \! \! & 0 \end{array}}\)

Zgodnie z wzorami na pierwiastki równania kwadratowego otrzymujemy:

\(\displaystyle{ \cos^{2} a = \frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2} \vee \cos^{2} a = \frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2}}\)

Oczywiście \(\displaystyle{ D}\) jest wyróżnikiem tego równania kwadratowego i zachodzą nierówności:
\(\displaystyle{ D := (u^{2} + v^{2} + 1)^{2} - 4u^{2} = (u^{2} + v^{2} + 1 - 2u)(u^{2} + v^{2} + 1 + 2u) = \\ \phantom{D,} = ((u-1)^{2} + v^{2})((u+1)^{2} + v^{2}) > 0 \ \forall (u,v) \in \mathbb{R}^{2}}\)

Zauważmy również, iż obydwa pierwiastki są nieujemne (gdyż ich suma jest dodatnia i iloczyn nieujemny), jednak pierwszy jest mniejszy lub równy \(\displaystyle{ 1}\), drugi zaś większy lub równy \(\displaystyle{ 1}\) (to można łatwo sprawdzić, jeśli ktoś nie wierzy), z tym, że równość zachodzi tylko w szczególnym przypadku, więc oczywistym jest, że możliwą wartością tego cosinusa jest ten pierwszy pierwiastek.
Wyliczmy od razu wartość drugiego cosinusa:

\(\displaystyle{ \cosh^{2} b = u^{2} + v^{2} + 1 - \cos^{2} a = u^{2} + v^{2} + 1 - \frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2} = \frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2}}\)

Jest to więc drugi ze znalezionych przed chwilą pierwiastków równania kwadratowego, o którym już wiemy, że jest zawsze większy lub równy \(\displaystyle{ 1}\).
Mamy więc rozwiązanie układu:

\(\displaystyle{ \begin{cases} \begin{array} {rcl} \cos^{2} a \! \! \! \! & = \! \! \! \! & \frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2} \\ \cosh^{2} b \! \! \! \! & = \! \! \! \! & \frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2} \end{array} \end{cases}}\)

Teraz, aby jednoznacznie (z dokładnością do okresu funkcji trygonometrycznych) wyznaczyć \(\displaystyle{ a}\) i \(\displaystyle{ b}\), potrzebujemy wartości obu sinusów:

\(\displaystyle{ \begin{cases} \begin{array} {rclclcl} \sin^{2} a \!\!\!\! & = \!\!\!\! & 1 - \cos^{2} a \!\!\!\! & = \!\!\!\! & 1 - \frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2} \!\!\!\! & = \!\!\!\! & \frac{1 - u^{2} - v^{2} + \sqrt{D}}{2} \\ \sinh^{2} b \!\!\!\! & = \!\!\!\! & \cosh^{2} b - 1 \!\!\!\! & = \!\!\!\! & \frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2} - 1 \!\!\!\! & = \!\!\!\! & \frac{u^{2} + v^{2} - 1 + \sqrt{D}}{2} \end{array} \end{cases}}\)

Teraz musimy pozbyć się kwadratów, pamiętając, że sinus i cosinus przyjmują wszystkie wartości z przedziału \(\displaystyle{ [-1, 1]}\), cosinus hiperboliczny jest zawsze większy lub równy \(\displaystyle{ 1}\), a sinus hiperboliczny może przyjąć każdą wartość rzeczywistą. Stąd wprowadzamy dodatkowe literki, które będą "pamiętały" znak. Dzięki temu jesteśmy pewni, że żadnego rozwiązania nie "zgubimy". Pierwiastkujemy:

\(\displaystyle{ \begin{array} {rclrcr} \sin a \!\!\!\! & = \!\!\!\! & \eta_{1} \sqrt{\frac{1 - u^{2} - v^{2} + \sqrt{D}}{2}} & \sinh b \!\!\!\! & = \!\!\!\! & \eta_{3} \sqrt{\frac{u^{2} + v^{2} - 1 + \sqrt{D}}{2}} \\ \cos a \!\!\!\! & = \!\!\!\! & \eta_{2} \sqrt{\frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2}} & \cosh b \!\!\!\! & = \!\!\!\! & \phantom{\eta} \sqrt{\frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2}} \end{array}, \ \mbox{ gdzie }\eta_{i} \in \{ -1, 0, 1 \}.}\)

Oczywiście na pierwszy rzut wygląda, że otrzymaliśmy zbyt wiele możliwych rozwiązań, jednak mamy na to remedium - przypomnijmy początkowy układ:

\(\displaystyle{ \begin{cases} \begin{array} {rcr} \cos a \cosh b \!\!\!\! & = \!\!\!\! & u \\ \sin a \sinh b \!\!\!\! & = \!\!\!\! & -v \end{array} \end{cases}}\)

Sprawdźmy teraz, czy wyliczone przez nas liczby są rozwiązaniem tego układu:

\(\displaystyle{ \begin{cases} \begin{array} {rcr} \eta_{2} \sqrt{\frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2}} \cdot \sqrt{\frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2}} \!\!\!\! & = \!\!\!\! & u \\ \eta_{1} \sqrt{\frac{1 - u^{2} - v^{2} + \sqrt{D}}{2}} \cdot \eta_{3} \sqrt{\frac{u^{2} + v^{2} - 1 + \sqrt{D}}{2}} \!\!\!\! & = \!\!\!\! & -v \end{array} \end{cases} \!\!\!\! \Leftrightarrow \begin{cases} \begin{array} {rcr} \eta_{2} \sqrt{\frac{(u^{2} + v^{2} + 1 - \sqrt{D})(u^{2} + v^{2} + 1 + \sqrt{D})}{4}} \!\!\!\! & = \!\!\!\! & u \\ \eta_{1} \eta_{3} \sqrt{\frac{(\sqrt{D} - (u^{2} + v^{2} - 1))(\sqrt{D} + (u^{2} + v^{2} - 1))}{4}} \!\!\!\! & = \!\!\!\! & -v \end{array} \end{cases}}\)

Korzystamy z wzoru na różnicę kwadratów, definicji wyróżnika i definicji funkcji signum (łac. znak):

\(\displaystyle{ \begin{cases} \begin{array} {rcr} \eta_{2} \sqrt{\frac{(u^{2}+v^{2}+1)^{2} - D}{4}} \!\!\!\! & = \!\!\!\! & u \\ \eta_{1} \eta_{3} \sqrt{\frac{D - (u^{2} + v^{2} - 1)^{2}}{4}} \!\!\!\! & = \!\!\!\! & -v \end{array} \end{cases} \!\! \Leftrightarrow \begin{cases} \begin{array} {rcr} \eta_{2} \sqrt{\frac{(u^{2} + v^{2} + 1)^{2} - (u^{2}+v^{2} +1)^{2} + 4u^{2}}{4}} \!\!\!\! & = \!\!\!\! & u \\ \eta_{1} \eta_{3} \sqrt{\frac{(u^{2}+v^{2} +1)^{2} - 4u^{2} - (u^{2} + v^{2} - 1)^{2}}{4}} \!\!\!\! & = \!\!\!\! & -v \end{array} \end{cases} \!\! \Leftrightarrow \begin{cases} \begin{array} {rcr} \eta_{2} \sqrt{\frac{4u^{2}}{4}} \!\!\!\! & = \!\!\!\! & u \\ \eta_{1} \eta_{3} \sqrt{\frac{2 \cdot 2 (u^{2} + v^{2}) - 4u^{2}}{4}} \!\!\!\! & = \!\!\!\! & -v \end{array} \end{cases} \!\! \Leftrightarrow \begin{cases} \begin{array} {rcr} \eta_{2} |u| \!\!\!\! & = \!\!\!\! & u \\ \eta_{1} \eta_{3} |v| \!\!\!\! & = \!\!\!\! & -v \end{array} \end{cases} \Leftrightarrow \\ \Leftrightarrow \begin{cases} \begin{array} {rcr} \eta_{2} \!\!\!\! & = \!\!\!\! & sgn \ u \\ \eta_{1} \eta_{3} \!\!\!\! & = \!\!\!\! & - sgn \ v \end{array} \end{cases}}\)

Udało nam się więc jednoznacznie wyznaczyć znak cosinusa, jednak dwóch pozostałych nie jesteśmy w stanie - tutaj właśnie ingeruje nam parzystość cosinusa zespolonego. Jest i na to rada. Wystarczy zauważyć, że zachodzi prosta tożsamość: \(\displaystyle{ \cos(a - ib) = \cos(2\pi -a + ib)}\), więc możemy zawsze przyjmować \(\displaystyle{ b}\) jako nieujemne, natomiast cała odpowiedzialność spadnie na wyliczanie \(\displaystyle{ a}\). Tak też zróbmy, czyli \(\displaystyle{ \eta_{3} \geq 0.}\) Wtedy od razu \(\displaystyle{ \eta_{1} = - sgn \ v.}\)
Mamy więc nasz układ ostatecznie rozwiązany:

\(\displaystyle{ \begin{cases} \begin{array} {rcr} \sin a \!\!\!\! & = \!\!\!\! & -sgn \ v \sqrt{\frac{1 - u^{2} - v^{2} + \sqrt{D}}{2}} \\ \cos a \!\!\!\! & = \!\!\!\! & sgn \ u \sqrt{\frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2}} \\ \cosh b \!\!\!\! & = \!\!\!\! & \sqrt{\frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2}} \end{array} \\ b \geq 0 \end{cases}}\)

Teraz korzystając z funkcji odwrotnej do cosinusa hiperbolicznego (i z założenia o \(\displaystyle{ b}\)) możemy podać wartość \(\displaystyle{ b}\), natomiast w przypadku \(\displaystyle{ a}\) musimy przypomnieć sobie, jakie znaki mają funkcje trygonometryczne w poszczególnych ćwiartkach i fakt, że zbiorem wartości arcusa cosinusa jest pierwsza i druga ćwiartka. I tak, gdy sinus jest ujemny, to kąt jest z trzeciej bądź czwartej ćwiartki, a gdy sinus jest nieujemny to z pierwszej lub drugiej. Widzimy więc, że gdy sinus jest nieujemny, to \(\displaystyle{ a}\) jest po prostu arcusem cosinusem, a gdy sinus jest ujemny, to trzeba dodać jeszcze \(\displaystyle{ \pi}\), by pojawić się w trzeciej bądź czwartej ćwiartce. Stąd też mamy wzory (dla przejrzystości zastosujemy tutaj literki \(\displaystyle{ \eta}\)) :

\(\displaystyle{ \begin{eqnarray*} a_{k+1} \!\!\!\! & = \!\!\!\! & \begin{cases} \arccos \eta_{2} \sqrt{\frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2}} + 2k \pi, & \mbox{ dla } \eta_{1} \geq 0 \\ \arccos \eta_{2} \sqrt{\frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2}} + \pi + 2k \pi, & \mbox{ dla } \eta_{1} < 0, \ k \in \mathbb{Z} \end{cases} \\ b \!\!\!\! & = \!\!\!\! & \text{arcosh}\, \sqrt{\frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2}} \end{eqnarray*}}\)

Możemy zapisać to krócej:

\(\displaystyle{ \begin{array} {rcrl} a_{k+1} \!\!\!\! & = \!\!\!\! & \arccos \eta_{2} \sqrt{\frac{u^{2} + v^{2} + 1 - \sqrt{D}}{2}} \!\!\!\! & + \frac{1}{2} \eta_{1} (\eta_{1} - 1) \pi + 2k \pi, \ k \in \mathbb{Z} \\ b \!\!\!\! & = \!\!\!\! & \text{arcosh}\, \sqrt{\frac{u^{2} + v^{2} + 1 + \sqrt{D}}{2}} \!\!\!\! & \end{array}}\)

Wracamy teraz kolejno z podstawieniami:

\(\displaystyle{ 3z_{k+1} = a_{k+1} + ib \Leftrightarrow z_{k+1} = \frac{1}{3}a_{k+1} + \frac{1}{3}ib, \ k \in \mathbb{Z}}\)
\(\displaystyle{ y_{k+1} = \cos z_{k+1}, \ k \in \{ 0, 1, 2 \}}\)
\(\displaystyle{ x_{k+1} = 2\sqrt{-\frac{p}{3}}y = 2\sqrt{-\frac{p}{3}} \cos z_{k+1}, \ k \in \{ 0, 1, 2 \}.}\)

Przydałoby się wyjaśnić, dlaczego dziedzina dla \(\displaystyle{ k}\) skurczyła się z wszystkich liczb całkowitych, do tylko trzech elementów. Zawdzięczamy to oczywiście okresowości funkcji trygonometrycznych. Zauważmy, że dowolną liczbę całkowitą \(\displaystyle{ k}\) możemy zapisać w postaci \(\displaystyle{ k = 3l + r}\), gdzie l jest całkowite, a \(\displaystyle{ r \in \{ 0, 1, 2 \}.}\) Wstawmy więc to do wzoru na \(\displaystyle{ y_{k+1}}\) (gdyż tam po raz pierwszy zwężyła nam się dziedzina):
\(\displaystyle{ y_{k+1} = y_{3l+r+1} = \cos z_{3l+r+1} = \cos \left( \frac{1}{3}a_{3l+r+1} + \frac{1}{3}i b \right) = \\ = \cos \left( \frac{1}{3}a_{1} + 2 \cdot \frac{1}{3} (3l+r) \pi \right) \cosh \frac{1}{3}b - i \sin \left( \frac{1}{3}a_{1} + 2 \cdot \frac{1}{3} (3l+r) \pi \right) \sinh \frac{1}{3}b = \\ = \cos \left( \frac{1}{3}a_{1} + 2 \pi l + \frac{2 \pi r}{3} \right) \cosh \frac{1}{3}b - i \sin \left( \frac{1}{3}a_{1} + 2 \pi l + \frac{2 \pi r}{3} \right) \sinh \frac{1}{3}b = \\ = \cos \left( \frac{1}{3}a_{1} + \frac{2 \pi r}{3} \right) \cosh \frac{1}{3}b - i \sin \left( \frac{1}{3}a_{1} + \frac{2 \pi r}{3} \right) \sinh \frac{1}{3}b = \\ = \cos \frac{1}{3}a_{r+1} \cosh \frac{1}{3}b \ - \ i \sin \frac{1}{3}a_{r+1} \sinh \frac{1}{3}b = \cos \left( \frac{1}{3}a_{r+1} + \frac{1}{3}ib \right) = \cos z_{r+1} = y_{r+1}.}\)

Istotnie więc otrzymaliśmy tylko trzy rozwiązania i zamiast literki \(\displaystyle{ r}\) stosujemy literkę \(\displaystyle{ k}\).

Teraz udowodnimy, że wybór jednego z pierwiastków zespolonych z liczby \(\displaystyle{ -\frac{p}{3}}\) na samym początku ciągu podstawień poczyniony został bez straty wszelkiej ogólności. Podstawmy mianowicie ten drugi i zobaczmy, czy uzyskamy z tego jakieś inne rozwiązania:
\(\displaystyle{ x = -2 \sqrt{-\frac{p}{3}}y = -2 \sqrt{-\frac{p}{3}} \cos z}\)
\(\displaystyle{ 8 \frac{p}{3} \sqrt{-\frac{p}{3}} \cos^{3} z - 2p \sqrt{-\frac{p}{3}} \cos z = - q \\ 4 \cos^{3} z - 3 \cos z = - \frac{\frac{q}{2}}{\frac{p}{3} \sqrt{-\frac{p}{3}}} \\ \cos 3z = - \cos 3z_{k+1} \\ \cos 3z + \cos 3z_{k+1} = 0 \\ 2 \cos \frac{3z + 3z_{k+1}}{2} \cos \frac{3z - 3z_{k+1}}{2} = 0 \\ \cos \frac{3z + 3z_{k+1}}{2} = 0 \vee \cos \frac{3z - 3z_{k+1}}{2} = 0.}\)

W powyższych przekształceniach skorzystaliśmy ze wzoru na cosinus potrojonego argumentu, do tej pory uzyskanych rozwiązań, a także wzoru na sumę cosinusów.
Przyjmijmy teraz oznaczenie: \(\displaystyle{ 3z = c + id}\) i liczmy dalej:

\(\displaystyle{ \cos \frac{c + a_{k+1} + i(d+b)}{2} = 0 \ \vee \ \cos \frac{c - a_{k+1} + i(d - b)}{2} = 0}\)
\(\displaystyle{ \cos \frac{c+a_{k+1}}{2} \cosh \frac{b+d}{2} - i \sin \frac{c+a_{k+1}}{2} \sinh \frac{b+d}{2} = 0 \ \vee \ \cos \frac{c-a_{k+1}}{2} \cosh \frac{b-d}{2} - i \sin \frac{c-a_{k+1}}{2} \sinh \frac{b-d}{2} = 0.}\)

Z definicji liczba zespolona jest równa zero, gdy jej część rzeczywista i urojona jest zerem. Oczywiście cosinus hiperboliczny jest zawsze większy lub równy \(\displaystyle{ 1}\), więc zerować musi się cosinus trygonometryczny, wtedy też nie zeruje się sinus trygonometryczny, czyli zerować musi się sinus hiperboliczny. Stąd mamy układ równań:

\(\displaystyle{ \begin{array} {lcl} \begin{cases} \begin{array} {rcl} \cos \frac{c+a_{k+1}}{2} \! \! \! \! & = \! \! \! \! & 0 \\ \sinh \frac{b+d}{2} \! \! \! \! & = \! \! \! \! & 0 \end{array} \end{cases} & \vee \ & \begin{cases} \begin{array} {rcl} \cos \frac{c-a_{k+1}}{2} \! \! \! \! & = \! \! \! \! & 0 \\ \sinh \frac{b-d}{2} \! \! \! \! & = \! \! \! \! & 0 \end{array} \end{cases} \\ \begin{cases} \begin{array} {rcl} \frac{c+a_{k+1}}{2} \! \! \! \! & = \! \! \! \! & \frac{\pi}{2} + m \pi \\ d \! \! \! \! & = \! \! \! \! & -b \end{array} \end{cases} & \vee \ & \begin{cases} \begin{array} {rcl} \frac{c-a_{k+1}}{2} \! \! \! \! & = \! \! \! \! & \frac{\pi}{2} + m \pi \\ d \! \! \! \! & = \! \! \! \! & b \end{array} \end{cases} \\ \begin{cases} c \! \! \! \! & = \pi - a_{k+1} + 2m \pi \\ d \! \! \! \! & = -b \end{cases} & \vee \ & \begin{cases} c \! \! \! \! & = \pi + a_{k+1} + 2m \pi \\ d \! \! \! \! & = b \end{cases}, \ m \in \mathbb{Z} \end{array}}\)

\(\displaystyle{ \begin{array} {llcl} & 3z = \pi - a_{k+1} - ib + 2m \pi & \ \vee \ & 3z = \pi + a_{k+1} + ib + 2m \pi \\ & 3z = -(a_{k+1} - 2m \pi + ib) + \pi & \ \vee \ & 3z = a_{k+1} + 2m \pi + ib + \pi \\ & 3z = -(a_{1} + 2k\pi - 2m \pi + ib) + \pi & \ \vee \ & 3z = a_{1} + 2k \pi + 2m \pi + ib + \pi \\ & 3z = -(a_{1} + 2(k - m + 1) + ib) + 3 \pi & \ \vee \ & 3z = a_{1} + 2(k + m -1) + ib + 3 \pi \\ & 3z = -3z_{k-m+2} + 3 \pi & \ \vee \ & 3z = 3z_{k+m} + 3\pi \\ & \phantom{3} z = -z_{k-m+2} + \pi & \ \vee \ & \phantom{3} z = z_{k+m} + \pi \end{array}}\)

Uzależniliśmy więc potencjalne nowe rozwiązania od wcześniej uzyskanych - nowa zmienna z nieco się różni od starej, jednak wrócimy teraz z podstawieniem i przekonamy się naocznie, że jednak nowych rozwiązań nie uzyskaliśmy - skorzystamy tutaj z parzystości cosinusa i wzorów redukcyjnych:

\(\displaystyle{ x = -2 \sqrt{-\frac{p}{3}} \cos z}\)
\(\displaystyle{ \begin{array} {rcl} x = -2 \sqrt{-\frac{p}{3}} \cos (-z_{k-m+2} + \pi) & \vee & x = -2 \sqrt{-\frac{p}{3}} \cos (z_{k+m} + \pi) \\ x = -2 \sqrt{-\frac{p}{3}} (-\cos z_{k-m+2}) & \vee & x = -2 \sqrt{-\frac{p}{3}} (-\cos z_{k+m}) \\ x = x_{k-m+2} & \vee & x = x_{k+m} \end{array}}\)

Możemy podstawić \(\displaystyle{ \phantom{,} l = k-m+2, \ n = k+m}\) i otrzymujemy \(\displaystyle{ x = x_{l} \ \vee \ x = x_{n}}\) i na mocy rozumowania, które przeprowadziliśmy przy wyprowadzaniu wzorów (zmniejszenie zasięgu wskaźników): \(\displaystyle{ l, n \in \{0, 1, 2 \}}\), czyli istotnie otrzymaliśmy te same rozwiązania z dokładnością do permutacji.


Artykuł w przebudowie. Ciąg dalszy nastąpi. 29.08.2009 12:46

Będę bardzo wdzięczny za wszelkie uwagi, pomysły, zauważone błędy i niejasności - proszę napisać Prywatną Wiadomość.


[Utworzono: 4 lutego 2005 o 15:39]


Równanie stopnia czwartego



Mamy równanie czwartego stopnia w ogólnej postaci (gdzie a nie jest zerem):

\(\displaystyle{ \large ax^{4}+bx^{3}+cx^{2}+dx+e=0}\)

Podobnie jak przy sześciennym dzielimy przez \(\displaystyle{ a}\), a następnie pozbywamy się wyrazu drugiego \(\displaystyle{ bx^{3}}\) stosując podstawienie:

\(\displaystyle{ \large x=y-\frac{b}{4a}}\)

Otrzymujemy w ten sposób równanie:

\(\displaystyle{ \large y^{4}+py^{2}+qy+r=0.}\)

Musimy teraz rozwiązać "odpowiednio dobrane" równanie sześcienne, takiej oto postaci:

\(\displaystyle{ \large z^{3}-2pz^{2}+(p^{2}-4r)z+q^{2} = 0.}\)

A pierwiastki naszego równania stopnia czwartego wyglądają tak:

\(\displaystyle{ \large y_{1}=\frac{\sqrt{-z_{1}} + \sqrt{-z_{2}} + \sqrt{-z_{3}}}{2} \\ y_{2}=\frac{\sqrt{-z_{1}} - \sqrt{-z_{2}} - \sqrt{-z_{3}}}{2} \\ y_{3}=\frac{-\sqrt{-z_{1}} + \sqrt{-z_{2}} - \sqrt{-z_{3}}}{2} \\ y_{4}=\frac{-\sqrt{-z_{1}} - \sqrt{-z_{2}} + \sqrt{-z_{3}}}{2}.}\)

Gdzie \(\displaystyle{ z_{1}, \ z_{2}, \ z_{3}}\) to pierwiastki tego równania sześciennego.

To jest metoda ogólna, dobra na każde równanie z "czwórką w wykładniku". Są jednak przypadki szczególne, które rozwiązuje się znacznie prościej i znacznie szybciej.

RÓWNANIE BIKWADRATOWE

Ogólna postać tego typu równań to:

\(\displaystyle{ \large ax^{4}+bx^{2}+c=0.}\)

Aby to rozwiązać, stosujemy podstawienie \(\displaystyle{ t=x^{2}}\) i rozwiązujemy równanie kwadratowe...

\(\displaystyle{ \large at^{2}+bt+c=0}\)

... o pierwiastkach:

\(\displaystyle{ \large t_{1}=\frac{-b-\sqrt{\Delta}}{2a}, \ t_{2}=\frac{-b+\sqrt{\Delta}}{2a}.}\)

Z tego pierwiastki naszego równania wyglądają następująco:

\(\displaystyle{ \large x_{1}=\sqrt{t_{1}}, \ x_{2}=-\sqrt{t_{1}}, \ x_{3}=\sqrt{t_{2}}, \ x_{4}=-\sqrt{t_{2}}.}\)

Oczywiście, jeżeli interesują nas tylko pierwiastki rzeczywiste, to delta równania kwadratowego musi być nieujemna, a później \(\displaystyle{ t_{1}}\) i \(\displaystyle{ t_{2}}\) również winny być nieujemne.

RÓWNANIE ZWROTNE

Jeżeli uda nam się sprowadzić równanie czwartego stopnia do takiej oto postaci...

\(\displaystyle{ \large x^{4}+ax^{3}+bx^{2}+ax+1=0}\)

...to mamy dużo szczęścia, gdyż możemy je bardzo prosto rowiązać.

Metoda jest nietrudna. Widzimy, że pierwiastkiem tego równania \(\displaystyle{ 0}\) z pewnością nie jest, więc podzielimy je sobie stronami przez \(\displaystyle{ x^{2}}\):

\(\displaystyle{ \large x^{2}+ax+b+a\frac{1}{x}+\frac{1}{x^{2}}=0.}\)

Pogrupujmy odpowiednio wyrazy:

\(\displaystyle{ \large x^{2}+\frac{1}{x^{2}}+a(x+\frac{1}{x})+b=0.}\)

Teraz wprowadzamy zmienną pomocniczą \(\displaystyle{ t}\), tak określoną:

\(\displaystyle{ \large t=x+\frac{1}{x}.}\)

I zauważamy, że:

\(\displaystyle{ \large t^{2}=x^{2}+\frac{1}{x^{2}}+2.}\)

Teraz podstawiamy:

\(\displaystyle{ \large t^{2}-2+at+b=0 \\ t^{2}+at+b-2=0.}\)

Rozwiązujemy więc to równanie kwadratowe, a następnie jeszcze jedno, tym razem na \(\displaystyle{ x}\), korzystając z naszego podstawienia:

\(\displaystyle{ \large t=x+\frac{1}{x} \\ t=\frac{x^{2}+1}{x} \\ x^{2}+1=xt \\ x^{2}-xt+1=0.}\)

Oczywiście ilość rozwiązań zależy wpierw od wyróżnika równania kwadratowego ze zmienną \(\displaystyle{ t}\), a następnie od tego, czy uzyskane \(\displaystyle{ t}\) jest większe od \(\displaystyle{ 2}\).



Będę bardzo wdzięczny za wszelkie uwagi, pomysły, zauważone błędy i niejasności - proszę napisać Prywatną Wiadomość.


[Utworzono: 4 lutego 2005 o 15:39]
[Ostatnia modyfikacja: 4 lutego 2005 o 15:39]
Ostatnio zmieniony 19 maja 2007, o 16:09 przez Rogal, łącznie zmieniany 2 razy.
Awatar użytkownika
Mariusz M
Użytkownik
Użytkownik
Posty: 6903
Rejestracja: 25 wrz 2007, o 01:03
Płeć: Mężczyzna
Lokalizacja: 53°02'N 18°35'E
Podziękował: 2 razy
Pomógł: 1246 razy

Sposoby rozwiązywania równań wielomianowych wyższych stopni

Post autor: Mariusz M »

Równanie czwartego stopnia

\(\displaystyle{ a_{4}x^{4}+a_{3}x^{3}+a_{2}x^{2}+a_{1}x+a_{0}=0}\)

Zakładamy że \(\displaystyle{ a_{4} \neq 0}\) i dzielimy równanie przez \(\displaystyle{ a_{4}}\)

\(\displaystyle{ x^{4}+ \frac{a_{3}}{a_{4}} x^{3}+ \frac{a_{2}}{a_{4}} x^{2}+ \frac{a_{1}}{a_{4}} x+ \frac{a_{0}}{a_{4}} =0.}\)

Przenosimy trójmian kwadratowy na drugą stronę równania

\(\displaystyle{ x^{4}+ \frac{a_{3}}{a_{4}} x^{3}= -\frac{a_{2}}{a_{4}} x^{2}- \frac{a_{1}}{a_{4}} x- \frac{a_{0}}{a_{4}}.}\)

Uzupełniamy lewą stronę równania do kwadratu dodając odpowiedni wyraz zgodnie ze wzorami skróconego mnożenia

\(\displaystyle{ x^{4}+ 2\frac{a_{3}}{2a_{4}} x^{3}+ \frac{a_{3}^{2}}{4a_{4}^{2}}x^{2} = \left(\frac{a_{3}^{2}}{4a_{4}^{2}}- \frac{a_{2}}{a_{4}} \right) x^{2}- \frac{a_{1}}{a_{4}} x- \frac{a_{0}}{a_{4}}}\)

\(\displaystyle{ \left( x^2+ \frac{a_{3}}{2a_{4}}x \right)^2 = \left(\frac{a_{3}^{2}}{4a_{4}^{2}}- \frac{a_{2}}{a_{4}} \right) x^{2}- \frac{a_{1}}{a_{4}} x- \frac{a_{0}}{a_{4}}.}\)

Aby prawa strona była kwadratem zupełnym jej wyróżnik musi być równy zero.
Wprowadzamy więc nową niewiadomą tak aby lewa strona była nadal kwadratem zupełnym obliczamy wyróżnik i przyrównujemy go do zera.
Otrzymamy równanie trzeciego stopnia względem wprowadzonej niewiadomej.

\(\displaystyle{ \left( x^2+ \frac{a_{3}}{2a_{4}}x + \frac{y}{2}\right)^2 = \left(\frac{a_{3}^{2}}{4a_{4}^{2}}- \frac{a_{2}}{a_{4}}\right) x^{2}- \frac{a_{1}}{a_{4}} x- \frac{a_{0}}{a_{4}}+y \left( x^2+ \frac{a_{3}}{2a_{4}}x \right)+ \frac{y^2}{4}}\)

\(\displaystyle{ \left( x^2+ \frac{a_{3}}{2a_{4}}x + \frac{y}{2} \right)^2 = \left(\frac{a_{3}^{2}}{4a_{4}^{2}}- \frac{a_{2}}{a_{4}} +y\right) x^{2}+\left( \frac{a_{3}}{2a_{4}}y- \frac{a_{1}}{a_{4}}\right) x- \frac{a_{0}}{a_{4}}+ \frac{y^2}{4}}\)

\(\displaystyle{ \left( x^2+ \frac{a_{3}}{2a_{4}}x + \frac{y}{2}\right)^2 = \left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y \right) x^{2}+\left( \frac{a_{3}}{2a_{4}}y- \frac{a_{1}}{a_{4}}\right) x- \frac{a_{0}}{a_{4}}+ \frac{y^2}{4}}\)

\(\displaystyle{ \Delta=0}\)

\(\displaystyle{ \left( \frac{a_{3}}{2a_{4}}y- \frac{a_{1}}{a_{4}}\right)^{2}= \left(y^2-4 \frac{a_{0}}{a_{4}}\right) \cdot \left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y\right)}\)

\(\displaystyle{ \left( \frac{a_{3}^{2}}{4a_{4}^{2}} y^2- \frac{a_{3}a_{1}}{a_{4}^{2}}y+ \frac{a_{1}^{2}}{a_{4}^{2}}\right)= \left( y^3+ \frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}}+ \frac{4a_{4}a_{0}^{2}-a_{3}^{2}a_{0}}{a_{4}^{3}}\right)}\)

\(\displaystyle{ y^{3}- \frac{a_{2}}{a_{4}}y^{2}+ \frac{a_{3}a_{1}-4a_{4}a_{0}}{a_{4}^{2}}y+ \frac{4a_{4}a_{0}^{2}-a_{3}^{2}a_{0}}{a_{4}^{3}}=0}\)

Rozwiązujemy równanie trzeciego stopnia tak jak podał Rogal i wybieramy jeden z trzech jego pierwiastków.

Teraz gdy obie strony równania są kwadratami zupełnymi korzystamy ze wzoru skróconego mnożenia na różnicę kwadratów i otrzymujemy iloczyn dwóch trójmianów kwadratowych.

\(\displaystyle{ \left( x^2+ \frac{a_{3}}{2a_{4}}x + \frac{y}{2}\right)^2 = \left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y \right) \left(x+ \frac{\left( \frac{a_{3}}{2a_{4}}y- \frac{a_{1}}{a_{4}}\right)}{2\left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y\right)} \right) ^2}\)

\(\displaystyle{ \left( x^2+ \frac{a_{3}}{2a_{4}}x + \frac{y}{2}\right)^2- \left( \sqrt{\left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y\right)}x+ \frac{\left( \frac{a_{3}}{2a_{4}}y- \frac{a_{1}}{a_{4}}\right)}{2\left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y\right)} \cdot \sqrt{\left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y\right)}\right) ^2=0}\)

\(\displaystyle{ \left(x^{2}+ \frac{a_{3}- \sqrt{a_{3}^{2}-4a_{4}a_{2}+4a_{4}^{2}y} }{2a_{4}}x+ \frac{y}{2}- \frac{\left( \frac{a_{3}}{2a_{4}}y- \frac{a_{1}}{a_{4}}\right)}{2\left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y\right)} \cdot \frac{\sqrt{a_{3}^{2}-4a_{4}a_{2}+4a_{4}^{2}y} }{2a_{4}}\right) \cdot \left(x^{2}+ \frac{a_{3}+ \sqrt{a_{3}^{2}-4a_{4}a_{2}+4a_{4}^{2}y} }{2a_{4}}x+ \frac{y}{2}+ \frac{\left( \frac{a_{3}}{2a_{4}}y- \frac{a_{1}}{a_{4}}\right)}{2\left(\frac{a_{3}^{2}-4a_{4}a_{2}}{4a_{4}^{2}} +y\right)} \cdot \frac{\sqrt{a_{3}^{2}-4a_{4}a_{2}+4a_{4}^{2}y} }{2a_{4}}\right)=0}\)

W jednej z wiadomości Rogal pisał coś o rozwiązywaniu równania czwartego stopnia w ten sposób:

\(\displaystyle{ \left( x^2+px+q\right)\left( x^2+rx+s\right)=x^4+a_{3}x^3+a_{2}x^2+a_{1}x+a_{0}\\
x^4+\left( p+r\right)x^3+\left( q+s+pr\right)x^2+\left( rq+ps\right)x+qs=x^4+a_{3}x^3+a_{2}x^2+a_{1}x+a_{0}\\
\begin{cases} p+r=a_{3} \\ q+s+pr=a_{2}\\ rq+ps=a_{1}\\ qs=a_{0} \end{cases}\\
\begin{cases} r=a_{3}-p\\ \begin{bmatrix}q\\ s\end{bmatrix}=\begin{bmatrix}1&1\\ a_{3}-p&p\end{bmatrix}^{-1}\begin{bmatrix}a_{2}-p\left( a_{3}-p\right)\\ a_{1} \end{bmatrix}\\ qs-a_{0}=0\\ \end{cases} }\)


Rogal w tej wiadomości twierdził, że dostajemy równanie trzeciego stopnia na \(\displaystyle{ p^2}\). Aby otrzymać takie równanie trzeba zastosować podstawienie.

Przed wymnożeniem trójmianów kwadratowych i porównaniem współczynników podstawiamy \(\displaystyle{ x=y- \frac{a_{3}}{4a_{4}}}\). Gdy pierwiastek równania szóstego stopnia jest zerowy, równanie czwartego stopnia jest dwukwadratowe. Jeżeli nie zastosowaliśmy podstawienia przed wymnożeniem trójmianów kwadratowych i porównaniem współczynników to stosujemy podstawienie \(\displaystyle{ p= \frac{a_{3}}{2}+u}\). Gdy wszystkie pierwiastki równania szóstego stopnia są zerowe, równanie czwartego ma pierwiastek poczwórny.

Metodę Ferrariego dość przystępnie opisuje Vax na swoim przykładzie

Jak rozwiązywać równania stopnia 4. metodą Ferrari?

Sposób wspomniany przez Rogala wzięty zapewne ze strony gladkiego, jak i ten, o którym ja wspomniałem, jest też opisany u Sierpińskiego.

Kod: Zaznacz cały

http://matwbn.icm.edu.pl/ksiazki/mon/mon11/mon1110.pdf
Jakiś czas temu pisałem z Vaxem o rozwiązywaniu równań czwartego stopnia i oto jak Vax opisuje metodę którą mu wtedy pokazałem na swoim przykładzie:

Jak rozwiązywać równania stopnia 4. metodą Ferrari?
Awatar użytkownika
Mariusz M
Użytkownik
Użytkownik
Posty: 6903
Rejestracja: 25 wrz 2007, o 01:03
Płeć: Mężczyzna
Lokalizacja: 53°02'N 18°35'E
Podziękował: 2 razy
Pomógł: 1246 razy

Re: Sposoby rozwiązywania równań wielomianowych wyższych stopni

Post autor: Mariusz M »

Przedstawiony tutaj sposób rozwiązywania równania czwartego stopnia pochodzi raczej od Eulera i jest uogólnieniem metody Niccolo Fontany dla równań trzeciego stopnia.
Ostatnio zauważyłem u Fichtenholza w paragrafie o całkach eliptycznych znalazłem podstawienie sprowadzające równanie czwartego stopnia do równania dwukwadratowego jednak nie mam pomysłu na sprowadzenie równania rozwiązującego szóstego stopnia do równania trzeciego stopnia.
ODPOWIEDZ