5次以上の方程式が代数的に解けないことについて

まずは「5次以上」ではなく「2次以上」の話から始める。

なぜ2次以上の方程式は四則演算だけで解けないのか

もちろん2次方程式の解の公式を知っていれば四則演算だけで解けないことは判るのだけど、ここでは「解と係数の関係」に注目する。
たとえば2次方程式の場合
 a x^2 + bx + c = a(x^2 + \frac{b}{a}x + \frac{c}{a})=a(x-x_1)(x-x_2)
となるので、
 \left\{\begin{eqnarray} \frac{b}{a} &=& -(x_1 + x_2) \\ \frac{c}{a} &=& x_1 x_2 \end{eqnarray} \right.
という関係がある。3次方程式では
 a x^3 + bx^2 + cx +d= a(x^3 + \frac{b}{a}x^2 + \frac{c}{a}x +\frac{d}{a})=a(x-x_1)(x-x_2)(x-x_3)
なので
 \left\{\begin{eqnarray} \frac{b}{a} &=& -(x_1 + x_2 +x_3) \\ \frac{c}{a} &=& x_1 x_2 + x_2 x_3 + x_3 x_1 \\ \frac{d}{a} &=& -(x_1 x_2 x_3) \end{eqnarray} \right.
という関係がある。4次以上でも同様の関係が得られる。
また、方程式の最高次の係数aで全体を割っておいても方程式の解は変わらないので、もしも解が求められるなら \frac{b}{a},\frac{c}{a}, \cdotsだけを使って求めることができる(たとえば2次の公式は x_1 = \frac{-b + \sqrt{b^2 - 4 a c}}{2a} = \frac{-\frac{b}{a}+ \sqrt{(\frac{b}{a})^2 - 4\frac{c}{a} }}{2}と書ける)。
解と係数の関係を見ると、係数 \frac{b}{a},\frac{c}{a}, \cdotsには重要な特徴があることがわかる。それは、 x_1,x_2,\cdotsの順番を取り替えても係数 \frac{b}{a},\frac{c}{a}, \cdotsは変化しない、ということ。
2次の場合 x_1の位置に x_2を置いて x_2の位置に x_1を置いても\frac{b}{a},\frac{c}{a}は変化しない。3次の場合でも、(x_1,x_2,x_3)をどのように置き換えても\frac{b}{a},\frac{c}{a},\frac{d}{a}は変化しない。4次以上の場合でも同様で、一般に方程式の各係数を最高次の係数で割ったものは対称式と呼ばれるものになっていてx_1,x_2,\cdotsを置き換えても変化しない。
この「置き換えても変化しない」という性質はどんな式にでも成り立つわけではない。たとえば x_1^2 + x_2という式はx_1x_2の入れ替えでx_2^2+x_1という別の式に変化する。そして当たり前だけど、x_1x_2という解自体も、解の置き換えて別のものに変化する。つまり、

  • 方程式の係数 \frac{b}{a},\frac{c}{a}, \cdotsは解の置き換えで変化しない「対称性の高い」値だけど、解 x_1,x_2,\cdotsは解の置き換えで変化する「対称性の低い」値である。

そして方程式を解くには「対称性の高い」 \frac{b}{a},\frac{c}{a}, \cdotsを使って「対称性の低い」 x_1,x_2,\cdotsを作らないといけない。しかし、「対称性の高い」式どうしを足したり引いたり掛けたり割ったりしても対称性は高いままである。たとえばf(x_1,x_2)g(x_1,x_2)がどちらもx_1,x_2の入れ替えで変化しない式の場合、fとgを足したものも入れ替えで変化しない。 f(x_2,x_1) + g(x_2,x_1) = f(x_1,x_2) + g(x_1, x_2)。つまり

  • 四則演算は対称性を崩さない。

ここまでの話をまとめると、2次以上の方程式が四則演算だけで解けない理由が判る。

方程式の解を得るためには「対称性の高い」係数を組み合わせて「対称性の低い」x_1,x_2,\cdotsを作らないといけない。でも四則演算だけでは対称性を崩すことができない。
そのため2次以上の方程式では四則演算だけでは解を求めることができない。

2次、3次、4次方程式の解法

前の節のポイントは

  • 係数から解を得るためには、係数の持っている対称性を崩さないといけない。
  • 四則演算は対称性を崩さない。

ということだった。今度は、2次〜4次方程式の解法で、巾乗根を取る操作がどんな役目を持っているのかを見る。なおこれ以降は、方程式の最高次の係数は常に1に取っておくことにする。

2次方程式の場合

2次方程式 x^2 +bx +c=0の解は x = \frac{-b\pm \sqrt{b^2-4c}}{2}と書ける。このうち、ルートが掛かっているb^2-4cの部分を見る。
 \begin{eqnarray}b^2-4c &=& \left(-(x_1+x_2) \right)^2 -4(x_1 x_2) =x_1^2 -2x_1 x_2 +x_2^2 = (x_1 -x_2)^2 \\ \sqrt{b^2-4c} &=&x_1 -x_2 \quad \text{ or } \quad -(x_1-x_2)\end{eqnarray}
平方根を取る前のb^2-4cは係数の四則演算だけで得られたものなので解を置き換えても変化しない。でも平方根を取ったあとの式は、x_1x_2の入れ替えで別の値に変わる式になっている。
つまり平方根を取ることによって対称性の崩れた値が手に入り、それを使って解x_1,x_2を得ている。

3次方程式の場合

3次方程式の解は次のように書ける。ただしA,B,Cは係数の四則演算で書ける値。
 \left\{\begin{eqnarray} x_1 &=& A &+& {}^3\sqrt{B+\sqrt{C}} &+& {}^3\sqrt{B-\sqrt{C}} \\  x_2 &=& A &+& {}^3\sqrt{B+\sqrt{C}} \omega &+& {}^3\sqrt{B-\sqrt{C}} \omega^2 \\ x_3 &=& A &+& {}^3\sqrt{B+\sqrt{C}} \omega^2 &+& {}^3\sqrt{B-\sqrt{C}} \omega \end{eqnarray}\right.
このうちCの部分を調べると、次のようになっている。
 \begin{eqnarray}C &=& \frac{1}{-3}\left( \frac{(x_1-x_2)(x_2-x_3)(x_3-x_1)}{6}\right)^2 \\ \sqrt{C} &=& \frac{(x_1-x_2)(x_2-x_3)(x_3-x_1)}{6\sqrt{-3}}  \end{eqnarray}
Cは対称式なのでx_1,x_2,x_3のどんな置き換えに対しても変化しない。でも\sqrt{C}は例えばx_1x_2の入れ替えやx_2x_3の入れ替えで値が変化する。つまり対称性が崩されている。
しかし、だとすると平方根を使って対称性が崩れたのに、なぜさらに3乗根を取っているのか。
それは、\left(x_1\to x_2,\, x_2 \to x_3, \, x_3 \to x_1 \right)という置き換えを考えるとわかる。この置き換えをしても\sqrt{C}は変化しない。\sqrt{C}はこの置き換えだけでなく、任意の偶置換で変化しない(「偶置換」の説明は略)。そして、係数と\sqrt{C}を四則演算してどんな式を作っても、この置き換えで変化しない式しか作れない(四則演算は対称性を崩さない)。つまり\sqrt{C}を導入しただけでは、まだ充分に対称性を崩せていない。
なので次に、B \pm \sqrt{C}を見る。これは\sqrt{C}と同じく偶置換で変化しない式である。B \pm \sqrt{C} {}^3\sqrt{B \pm \sqrt{C}}を、x_1,x_2,x_3で書いた式に直すと次のようになる。
 \left\{\begin{eqnarray} B+\sqrt{C} &=& \left(\frac{x_1 + x_2 \omega^2 + x_3 \omega}{3}\right)^3 \\ B-\sqrt{C} &=& \left(\frac{x_1 + x_2 \omega + x_3 \omega^2}{3}\right)^3 \end{eqnarray} \right.

 \left\{\begin{eqnarray}   {}^3\sqrt{B+\sqrt{C}} &=& \frac{x_1 + x_2 \omega^2 + x_3 \omega}{3} \\  {}^3\sqrt{B-\sqrt{C}} &=& \frac{x_1 + x_2 \omega + x_3 \omega^2}{3} \end{eqnarray}\right.
この{}^3\sqrt{B \pm \sqrt{C}}は、x_1,x_2,x_3のどんな置き換えに対しても式が変化する(ただし「恒等置換」の場合(=全く置き換えない場合)は除く)。つまり完全に対称性が崩れている。
そして、あとはそこから四則演算によってx_1,x_2,x_3を得ることができる(なお{}^3\sqrt{B-\sqrt{C}}{}^3\sqrt{B+\sqrt{C}}と係数の四則演算で作ることができるので、三乗根を取る操作は一度おこなうだけで良い)。

4次方程式の場合

4次方程式になるとかなり計算が面倒なので、一部だけ。
4次方程式の解は次のように書ける。ただし B,C,Dはある3次方程式の解。
 \left\{ \begin{eqnarray} x_1 &=& A &+& \sqrt{B} &+& \sqrt{C} &+& \sqrt{D}  \\ x_2 &=& A &+& \sqrt{B} &-& \sqrt{C} &-&  \sqrt{D} \\ x_3 &=& A &-& \sqrt{B} &+& \sqrt{C} &-&  \sqrt{D} \\ x_4 &=& A &-& \sqrt{B} &-& \sqrt{C} &+&  \sqrt{D} \end{eqnarray} \right.

B,C,Dを解x_1,x_2,x_3,x_4を使って書くと次のようになる。

 \left\{ \begin{eqnarray} B &=& \left(\frac{x_1+x_2 -x_3 -x_4}{4}\right)^2 \\ C &=& \left(\frac{x_1 - x_2 +x_3 -x_4}{4}\right)^2 \\ D &=& \left(\frac{x_1 - x_2 - x_3 + x_4}{4}\right)^2 \end{eqnarray} \right.
そしてB,C,D平方根を取ったものは、元の式より対称性が下がっている。
 \sqrt{B},\sqrt{C},\sqrt{D}はそれぞれ単独では完全には対称性が崩れきってはいない(例えば\sqrt{B}x_1x_2の入れ替えやx_3x_4の入れ替えで変化しない)。でも\sqrt{B},\sqrt{C},\sqrt{D}のうち2つを取れば完全に対称性が崩れて、x_1,x_2,x_3,x_4を得ることができる。

解の公式に登場するどの項も解の四則演算で表示できる

上で調べた2次〜4次までの解の公式には共通点がある。
巾乗根を取っている項(2次方程式での\sqrt{b^2-4c}とか3次方程式での\sqrt{C}\sqrt{B\pm \sqrt{C}}など)は、解x_1,x_2,\cdotsを使って表示した場合は、解の四則演算のみで表示することができている(ただし1のn乗根は自由に使って良いとする)。
この

  • 解を求めるときに登場する項はどれも解の四則演算で表示できる

という性質は、上で挙げた解の表示に限らず、3次や4次方程式について提案されてきた様々な解法についても成り立つ。このことはラグランジュが発見して、解の置き換えに対する性質をくわしく調べて、それまでに提案された解法に共通する原理を取り出している(1770年)。そしてこれを踏まえて、ルフィニはラグランジュが研究した手法が5次以上の方程式には通用しないことを示した(1799年)。

でもラグランジュの議論は解法の途中に現れる項はどれも解の四則演算で表示できることを前提にしている。この前提は、それまでの解法がどれもそうなっていたというにすぎない。もし解の四則演算で表示できない項が登場すると、解の置き換えの議論が成り立たなくなって、ラグランジュの議論は通用しなくなってしまう。
そして「どの項も解の四則演算で表示できる」場合だけ考えて構わないことを証明したのがアーベル(1824年)で、そのおかげで代数的解法を考える場合は解の四則演算で書ける数しか出てこないとみなして良いことになる。ただしこの性質の証明は面倒なのでここでは扱わない(難解というわけではない)。

(この性質によって、方程式を解くという問題は、現代的にいえば「方程式の係数が作る体K(\frac{b}{a},\frac{c}{a},\cdots)を巾乗根で拡大していって、解が作る体K(x_1,x_2,\cdots)を得る」という問題になる)

5次方程式が代数的に解けないこと

方程式を解く場合、

  1. 方程式の係数の四則演算で得られる数A_1を取り、巾乗根t_1={}^{p_1}\sqrt{A_1}を作る。
  2. 方程式の係数とt_1の四則演算で得られる数A_2を取り、巾乗根t_2={}^{p_2}\sqrt{A_2}を作る。
  3. 方程式の係数とt_1,t_2の四則演算で得られる数A_3を取り、巾乗根t_3={}^{p_3}\sqrt{A_3}を作る。
  4. 以下同様。

という操作を解x_1,x_2,\cdotsが得られるまで繰り返す必要がある。なお、ここで巾乗根の指数p_1,p_2,\cdots素数としてよい(素数以外での巾乗根は、素数の巾乗根を重ねて実現できるので)。
そして今までの話から、この系列のうちのいくつかで対称性を崩していかなければならないことが判る(実際には各ステップで対称性が崩れるのだけど、今までの話ではそこまでは判らない)。
対称性が崩れるステップでは次のようになっている。

  • t_k = {}^{n_k}\sqrt{A_k}は、解の四則演算で表示することができる(これは各ステップで必ず成り立つ)。
  • A_kt_kは対称性が異なる(解の置き換えの中に、A_kは変化させないないけどt_kは変化させるようなものがある)。

したがって解いていく途中でこのようなA_kが取れなくなることを示せば、方程式が代数的に解けないことを示せたことになる(一応注意を書いておくと、逆にこのようなA_kの系列が取れればそれで解が代数的に得られるのかという問題には、今までの話からだけでは答えることはできない)。
では、さっそく方程式を解いていく場面を考える。

第1ステップ

方程式の係数の四則演算だけでは対称性が崩れず解を表示することはできないので、巾乗根を取って対称性を下げる最初のステップがある。そのステップの時に作られる項をt_1={}^{p_1}\sqrt{A_1}と書く。A_1はどのような解の置き換えでも変化せず、t_1は何らかの置き換えで変化する。

(証明には必要のない事実だけど一応の注意: 対称式(どんな置き換えでも変化しない式)は基本対称式の四則演算で書けるという事実を使うと、実際には巾乗根を取る最初の段階で対称性が下がると考えて良いことが判る。巾乗根を取って得た項の対称性が下がっていないなら、その項は対称式なので四則演算だけを使って書ける)。

また、当然A_1 = t_1^{p_1}となる。

どのような置き換えも、互換(二つのものの入れ替え)の積み重ねで実現できるという事実がある(コンピュータでのソーティングを思い浮かべれば判ると思う)。したがって、t_1は何らかの互換で別の値にならないといけない(t_1が全ての互換に対して不変なら、互換をどれだけ積み重ねても不変だから)。そこでt_1を変化させる互換のうち一つx_i \leftrightarrow x_jを取る。この互換を記号でf(t)と書くことにすると、
 \left\{ \begin{eqnarray} f(A_1) &=& A_1 \\ f(t_1) &=& u_1 \qquad (\not= t_1) \end{eqnarray} \right.
となる。また任意のa,bについてf(a b) = f(a)f(b)となることにも注意する(かけてから置き換えても、それぞれ置き換えてからかけても答えは同じ)。

ここでA_1 = t_1^{p_1}の両辺に対して互換fをおこなうと、左辺がf(A_1)=A_1=t_1^{p_1}なので
  t_1^{p_1} = f(t_1^{p_1}) = f(t_1)^{p_1}
となる。f(t_1)\not=t_1なので、1のp_1乗根のうち1以外のいずれかを取って f(t_1) = \xi t_1と書ける。
一方、同じ互換を続けて二回おこなうと元に戻る(恒等置換になる)ので
 t_1 = f(f(t_1))=f(\xi t_1)=\xi f(t_1) = \xi^2 t_1
となる。よってp_1=2 , \xi=-1でないといけないことが判る(つまり、方程式を解く最初のステップは平方根を取らないといけない。上で説明したように2次、3次ではそうなっていた。略したけど4次でもそうなっている)。
以上から互換x_i \leftrightarrow x_jについては t_1 \to - t_1と変化することが判ったけど、A_1=t_1^2なので、t_1はどのような置き換えに対してもt_1のままか-t_1に変化するかどちらかしかない。実はどのような互換に対してもt_1 \to - t_1とならないといけない。これを説明する。
互換x_i \leftrightarrow x_jは、 x_j \leftrightarrow x_kしてx_i \leftrightarrow x_kしてx_j \leftrightarrow x_kする という3つの互換に分解できる。(3つの互換のうち2つが同じものになっているのがポイント。) これら3つの互換を順番に行うと、互換x_i \leftrightarrow x_jをしたのと同じ結果になるので、t_1 \to -t_1となる。入れ換えx_j \leftrightarrow x_kをしたときt_1は変化しないか符号が変わるかのどちらかになる。しかしもしx_j \leftrightarrow x_kで符号が変わるとしても、同じ入れ換えをもう一回行っているので、x_j \leftrightarrow x_kの入れ換えの影響はキャンセルされる。そのため互換x_i \leftrightarrow x_kに対してt_1 \to - t_1とならないといけない。同様の議論で、任意の互換でt_1 \to - t_1となることが判る。(くわしい説明は略す。) よってt_1は奇置換(=奇数回の互換で書ける置換)で符号が反転し、偶置換(=偶数回の互換で書ける置換)では変化しない。
 t_1が偶置換で変化しないということは、3次以上の場合はt_1の追加だけでは対称性がまだ充分には崩せていないということになる(2次の場合は、偶置換は恒等置換だけなので対称性は完全に崩れている)。

第2ステップ

次に対称性を崩すステップで作られる項を t_2 = {}^{p_2}\sqrt{A_2}とする。
第1ステップで作った項 t_1は偶置換で変化しない項だったので、A_2も偶置換で変化しない。一方 t_2はそれよりも対称性を落とさないといけないので、ある偶置換で値が変わらないといけない。
ここで偶置換についての性質を使う。
実は(3次以上の場合)任意の偶置換は3つのものの巡回置換を積み重ねて実現できるという性質がある(「巡回置換」というのは x_i \to x_j \to x_k \to \ldots \to x_m \to x_iのように、いくつかのものを順繰りに置き換えるような置換のこと)。次のようにすれば良い。
x_i \leftrightarrow x_jという互換は、x_1 \leftrightarrow x_iしてx_1 \leftrightarrow x_jしてx_1 \leftrightarrow x_iという3つの互換に直せる。同様にx_k \leftrightarrow x_lという互換は、x_1 \leftrightarrow x_kしてx_1 \leftrightarrow x_lしてx_1 \leftrightarrow x_kという3つの互換に直せる。したがって互換2個は、1と何かの互換6個に書き換えられる。
そして1と何かの互換2つ、つまりx_1 \leftrightarrow x_iしてからx_1 \leftrightarrow x_jするというのは、 x_1 \to x_i \to x_j  \to x_1という1,i,jの巡回置換で書ける。よって互換2個を、3つのものの巡回置換3個に書き換えることができる。

 t_2の話に戻る。
t_2は何らかの偶置換によって変化しないといけない。そして偶置換は3個のものの巡回置換の積み重ねで書けるので、t_2は3個のものの巡回置換のどれかgで変化しないといけない。したがって、
 \left\{ \begin{eqnarray} g(A_2) &=& A_2 \\ g(t_2) &=& u_2 \qquad (\not= t_2) \end{eqnarray} \right.
となる(3つのものの巡回置換は偶置換なので)。また、3つのものの巡回置換gを3回おこなうと恒等置換になるのでg(g(g(t_2)))=t_2となる。
これらの性質について第1ステップの時と同様の議論をすることで、p_2=3 g(t_2) = \eta t_2(ただし\etaは1の3乗根で1以外の何か)でないといけないことが判る。つまり方程式を解く第2ステップでは3乗根を取らないといけないことになる(3次と4次の方程式では実際そうなっている)。
しかし5次以上の場合、ここですでに問題が発生している。

  1. A_2 = t_2^3で、A_2は偶置換で不変なので、t_2は偶置換によってt_2t_2 \omegat_2 \omega^2のどれかになる(\omegaは1の3乗根)。したがってt_2に同じ偶置換を3回続けておこなうと必ずt_2になる。
  2. 5次以上の場合、5個のものの巡回置換が考えられる。5個のものの巡回置換は偶置換である。また、5個のものの巡回置換を5回繰り返すと恒等置換になる。
  3. 1と2より、5個のものの巡回置換をt_2に続けておこなう場合、3回続けても5回続けてもt_2になる。これを満たすのは、t_2が5個の巡回置換で変化しない場合だけ。したがって、t_2は任意の5個のものの巡回置換について不変。
  4. 3つのものの巡回置換 x_i \to x_j \to x_k \to x_iは、5個のものの巡回置換2つ x_i \to x_k \to x_j \to x_l \to x_mして x_k \to x_j \to x_i \to x_m \to x_l \to x_kに分解できるので、 t_2は任意の3つのものの巡回置換に対しても不変になる。しかしそれは、t_2は何らかの偶置換で変化することと矛盾している。

結局、対称性を崩すようにt_2が取れるという第2ステップの最初の部分が間違っていた。したがって、5次以上の方程式では、第1ステップは実行できても、第2ステップで行き詰まって方程式を解くことができない。
歴史的にはこれと同等の議論をルフィニ(1799年)とアーベル(1824年)がおこなって、5次以上の方程式が代数的に解けないことが示された。

補足: ガロア理論についての多少の説明

(この部分は、説明不足かつ非常におおざっぱでいいかげんになる)

ガウスの円周等分方程式論

ラグランジュ、ルフィニ、アーベルの研究により、5次以上の方程式の代数的な解の公式がないことが判った。しかし一般的な公式は存在しなくても、場合によっては代数的に解ける場合がある。
ガウスx^n-1=0の形の方程式は代数的に解けることを示した(1801年『数論研究』で)。
なぜ解けるのか。
例としてx^5-1=0を調べてみる。この式は(x-1)(x^4+x^3+x^2+x+1)=0因数分解できるので初めから解けるのだけど、一般的な4次方程式の場合と比較してみる。
一般的な4次方程式の場合、解(x_1,x_2,x_3,x_4)の置き換え方は全部で24通りある(ただし動かさない置き換え(x_1,x_2,x_3,x_4) \to (x_1,x_2,x_3,x_4)も含めて考える)。
一方x^4+x^3+x^2+x+1=0の場合、様子が異なっている。
\theta = \frac{-1+\sqrt{5}+\sqrt{10+2\sqrt{5}}i}{4}と置く(\theta^5=1)と、解は(x_1,x_2,x_3,x_4)=(\theta,\theta^2,\theta^3,\theta^4)と書ける。この解に対して置き換えを考える場合、x_1=\thetaをどれに置き換えるかを決めると、自動的に他のx_2,x_3,x_4の置き換え方も決まってしまう。したがって可能な置き換え方は次の4通りしかない。

  • (x_1,x_2,x_3,x_4)=(\theta,\theta^2,\theta^3,\theta^4) \to (\theta,\theta^2,\theta^3,\theta^4)=(x_1,x_2,x_3,x_4)
  • (x_1,x_2,x_3,x_4)=(\theta,\theta^2,\theta^3,\theta^4) \to (\theta^2,\theta^4,\theta,\theta^3)=(x_2,x_4,x_1,x_3)
  • (x_1,x_2,x_3,x_4)=(\theta,\theta^2,\theta^3,\theta^4) \to (\theta^3,\theta,\theta^4,\theta^2)=(x_3,x_1,x_4,x_2)
  • (x_1,x_2,x_3,x_4)=(\theta,\theta^2,\theta^3,\theta^4) \to (\theta^4,\theta^3,\theta^2,\theta)=(x_4,x_3,x_2,x_1)

したがって、x^4+x^3+x^2+x+1=0は一般の4次方程式とは対称性が異なっている。x^4+x^3+x^2+x+1=0を解の公式を使って解いてみると、補助として解く3次方程式の解が\frac{5}{16}\frac{-5+ 2\sqrt{5}}{16}\frac{-5- 2\sqrt{5}}{16}となり実質は2次方程式になっているなど、対称性の落ち方が一般の4次方程式と違っている。
nが5より大きい場合のx^n-1=0についても同様に一般のn次方程式とは対称性(可能な解の置き換え方)が異なっていて、その対称性の性質に基づいて解を求めることができる。つまり、

  • 方程式によっては、対称性(解の可能な置き換え方)が一般の方程式とは違う場合がある。その結果、5次以上でも方程式が解ける場合がある。
いつ方程式が解けるか

5次以上の方程式が解けないことを示すとき

  • これこれの数から四則演算で作れる数は、これこれの置き換えで変化しないような数だけである。

という論法を使った。そこでは

  • 「これこれの数から四則演算で作れる数」⊆「これこれの置き換えで変化しない数」

が問題だった。
方程式が解けることを考える場合は「これこれの対称性を持っている数しか作れない」だけでなく「これこれの対称性を持っている数はどれでも作れるのか」が問題になる。つまり「四則演算で書ける数」と「対称性」の間にどんな関係があるのかが問題になる。

この問題に正確に答えるのがガロア理論になる。

「解の置き換え」の群

ここまで「対称性が高い」という言葉を、「よりたくさんの置き換えで変化しないこと」を指して使ってきた。そして「置き換え」の集合の包括関係によって対称性の高い低いを述べてきた。でも

  • 何もしない置き換え(恒等置換)では、どんな数も必ず不変になる。また、ある置き換えで不変になるならば、逆の置き換えでも不変になる。
  • 不変になる置き換えが二つあったとき、それらの置き換えを続けておこなってもやはり不変である。
  • 「集合Sに含まれるどの数も変化させないような置き換え、からなる集合」は必ず群になる。

といった性質を考慮すると、置き換えの任意の集合を考えるのではなく、群となるものだけを考えるのが良い(群の説明は略)。
そして先に説明したように、方程式によっては全ての解の置き換えが意味を持つわけではなくなる。例えば x^2-6x+8=(x-4)(x-2)=0の解はx_1=4,x_2=2だけど、x_1x_2を入れ替える置き換えは取り除く必要がある(x_1=4=2\cdot 2=x_2\cdot x_2なので、置き換えた時の整合性が取れなくなる。有理数が変化してしまうような置き換えは整合性が取れない)。これは x^2-6x+8=0が四則演算だけで解ける理由でもある。はじめから対称性が下がっているため、巾乗根で対称性を下げる必要がない。
あるいは一般の17次方程式では解の置き換え方は17!=355687428096000通り存在するけど、方程式x^{17}-1=0では整合的な置き換え方は16通りしか存在しない(この方程式では平方根だけを使って置き換えの群の大きさを16→8→4→2→1と減らすことができるのだが、これは定規とコンパスだけで17角形を作図できることに関係している)。

ここまでの説明で、

  • 四則演算では対称性は崩れない。
  • (巾乗根によって)数を追加して四則演算で書ける数を増やす。

といった話が何度も出てきた。このことは、四則演算で閉じた集合、つまり「体」を考えるのが良いことを示している。体を考えることが重要なのは

  • 「置き換え」の群を取り、その群の「置き換え」に対しても変化しないような数を集めたものは、体になる。

という性質からも判る。

体と群の対応

体と群の性質を見ると、

  • 体を取ったとき、その体のどの要素も変化させないような「置き換え」の集合(その体の持っている対称性)は、群になる。
  • 群を取ったとき、その群のどの要素でも変化しないような数の集合(その群が示す対称性を満たしている数の集合)は、体になる。

が成り立っているので、体から群、群から体への対応関係を考えることができる。でも、これは体と群が1対1で対応しているということではない。一致している場合は、「対称性を下げること」と「四則演算で作ることができる数が増える」もちょうど対応する。そして、

ガロア拡大になっている場合、部分体と部分群がちょうど1対1に対応する。

というのが、ガロア理論の主定理になる(非常におおざっぱだけど)。「ガロア拡大である」というのは、ここでは「係数の四則演算で書ける数 = どの置き換えでも変化しない数」になること(開始時の手持ちの体と対称性の最も高い数を集めた体が一致していること)だと思えばよい。
ガロア拡大になるように置き換えの集合を選べれば、あとは、どんな部分群が存在するのか(=どのように対称性を崩していけるのか)という観点から方程式が解けるかどうかを論じることができることになる。