Matrix は、もともとラテン語でまたは「母体」や「子宮」を意味する言葉です。
それが、数学では「行列」として使われています。
語根は mater、つまり「母」で、この言葉を数学に持ち込んだのは、イギリスの数学者ジェームズ・ジョセフ・シルベスターで、1850 年のことでした1。
どのような意味で「母体」なのか、というと、シルベスターはこう説明しています。
I have in previous papers defined a “Matrix” as a rectangular array of terms, out of which different systems of determinants may be engendered, as from the womb of a common parent.
J. J. Sylvester, “Additions to the Articles, ‘On a New Class of Theorems,’ and ‘On Pascal’s Theorem'” (1850/1851)
(これまでの論文で、項を長方形に配列したものを「マトリックス(Matrix)」と定義したのは、共通の母親の胎内から生まれるように、さまざまなデテルミナント(determinants)の組がそこから生み出されるからです)
Matrixとは、「行列式を生み出す母体」というイメージです。
1. 連立方程式の determinant
「determinant」は「行列式」と訳され、「行列から生み出される式」という意味構造になっています。
まるで、行列が主で、行列式が従属物のようです。
しかし、その時の数学者にとっては逆で、先に重要な関心事としてあったのは「determinant」の方で、行列は最初それを生み出す源泉として見出されたわけです。
1.1. 境界を決定する式 determinant
「determinant」の概念は、matrix という言葉より170年以上前に登場しています。
「determinant」は、ラテン語の determinare、「境界を定める」から来ています。
語根の terminus は「境界石」や「限界」を意味します。
いわば「決定式」というような意味合いで、「判別式(discriminant)」に語感が似ています。
それもそのはず、この2つの言葉は、歴史の途中ですり替わったり、重なったりしているからです。
「determinant」が数学で登場するのは、1801年のガウスによります2。
ただし、ガウスの言う「determinant」は、今日での対象とは意味が異なります。
ガウスの対象は二次形式 の性質を決める値 でした。
正の定値か不定値かを「決定する」値、という文脈で、今日の言葉では「二次形式の判別式(discriminant of a quadratic form)」に相当します。
その後、コーシーが1812年に “determinant” を連立方程式の係数から作る値 $ad-bc$ の意味で使い、ヤコビ(1827年以降)の研究でそっちの用法の方が定着しました。
1.2. 連立方程式のdeterminant
連立方程式を解くときに、$ad-bc$ という式は、以前から注目されていました。
1683年、日本の数学者関孝和が連立方程式を解く過程で、行列式に相当する量を発見しています3。
その同じころ、1693年、ライプニッツも同じ概念に到達しています4。
そのきっかけは、複数の変数を持つ連立方程式から変数を一つずつ消去して解く手法をまとめることです(消去理論)。
この連立方程式を解いていると、変数を消去できず式ごと消えてしまい、計算が破綻することがあります。
たとえば、x y の連立方程式を考えます。
この解 x y は、式を変形して以下のように求められます5。
この分母に出てくる式 $ad – bc$ が 0 かどうかは、この式の分母が存在するかどうかと直結しています。
のとき、2 つの方程式は一次独立していて解が一意に定まります。
なら、2 つの方程式は本質的に同じため、解が絞れません。
この式のことをコーシーやヤコビは、「determinant」と呼びました。
シルベスターが matrix と名付けた1850年の時点で、determinantは170年も先行した概念だったわけです。
そして、シルベスターは、1851年、空白になった二次形式の重根の判定値に、”discriminant(判別式)” という新しい名前も与えています。
1.3. discreminantとdeterminant
「二次形式のdiscreminant」と「連立方程式のdeterminant」は、いずれも「この式(または方程式系)が『つぶれているかどうか』を決める値」という点で共通しています。
二次形式 は
discriminant なら、
曲面として独立した形を保っています。
ゼロのときに二次元の曲面が一次元の直線に潰れます(退化)。
連立方程式 と は、
determinant なら、
2つの方程式が独立して交点が定まります(可解性)。
ゼロのときは、独立していないので2次元の解空間が1次元に潰れます。
両者に共通する構造は、「次元が潰れているかどうかの境界を示す値」ということです。
ガウスが、二次形式に使った “determinant” という言葉を、後の数学者が連立方程式に転用したのは、この構造的な類似があったからだと考えられます。
さらに、現代的な視点では、discreminantは、determinantの特殊ケースとして計算できます。
- 二次形式はその係数行列の行列式がゼロかどうかで退化を判定でき、
- 連立方程式も係数行列の行列式がゼロかどうかで可解性を判定します。
つまり、両者はどちらも係数行列の「行列式(determinant)」という同じ道具に収束します。
1.4. matrixは計算ツール
determinantは、連立方程式係数だけを取り出した表を考えると、かんたんに計算できます。
表の項を交差してかけて、差を求めればよいのです。
この $ad – bc$ が、2×2 の determinant です。
この段階での行列(Matrix)は係数の表で、determinantを計算するための道具に過ぎませんでした。
これが、連立方程式の determinant を生み出す母体、matrixの由来なのです。
matrix と determinant は、対になっています。
ただし、順序は逆で、determinant が先にあり、それを産む母体として matrix と名付けられました。
シルベスターの関心は配列そのものではなく、そこから取り出せる行列式にありました。
1.5. determinant の3つの顔
determinant が でない、という状況は、見る角度によって異なる顔を持っています。
連立方程式の消去計算では「式がちゃんと消せて変数を消去できる」条件でした(解が求まる)。
式の係数として見れば「それぞれの条件が独立して重なっていない」(一次独立)、
変換として見れば「次元を潰すような変換ではなく逆にたどることができる」(可逆)。
三つとも同じ事実の異なる読み方で、これが線形代数の基本定理になっています6。
2. matrixの体系化
連立方程式の determinantが先に注目されたのに対し、シルベスターはその「母体」である係数の表に matrix と名前をつけました。
この matrix を独立した数学的対象として体系化したのは、その友人アーサー・ケイリー(Arthur Cayley, 1821–1895)でした7。
2.1. 変換の合成としての行列積
ケイリーは 1858 年の論文 “A Memoir on the Theory of Matrices” で、matrixの代数を定式化しました8。
matrixの代数を考えるきっかけは、変換を施しても変わらない量(不変量)の研究でした。
たとえば、円 を回転させても、やはり円のままです。
つまり、 という量は、回転という変換に対して「不変」です。
ケイリーが研究していたのは「ある変換について変わらない量はどう作れるか」という問いです。
「ある変換をして、さらに別の変換をしても不変か」というケースを確かめるのに、二つの変換を合成した変換を扱う必要が出てきました。
そこで、ケイリーはこう考えました。
変換 を「 を $(ax+by, cx+dy)$ に写す」、
変換 を「 を $(ex+fy, gx+hy)$ に写す」とします。
このとき、 を適用してから を適用した合成変換 は何になるか、を計算したのです。
これを計算すると、
整理すると $(ea+fc)x + (eb+fd)y$ という形が出てきます。
ケイリーはこの合成変換の係数を、 の係数表と の係数表の「合成(compounding)」と呼んでいました9。
matrix S と T を合成して、合成変換の係数を求めているわけです。
行列の掛け算の複雑なルールは、この変換を二回続けた結果の係数を書き下したところから導かれています。
ケイリー自身は「determinantの理論よりも、matrixの理論の方が研究するべきことが多い」とも書いていて、行列の「合成 = 積」を端緒にその代数的構造を研究しました10。
ケイリーの体系化によって、「行列(matrix)」が主、「行列式(determinant)」が従になったと言えます。
ケイリー以降、関心の重心は判定から変換の操作へ移りました。
ここからは、通常の訳語である「行列」「行列式」で説明します。
3. 行列積は可換でない
行列積は、順序を逆にできません。
つまり、 になる(可換でない)ことも、変換の合成から来ています。
ケイリーは、行列を座標変換の係数の表に対応させて使いました。
座標変換では、「 してから する」と「 してから する」は一般に異なります。
たとえば、 を「 軸方向に2倍拡大」、 を「90度回転」とすると、この変換では順序を変えると結果が変わります11。
たとえば、x座標にある数は先に90度回転すると、もうx軸方向には拡大されません。
してから (先に拡大、後で回転)
してから (先に回転、後で拡大)
結果は と です。
3.1. 連立方程式が変換として読める(逆行列)
係数の表 を一つの代数的な操作対象として見ると、連立方程式は一つの式で書けるようになります。
と書けます。
は未知数ベクトル、 は右辺のベクトルです。
「 という変換が を に写している」と読めます。
つまり、解くとは、その変換を逆にたどることに置き換えることができます。
それで使えるのが「逆行列」です。
「逆行列」は、行列の積の逆として求められます。
逆行列 が存在する条件は、 、つまり行列式が 0 でないことです。
変換が情報を失わずに可逆かどうかを決めるのが行列式であり、その意味で determinant は変換の中心にあり続けています。
多くの場面では が当たり前の前提として背景に退き、例外として になったときだけ「特異行列だ」と意識されます。
3.2. 次元が落ちる座標変換
座標変換として見たときには、行列式の意味は平面をどれだけ拡大・縮小するかの比率になっています。
単位正方形の4頂点に を掛けると、 は へ、 は へ移ります。
この2本のベクトルが張る平行四辺形の面積が $|ad-bc|$ です12。
行列式 = 0 とは、座標変換後の面積が 0 のことで、2本のベクトルの貼る平行四辺形は潰れてしまいます。
変換が潰れるというのは、さまざまなベクトルが同じベクトルになることで、逆にたどれなくなります。
係数表の時代に「解の公式の分母」として発見された値が、変換として見直すことで「変換後の面積の拡大率」という別の顔を持ちます。
連立方程式の「解けない」と変換の「次元が落ちる」は、同じ事実の二つの言い方です。
3.3. 変換するベクトルの広がり
行列は、連立方程式の係数の表として使ったり、変換式の係数の表として使われましたが、体系的な演算ができるようになると、もっと幅広く使えるようになります。
このような代数的な抽象化は、ベクトルと合わせて考えるとわかりやすいです。
もともと、ベクトルは「大きさと向きを持つ矢印」で、位置や変位を表すものでした。
しかし、それだけでなく「足し算とスカラー倍ができるものならベクトル」として使うように広がります13。
たとえば、色も、音声の周波数成分も、LLM内の単語の意味表現も、すべてベクトルとして扱われています14。
これが「抽象化」です。
計算ができるなら、なんでも同じように扱うことができます。
行列は、「行列はベクトルを別のベクトルへ写す変換である」です。
この変換できる対象が、連立方程式の係数列だけでなく、位置・状態・色・意味、など広がりました。
足し算とスカラー倍ができるあらゆる量を扱うことができるのです。
ちなみに、ベクトルの合成は「和」で、行列の合成は「積」です。
ベクトルの和 は移動を続けて適用した結果で、順序を変えても結果は同じです。
行列の積 は変換を続けて適用した結果で、順序を変えると一般に結果が変わります。
移動の合成は可換で、変換の合成は非可換。
合成という操作の性質の違いが、そのまま演算の性質の違いになっています。
4. 「行列」と「行列式」
| 行列式中心の見方 | 行列中心の見方 | |
|---|---|---|
| 主役 | 行列 そのもの | |
| 係数の表の役割 | 行列式を作る材料 | 変換・関係を保持する構造 |
| 積の意味 | 定義されない | 変換の合成 |
| 「解ける」の意味 | を確認する | が存在する |
| 解の出し方 | クラメルの公式で を使う | を計算する |
| の意味 | 解が一意に定まらない | 次元が潰れて情報が失われる、不可逆 |
| ベクトルとの関係 | なし | 行列がベクトルを別のベクトルへ写す |
行列式中心の時代には「解けるかどうかを決める値」でしたが、
行列中心の時代になると「変換が可逆かどうかを決める値」に拡張されました。
係数表として見ていた時代には連立方程式の係数列を主な対象としていましたが、変換として抽象化されることで、ベクトルを幅広く対象にできるようになりました。
ただ、問いの立て方が変わっただけで、 が「境界」である、という意味は一貫しています。
4.1. 年表:行列と行列式をめぐる発見の流れ
| 年 | 発見・発表 |
|---|---|
| 紀元前200年頃 | 係数を表に並べて行を操作することで連立方程式を解く手法が記録される。中国の数学書『九章算術』。現代のガウス消去法とほぼ同じ発想。 |
| 1683年 | 消去計算が破綻する境界条件として、行列式に相当する量が現れる。関孝和『解伏題之法』。 |
| 1693年 | 行列式に相当する量がヨーロッパで独立に記述される。ライプニッツによるロピタルへの書簡。 |
| 1710年頃 | 行列式の正しい一般式が与えられる。関孝和・建部賢弘ら『大成算経』。 |
| 1750年 | 行列式が連立方程式の解の公式の分母として直接現れる、クラメルの公式が発表される。クラメル著 Introduction à l’analyse des lignes courbes algébriques。 |
| 1801年 | 二次形式の研究で $b^2 – ac$ が “determinant” と命名される。ガウス著『算術研究』(Disquisitiones Arithmeticae)。 |
| 1811年 | 小惑星の軌道計算のために係数表を行操作で変形する手法が体系的に記述される。ガウスによる最小二乗法の計算。現在のガウス消去法の原型。 |
| 1850年 | 係数の長方形配列が “matrix” と命名される。シルベスターによる論文。行列式を産み出す母体として定義。 |
| 1855年 | 行列の積が “compounding”(合成)と定義され、逆行列の概念が概略的に導入される。ケイリーによるフランス語論文。 |
| 1858年 | 行列の加法・乗法・逆行列・べき乗が体系的に定義される。積が非可換であることが示される。ケイリー論文 “A Memoir on the Theory of Matrices”。 |
| 1888年 | 「足し算とスカラー倍ができるもの」としてベクトル空間が公理的に定義される。ペアノ著 Calcolo Geometrico。当初はほぼ注目されず。 |
| 1918年 | ペアノのベクトル空間の定義がワイルによって参照・使用され、広く認知される。 |
| 2013年 | 単語の意味がベクトルとして扱われ、「王 − 男 + 女 ≈ 女王」という演算が成り立つことが示される。Mikolov ら Word2Vec 論文。 |
- シルベスター(James Joseph Sylvester, 1814–1897)が matrix という言葉を使ったのは、1850年に Philosophical Magazine 誌に掲載された論文 “Additions to the articles ‘On a New Class of Theorems’ and ‘On Pascal’s Theorem'” が初出とされる。その後も多くの数学用語を造語しており、discriminant、Jacobian、minor、nullity なども彼の命名による。 – Cayley, Sylvester, and Early Matrix Theory – Nicholas J. Higham (2008)
- ガウスは1801年の著作『算術研究』(Disquisitiones Arithmeticae)の中で二次形式 を研究するなかで を “determinant” と呼んだ。これが近代的な意味での determinant という語の初出とされる。 – Disquisitiones Arithmeticae – Sophia Rare Books 解説
- 関孝和の行列式に関する研究は著作『解伏題之法』(1683年)に記録されている。消去理論(resultants)に基づく研究で、5×5 の行列式の公式を試みたが初稿には誤りがあり、後に建部賢弘らとの共著『大成算経』(1683–1710年)で正しい一般式(ラプラス展開に相当)が与えられた。 – Seki Takakazu – Wikipedia
- ライプニッツは1693年にロピタル(Guillaume de l’Hôpital)への書簡の中で行列式に相当する量を記述した。ただし記号的なインデックスを導入していたが当時はほとんど注目されなかった。 – Cramer’s Rule Is Due to Cramer – A. A. Kosinski (2001)
- この式には、クラメルの公式という名前がついています。クラメルの公式は、スイスの数学者ガブリエル・クラメル(Gabriel Cramer, 1704–1752)が1750年の著作 Introduction à l’analyse des lignes courbes algébriques(代数曲線の解析への入門)の付録で発表した。同様の結果はスコットランドの数学者マクローリン(Colin Maclaurin)が1729年頃から知っていたとされるが、クラメルの発表が広く参照された。 – Gabriel Cramer – Wikipedia
- この三つの同値性は線形代数の基本定理(fundamental theorem of linear algebra)の一部をなす。 行列 に対して「」「 が正則(可逆)」「 の解が のみ」「 の列ベクトルが線形独立」はすべて同値な条件である。
- シルベスターとケイリーは1847年頃に出会い、生涯にわたる共同研究者となった。二人は論文を共著することはなかったが(当時の慣例として論文は単著が一般的だった)、互いの研究から多大な影響を受けた。 – Cayley, Sylvester, and Early Matrix Theory – Nicholas J. Higham (2008)
- この論文は Philosophical Transactions of the Royal Society of London の第148巻(1858年)17–37頁に掲載された。行列代数を体系的に論じた最初の論文とされ、単位行列・行列の加法・乗法・逆行列・行列のべき乗を定義している。 – A Memoir on the Theory of Matrices – Royal Society
- MacTutor History of Mathematics のケイリー伝記によると、1855年の論文でケイリーは行列の積を “compounding” と呼び、逆行列の概念も概略的に導入している。1858年の論文でこれらを体系化した。 – Arthur Cayley – MacTutor History of Mathematics
- この発言は A Brief History of Linear Algebra and Matrix Theory(Marie Vitulli著)に引用されている。原文は “There would be many things to say about this theory of matrices which should, it seems to me, precede the theory of determinants.” – A Brief History of Linear Algebra and Matrix Theory
- 具体例として、 を「 軸方向に2倍に拡大する変換」、 を「90度回転する変換」とすると、(先に拡大してから回転)と (先に回転してから拡大)は一般に異なる変換になる。これは行列積が非可換(non-commutative)であることの典型的な直観的説明である。
- 正確には、$ad – bc$ は符号付き面積(signed area)である。変換が向きを保つ場合は正、向きを反転する場合(鏡映を含む場合)は負になる。面積の大きさは絶対値 $|ad – bc|$ で与えられる。3次元の場合は体積の拡大率が になる。
- ベクトル空間の現代的な公理的定義を最初に与えたのはイタリアの数学者ジュゼッペ・ペアノ(Giuseppe Peano)で、1888年の著作 Calcolo Geometrico の中で「線形系」(linear systems)という名称で定義した。この定義は当初ほとんど注目されなかったが、1918年にヘルマン・ワイルが参照してから広く認知された。 – Vector space – Wikipedia
- Word2Vec は Mikolov ら(Google)が2013年に発表した単語埋め込み手法で、論文 “Efficient Estimation of Word Representations in Vector Space”(Mikolov et al., 2013)で公開された。「王 − 男 + 女 ≈ 女王」という演算が成り立つことが示され、ベクトル空間内で意味的関係が線形構造として現れることが広く知られるようになった。 – Linguistic Regularities in Continuous Space Word Representations – Mikolov et al. (2013)