![]()
在人工智能與大數據飛速發展的今天,線性代數已成為理工科領域的“重器”。繼上一篇關于矩陣秩的探討之后,本文將視線轉向了矩陣理論中應用極為廣泛的另一核心領域——特征值問題。
撰文 | 朱慧堅(廣州南方學院數學與統計學院副教授)、丁玖(廣州南方學院數學與統計學院教授)
在此前文章中,我們已經討論了矩陣乘法、矩陣求逆、求廣義逆及其在最小二乘問題中的應用。在這篇文章里,我們繼續談論矩陣,不過將重心從算子意義下的逆運算轉移到特征值問題。矩陣的特征值問題不僅用途極其廣泛,而且其思想的光芒也在其他數學學科內到處閃現,無論是同樣有具體內容的常微分方程論,還是比矩陣概念更加抽象的泛函分析,都能看到它的身影。特征值問題對矩陣形狀只有一個限制條件:它必須是個方陣,即行數
![]()
如果將和都寫成列向量的形式,上面從到的對應關系即為 = 。
從現在起我們只考慮方陣,即假設為一個行列矩陣,或言之,是一個階方陣(也稱階矩陣)。如此, = 和都屬于同一個空間^,這樣我們就可以對它們進行比較。而在任何學科的特征值問題中,這種比較是通過相等關系來刻畫的。通常規定,兩個向量相等是指它們的分量個數(也叫做它們的維數)相等,且對應的分量都相等。
復數域上的特征值
現在定義矩陣特征值問題:對于給定的階方陣,如果存在數和非零向量 ∈ ^,使得等式
=λ
成立,則稱為的一個特征值,為的對應于特征值的一個特征向量。請讀者注意,特征值可以是0,也可以不是0,然而特征向量絕不能是零向量。道理很簡單,因為當 = 0時,等式兩端恒等于零向量,所有的數都滿足特征值方程,就沒有“特征”可言了。因此,為了避免這種平凡的情況,滿足特征值問題等式的那個向量不應該是零向量。
但是這里的定義好像隱藏了一個問題。上面的敘述繼承了我們之前文章中的一個約定做法,只假定矩陣的所有元素都是實數,因而它定義了線性算子: ^ → ^,也就是說對所有的向量, ∈ ^及所有的實數和,都有
( + ) = + 。
現在問題來了,既然矩陣和向量都是定義在實數域上,似乎很自然地希望特征值也應該屬于同一個實數域。讀者可能要問,在這個看似合理的要求下,矩陣是否總存在至少一個特征值。我們先來看一個直觀易懂的例子。
設想我們把 ?平面上的每個向量都圍繞坐標原點按逆時針方向旋轉90度。這是將^2映到^2上的一個線性算子。因為每個非零向量都旋轉了一個直角,故它們當中不可能有向量旋轉成同一方向或相反方向的向量,所以這個實域上的旋轉算子不存在實特征值,在幾何上看是顯而易見的。若用代數的方法解釋這個現象,不用高中平面解析幾何的坐標旋轉公式,而用我們一直提倡的算子思想,很容易寫出該旋轉所對應的2階方陣:這個90度的旋轉將向量(1, 0)旋轉到向量(0, 1),而把向量(0, 1) 旋轉到向量(?1, 0)。因而這個旋轉算子由矩陣
![]()
表示。我們來檢查是否存在實數和非零實向量(, )使得
![]()
上述方程等價于聯立線性方程組? = λ和 = 。由此得 = ?^2。若 ≠ 0,則^2 + 1 = 0,它在實數范圍內沒有解。若 = 0,因(, ) ≠ (0, 0),則 ≠0。同樣的代換邏輯用在上( = ?^2),也導出^2 + 1 = 0。所以上述旋轉矩陣在實數域內不存在特征值,自然也沒有對應的特征向量了。
即便是從前沒有學過矩陣理論的讀者,也可能已經想象出了走出困境的方法:在復數范圍里求解特征值問題,理由是 1806 年被業余數學家阿爾岡(Jean-Robert Argand,1768 -1822)首次無漏洞證明的代數基本定理“非常數單變量多項式至少有一個復數根”。(在這之前多位著名數學家如歐拉和拉格朗日都給出了漏洞不一的“證明”,其中“數學王子”高斯(Carl Friedrich Gauss,1777 -1855)于 22歲時放進其博士論文的證明漏洞最小,但其中的“拓撲漏洞”要等到 121 年后才被一位 27 歲的俄羅斯數學家奧斯特羅夫斯基(Alexander Markowich Ostrowski,1893 -1986)完全填補,從中可見復數的神秘、深奧和魅力。)
所以,從現在開始,我們在復數域上研究矩陣特征值問題。令為一個階復方陣,即的每個元素都是復數。自然每一個實矩陣也是復矩陣。將維歐幾里得空間^中的實向量的每個
![]()
給定的階復矩陣定義了線性算子: ^ → ^。如果存在一個復數和非零復向量使得 = z,則稱為的一個特征值,而為的與特征值相關的一個特征向量。
回到剛才考慮過的90度旋轉矩陣,它被視為把2維酉空間^2映到自身的復域上的一個線性算子。與之前只考慮實數域情形不一樣的是,此時,特征值方程^2 + 1 = 0在復數域中有兩個根和?,因此這個被看成復方陣的2階實方陣有且僅有兩個特征值。此外,這兩個虛數特征值還彼此共軛。通過求解對應于的線性方程組? =i及 = 和對應于?的線性方程組? =?及 =?,我們獲得與特征值相關的一個復特征向量(1, ?)及與特征值?相關的一個復特征向量(1, )。仔細觀察后,又一個現象出現了:對應于相異特征值的特征向量(1, ?)和(1, )彼此正交。我們將在下一篇文章中解釋為什么。
再一次檢視上段兩組關于2維特征向量兩分量和的方程,容易發現,它們都是齊次線性方程組,即如果將它們分別改寫成“標準形式”,就是
+ = 0, ? = 0; ? = 0, + = 0。
![]()
都滿足該方程組。由此推出,雖然只有兩個特征值,但每個特征值都率領了由無限多個士兵組成的特征向量隊伍。這說明,對應于同一個特征值的所有特征向量全體,再插進零向量,這個集合將構成一個向量空間。因為如此構造的向量空間是^2的子集,它被叫做^2的子空間。
特征多項式與凱萊-哈密爾頓定理
熟悉了上面這個簡單例子,我們就可以討論一般矩陣特征值問題的基本性質。設 = ()為一階復矩陣。根據特征值問題的定義。復數是方陣的一個特征值意味著關于未知復向量的方程 = 有非零解。將這個方程改寫成與之等價的齊次方程形式
(?)=0,
其中是階的單位矩陣,運用以前學過的矩陣是否可求逆的語言(參見我們的《返樸》文章《從反函數的觀點看逆矩陣》),我們便可得知,是的特征值當且僅當矩陣 ? 是無逆可求的(因為由特征值的定義,是的特征值等價于性質“算子 ? 不是單射”,因而它的逆矩陣不存在)。而矩陣無逆的一個簡單判別準則就是它的行列式等于零。方陣的行列式一般簡潔地寫成||或 det,其中的det 是英文單詞determinant(行列式)的前三個字母。這樣一 來,我們獲得是的特征值的一個充分必要條件:
定理 1.復數是方陣的特征值當且僅當| ? |= 0。
那么,若是階的,會有多少個滿足定理 1 中的等式呢?要回答這個問題,我們用取代,將上面定理中的等式變成含有未知數的方程
|?|=0。(1)
根據定理 1,方程(1)的所有解給出的所有特征值。那么到底有幾個解呢?前面我們對平面上的一個2階旋轉實矩陣證實了它有兩個特征值,我們再考察一般的3階復矩陣(注意其(3, 3)元素不是虛數單位)
![]()
它所對應的特征值方程是
![]()
假定大家知道怎樣計算三階行列式,那么上述方程的左端展開后變成
![]()
其中 Tr() = + + 是的主對角線元素之和,稱為的跡。因為這個三次多項式頂多有三個相異的復數根,故頂多有三個不同的特征值。如果記入重根的重數,恰好有三個特征值。每個特征值作為多項式| ? |之根的重數(或| ? |在復數域上的因式分解中相應線性因子的冪指數)稱為該特征值的代數重數。
上面對三階矩陣的結論可以直接推廣到階矩陣。此時,由行列式的經典定義或等價的按行或按列拉普拉斯展開計算公式,易見行列式| ? |展開后是變量的階復系數多項式,故根據代數基本定理,多項式方程| ? | = 0至多有個相異復數根,它們就是的所有相
![]()
凱萊-哈密爾頓定理:設方陣的特征多項式| ? |為(),則() = 0。
這個定理是深入研究矩陣特征值問題的基礎,或許可以稱它為“矩陣特征值問題基本定理”。凱萊(Arthur Carley,1821-1895)開創了矩陣時代,而愛爾蘭數學家哈密爾頓(William Rowan Hamilton,1805 -1865)則是四元數之 父。
美國數學普及家貝爾(Eric Temple Bell,1883-1960)在巨著Men of Mathematics(《大數學家》)中描繪了哈密爾頓的晚景:
“哈密爾頓于 1865年 9月 2日因痛風去世,享年 61歲。去世后,人們發現他留下了大量雜亂無章的手稿,以及大約 60本厚重的數學手稿。目前,他的著作正在編纂成冊。從他手稿的狀況可以看出,他生命最后三分之一的時間里,家庭生活十分艱辛:無數盛著干癟肉排殘渣的餐盤被埋在堆積如山的紙張中,還有足夠一家人使用的餐具從雜亂的紙張中被翻了出來。”
2008年,楊振寧先生提到他少年時所讀到的這個凄慘故事,表示他絕不能像哈密爾頓那樣在太太離世后過“相當漫長的孤獨生活”。這樣的堅定信念給他帶來了堪稱幸福的二十年晚年生活。
幾何重數與代數重數的關系
現在我們轉向探索,當方陣的一個特征值已知后,怎樣求出它所對應的全部特征向量。根據特征向量的定義,所有滿足齊次線性方程組
(?)=0
的非零向量 ∈ ^組成了矩陣與特征值相關的特征向量全體。根據線性方程組的解理論,這個集合和零向量單點集{0}的并集是^的一個子空間,稱為對應于特征值的特征子空間。試問,這個向量空間到底有多大呢?或者更精確地說,它的維數等于幾?
讓我們回憶與矩陣相伴的幾個重要概念。設為一行列復矩陣,它的個列向量所張成的^的子空間稱為的值空間或列空間,記為();它的個行向量所張成的^的子空間稱為的行空間。我們在《返樸》最近推出的文章《為什么矩陣的行秩等于列秩?》中已經證明:矩陣的值空間()的維數等于的行空間的維數,這個共同的非負整數稱為的秩。在一般的線性代數教科書中,的秩被等價地定義為的非零子行列式(也叫的子式)的最大階數。作為線性算子,矩陣的定義域^中被映射到^中零向量的那些向量的全體是的一個子空間,稱為的零空間,記作()。在前述的文章中我們已經證明:的零空間的維數加上的值空間的維數等于的列數。
零空間的概念馬上讓我們知曉,與方陣的特征值相關的特征子空間恰恰就是奇異矩陣I ? A的零空間。我們把(I ? A)的維數稱為特征值的幾何重數。這樣,的任何特征值既有代數重數,也有幾何重數,前者來自特征多項式的因式分解,顯示出特征值的代數特色,后者來自特征子空間的尺寸,量化了特征向量群體的幾何維度。那么,它們之間是否具有永恒的大小關系?
是的,同一個特征值的幾何重數總是向上“仰視”代數重數的,即它小于或等于代數重數。下面是一個滿足“小于”關系的簡單例子。令
![]()
注意它是非對稱的實矩陣,其特征多項式為
![]()
故僅有一個相異特征值0,其代數重數為2。為了得到0的幾何重數,我們求解方程對應于特征值0的特征向量方程組(0 ? ) = 0,所得到的特征子空間(0 ? )是^2的一維子空間{(, 0): ∈ }。故特征值0的幾何重數等于1,它確實小于代數重數2。
![]()
![]()
![]()
由于上述結論在矩陣理論中的重要性,我們把它寫成定理的形式:
定理 2.設是一個方陣的特征值,則它的代數重數大于或等于它的幾何重數。
當矩陣的特征值具有相等的代數重數和幾何重數時,我們稱這個特征值是半單的,特別地,如果代數重數等于1(此時幾何重數也必定等于1,因為特征子空間至少是一維的向量空間),則說此特征值是單的。我們在文章的后面部分將給出半單特征值在“簡化”矩陣結構的行動中所起的關鍵作用。
矩陣可對角化的充要條件
我們繼續討論特征值的基本性質。首先我們證明,對應于給定方陣不同特征值的特征向量
![]()
![]()
![]()
與是“相似”的,有時如同中學平面幾何教科書上表示兩個三角形相似的符號那樣寫成 ~ 。定理4表明,所有其特征值均為半單的矩陣相似于一個對角矩陣,它的對角元素由這些特征值按各自的重數一一排列。一個特殊的情形是,階矩陣有個相異的特征值,這時一定相似于某個對角矩陣。
如果一個矩陣與一個對角矩陣相似,我們則說它是“可對角化”的。上面的定理4提供了可對角化矩陣的一個充分條件。反過來,只要給定的矩陣相似于一個對角矩陣,則它的所有
![]()
特征值都是半單的。到此,我們論證出了如下的“等價性定理”:
定理 5.一個方陣可對角化當且僅當它的所有相異特征值都是半單的。
相似矩陣的性質與埃爾米特矩陣初探
與三角形一樣,矩陣之間的相似關系是個“等價關系”,即(i)每個方陣與它自己相似,這時建立相似關系的矩陣就可取為單位矩陣;(ii)若與相似,則與相似,這是因為
![]()
然而,正如前面的簡單例子所顯示的,并非方陣的每個特征值都是半單 的。事實上,只要有一個特征值是非半單的,矩陣就不可能對角化。在這個最一般的非半單特征值情形下,人們退而求其次,引進了所謂的“廣義特征向量”的概念,猶如當矩陣無逆可求時可以尋覓“廣義逆矩陣”(參看我們之前在《返樸》發表的文章《從線性算子的角度看廣義逆矩陣》)。披在廣義特征向量身上的外衣是世界品牌“若爾當標準型”,它比半單特征值旗幟下的對角矩陣標準型只多了一條與主對角線平行、含有非零元素的次對角線,卻具有豐富多彩的數學內容。未來有機會時我們將集中討論若爾當標準型。
不過,有好幾類矩陣不會讓我們擔心,因為它們都可對角化,其中的一類長相最漂亮,叫埃爾米特矩陣類,其中的每個矩陣滿足等式? = ,即 的共軛轉置矩陣就是它自己。埃爾米特(Charles Hermite,1822-1901)是法國數學家,他第一個證明了自然對數的底2.71828 ?是超越數。在元素全是實數時,埃爾米特矩陣就是更易識別的實對稱矩陣,即
![]()
故它有兩個單特征值1和?1。和之前特征值為正負虛數單位的矩陣相比,這里復數被毫不留情地擠出特征值隊伍之外。第一個特征值占有特征向量(1, ?1),第二個特征值對應的特征向量是(1, 1)。不難發現這兩個特征向量相互正交!
有了這個例子墊底,未來我們就可以深入探討實對稱矩陣、埃爾米特矩陣、正交矩陣、酉矩陣,乃至更加一般的正規矩陣的特征值問題了。
注:本文封面圖片來自版權圖庫,轉載使用可能引發版權糾紛。
![]()
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回復四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權說明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯系后臺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.