线性代数的本质(2)——行列式,线性方程组,逆,秩
本文最后更新于466 天前,其中的信息可能已经过时,如有错误请发送邮件到lysun26@163.com

行列式

空间在经历了线性变换后,线性变换在空间中表现为对空间进行了拉伸或者收缩,而我们应该如何衡量这种改变呢?

一个空间是由基向量为基础构成的,因此我们可以用基向量组成的区域来衡量这种改变。在二维情形下,这个区域就是两个基向量组成的平行四边形的面积,如下图所示。线性变换对空间进行了拉伸,这个面积也发生的一定的变化。衡量这个面积变化量的量就是行列式(Determinant)

行列式示意图

考虑一种特殊情况,当变换后,两组基向量变成线性相关了,比如$\begin{bmatrix}0 & 0 \\ 1 & 3 \end{bmatrix}$,在空间中,这个表现为两组基向量组成的区域面积为0,所以面积变化了$0/1=0$倍,说明这个矩阵的行列式为0,此时对应着空间的维度发生了降低,即出现了降维。因此,可以得到一个对应关系:
$$
线性相关 \Leftrightarrow Det(M)=0
$$
使用行列式的含义来考虑对角矩阵的值。例如对对角矩阵$\begin{bmatrix}a & 0 \\ 0 & b \end{bmatrix}$,它表示第一个基向量变为了$\vec{i}$的a倍,第二个基向量变为了$\vec{j}$的b倍,然后我们可以得到它们组成的区域面积变为了原来的ab倍,即这个行列式的值为ab,是不是很直观呢?

再考虑一个行列式的性质:Det(M1M2)=Det(M1)Det(M2)。在教材中,这个性质的证明是十分繁琐的。在这里,我们就使用上面行列式的含义来解释,可以发现很容易解释这个性质,而不需要繁琐的理论计算。M1M2表示两个线性变换的组合,先进行M2变换,面积变为了最初的Det(M2)倍,然后进行M1变换,面积变为了M2变换后的Det(M1)倍,因此,面积为最初的Det(M1)Det(M2)倍。而如果同时把M1M2的结果作为一次线性变换,那么可以得到面积为最初的Det(M1M2)倍,故这个性质是成立的。是不是很简单?

线性方程组,逆

在上面的介绍中,矩阵是扮演着变换空间的能力。接下来谈一下矩阵在线性方程组(Linear System of Equations)中的应用,这也是线性代数中的一个重点。

线性方程组通常表示为$\mathbf{\mathit{A} } x=b$,其中A为系数矩阵,x为未知量,b为值。其中,x和b均为向量。我们可以与前面的知识联系起来,看看在空间中,这个等式有什么含义。首先,x和b是两个向量,A是矩阵,存储着一个线性变换的信息,那么这个式子的含义就很明显了,对x进行A对应的线性变换之后,与b重合,而我们就是找这个能够与b重合的x。这就与前面的知识联系起来了,然后线性方程组也就没什么特殊的了。

将这个与前面的知识结合起来来理解。根据前面的知识,我们也可以知道,当det(A)不等于0时,线性变换前后的向量是一一对应的,那么这个方程组就存在唯一解。而当det(A)等于0,那么发生了降维。这时,将不一定有解。为什么呢?例如对于二维情况,如果降至一维,即一条直线,那么只有当b恰好在这条直线上时,才存在解,此时有无穷多个解。为什么有无穷多个解呢?在下面介绍零空间就会得到答案,简单来说,就是降维时,存在多对一的映射,比如2D到1D中,直线到点的映射,故存在无穷多个向量能够映射上b上,因此存在无穷多个x。而如果b不在这个直线上,且b不为0,那么将不存在解,这个很好理解,因为没有向量经过线性变换后得到b。

那么如何求解呢?我们可以将这个过程反过来看,对x施加A线性变换得到b,那么对b施加一个线性变换后是不是也能得到x呢?答案是肯定的(当然这里指的不是特殊情况,比如行列式为0)。而这个相反的线性变换就是A的逆(Inverse),表示为A-1

考虑A-1A,表示先施加A对应的线性变换,然后施加A-1对应的线性变换,相当于将这个空间变换来再变换回去,相当于并没有变换,因此可以得到A-1A=E.

根据上面的分析,当det(A)不为0时,A-1是肯定存在的。而当det(A)=0,那么维度降低,逆将不存在。这是为什么呢?

我们可以根据函数来理解这个。一个函数只能够根据一个输入得到一个输出,而不能根据一个输入得到多个输出。这对于矩阵也是一样的,降了之后,没办法升回去,故不存在逆。(注:我们现在讨论的都是方阵,如果不是方阵,确实能够升维,但不是现在讨论的范畴)

从前面的分析中可以看出,在应用线性变换时,会存在降维的情况。对于二维情况,可能会降至一维,甚至0维,而对于三维情况,可能会降至二维,也可能会降至一维,存在很多种情况。那么我们应该如何衡量呢?

衡量输出空间维度的量就是秩(Rank),也就是线性变换后的维度。

考虑原点(Origin),当维度不变时,输出空间的原点仅与输入空间中的原点对应,但发生降维后,如果二维降至一维,则输出空间中的原点来源于输入中的一条线,如果三维降至二维,那么输出空间中的原点来源于输入空间中的一个平面。而这三种情况中的点、线或者平面,称为零空间(null space)或者核(kernel),定义为经过变换后落在原点的向量的集合(the set of vectors that lands on the origin)。

不只是原点,当二维降至一维时,输出空间的每一个点都来源于输入的一条直线,这也就是为什么线性方程组中在一些特殊情况下会有无穷多个解。再考虑一个特殊情况,如果Det(A)=0,当解为零向量时,那么相当于求解经过线性变换落到原点的向量,此时将肯定存在无穷多个解,且这个解为零空间。因为无论怎么线性变换,零点的位置是不变的,当Det(A)=0时,说明发生了降维,此时零空间肯定会是过原点的直线或平面或更高维的东西。


最后简单介绍以下不是方阵的情况。前面介绍的情况都是维度不变或者降低,但如果我们想将2维变成3维呢?这种变换对应的就是非方阵,之前介绍的都是方阵。其矩阵中的基向量需要与输出维度对应,例如由2D到3D,变换矩阵需要时3*2的,即每一列是三维的。之所以不重点提这个,因为这个并不影响我们去理解线性代数的本质,而且方阵也是最常用的。

有问题可以留言哦~ 觉得有帮助也可以投喂一下博主,感谢~
文章链接:https://www.corrain.top/linear-algebra-2/
版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明文章地址及作者

评论

  1. 1年前
    2022-12-02 22:46:00

    写的真好,推给我朋友了

    • 博主
      Echo
      1年前
      2022-12-03 8:56:28

      好哒,谢谢支持

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
( ゜- ゜)つロ
_(:з」∠)_
(⌒▽⌒)
( ̄▽ ̄)
(=・ω・=)
(*°▽°*)八(*°▽°*)♪
✿ヽ(°▽°)ノ✿
(¦3【▓▓】
눈_눈
(ಡωಡ)
_(≧∇≦」∠)_
━━━∑(゚□゚*川━
(`・ω・´)
( ̄3 ̄)
✧(≖ ◡ ≖✿)
(・∀・)
(〜 ̄△ ̄)〜
→_→
(°∀°)ノ
╮( ̄▽ ̄)╭
( ´_ゝ`)
←_←
(;¬_¬)
(゚Д゚≡゚д゚)!?
( ´・・)ノ(._.`)
Σ(゚д゚;)
Σ(  ̄□ ̄||)<
(´;ω;`)
(/TДT)/
(^・ω・^)
(。・ω・。)
(● ̄(エ) ̄●)
ε=ε=(ノ≧∇≦)ノ
(´・_・`)
(-_-#)
( ̄へ ̄)
( ̄ε(# ̄) Σ
(╯°口°)╯(┴—┴
ヽ(`Д´)ノ
("▔□▔)/
(º﹃º )
(๑>؂<๑)
。゚(゚´Д`)゚。
(∂ω∂)
(┯_┯)
(・ω< )★
( ๑ˊ•̥▵•)੭₎₎
¥ㄟ(´・ᴗ・`)ノ¥
Σ_(꒪ཀ꒪」∠)_
٩(๛ ˘ ³˘)۶❤
(๑‾᷅^‾᷅๑)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
小黄脸
热词系列一
tv_小电视
上一篇
下一篇