Sam Levey
https://www.youtube.com/watch?v=wjYpzkQoyD8
这个视频主要是想让你直观地、从几何角度理解矩阵转置是怎么回事。
它主要研究的是,一个线性变换(也就是用矩阵 A 去乘一个向量)会不会保持两个向量之间的点乘不变。视频里说,一般来说,把两个向量都用 A 变换一下,点乘就不一样了。不过也有特殊情况,比如正交矩阵,它代表的是旋转、反射这种变换,这种变换天生就保持点乘不变。
视频解释说,如果想让一个向量用 A 变换后,还能保持和另一个向量的点乘不变,那另一个向量就得用 A 的逆转置 (A⁻ᵀ) 来变换。它用到了奇异值分解 (SVD),这个 SVD 能把一个矩阵 A 分解成一系列的变换(先旋转,再缩放,最后再旋转),这样就能从几何上看得更清楚。视频里推导了 A⁻ᵀ 的 SVD 形式,然后从几何上解释说,这相当于先做 A 的第一次旋转,然后做逆向缩放,最后再做 A 的第二次旋转。
如果 A 不是可逆矩阵怎么办呢?视频就换了个思路。它不再是把向量往前(从输入到输出)变换了,而是考虑在输出空间里选一个向量,然后找个规则,看看在输入空间里哪个向量能跟它对应上,并且保持点乘关系不变。结果发现,这个规则就是用转置矩阵 (Aᵀ) 来变换。视频里还推导了 Aᵀ 的 SVD 形式,从几何上解释就是:先把 A 的第二次旋转“撤销”(或者说反向旋转),然后用跟 A *一样* 的缩放,最后再把 A 的第一次旋转“撤销”。
视频强调说,A 是把向量从输入空间往输出空间“往前”送,而 Aᵀ 呢,是为了保持点乘关系,是把向量从输出空间往输入空间“往回”送。这就给转置,即使是对那些不可逆的矩阵,提供了一个很重要的几何解释。视频最后还提了下对称矩阵,就是等于它自己转置的矩阵。