设为首页|收藏本站|
开启左侧

[问答] 麻省理工学院

[复制链接]
58799 0
寂寞秋千 发表于 2023-3-20 23:35:21 | 只看该作者 打印 上一主题 下一主题
 
这一节主要是讲特征值的应用。上一节主要讲稳态问题,其实就是特征值的特征向量的问题。
一、什么是马尔可夫矩阵?
\left[   \begin{array}{ccc}     0.1 & 0.01 & 0.3 \\    0.2 & 0.99 & 0.3 \\     0.7 & 0 & 0.4 \\   \end{array} \right]
以上就是马尔可夫矩阵,但是需要满足以下两条性质:
1、每个元素都大于等于0,矩阵平方后所有元素仍然大于等于0(矩阵的幂也是马尔可夫矩阵)
2、 每一列元素之和都等于1(马尔可夫矩阵和概率思想有关)
每个列相加和1的情况下,必有一个特征值为1
满足上面两条性质的马尔可夫矩阵有两个性质:
1、 \lambda=1 是其中一个特征值
2、其它的特征值的绝对值小于1, |\lambda_{i}|<1 (有可能出现等于1的情况,但是绝对不会大于1)
用线性方程来解释上面两条性质:
U_{k}=A^{k}U_{0}=c_{1}\lambda_{1}x_{1}+ c_{2}\lambda_{2}x_{2}+ c_{3}\lambda_{3}x_{3}... (这里需要全部的特征向量,否则 U_{0} 就不能写成特征向量的形式。)
\lambda_{1}=1 , |\lambda_{i}|<1 ,那么随着时间的(迭代)推移,上面的等式就成了:
U_{k}=A^{k}U_{0}=c_{1}1x_{1}+ 0+ 0...\rightarrow c_{1}x_{1}(  其余部分都是0,此时趋于 稳态)
初始条件的 U_{0} 的 c_{1}x_{1}  这部分就是稳态。
特征向量 x_{1} 的所有的元素都是正数,如果初始值是正数,稳态就也是正数。当然也可能有0元素的存在,但不会有负数值。
特征向量x1的所有元素都是正数或0,所以稳态是正值。
为什么1是特征值?
下面的矩阵每一列的和都是1,意味着 \lambda=1 是其中一个特征值。
\left[   \begin{array}{ccc}     0.1 & 0.01 & 0.3 \\    0.2 & 0.99 & 0.3 \\     0.7 & 0 & 0.4 \\   \end{array} \right]
反过来想,如果1是特征值,有 A-1I= \left[   \begin{array}{ccc}     -0.9 & 0.01 & 0.3 \\    0.2 & -0.01 & 0.3 \\     0.7 & 0 & -0.6 \\   \end{array} \right] (这个矩阵被平移了一个单位)
如果矩阵是奇异的,那么必有一个特征值是1.(特征值就是减去对角线元素后是的使得矩阵奇异的数),上面的矩阵有一个特点,就是每一列加起来是0,那么说明每一列线性相关,矩阵 A-1I 是奇异的。
为什么每一列加起来是0,就是奇异的呢?(这句话是真命题)
因为列全部项加能得到全零的列,也就是说列变换得到0行(也可以用行列式的值=0来证明) ,但是如果每列的和是1,那么证明每行线性相关会更容易。 1倍的行一加1倍的行二加1倍的行三,将三行全部项加结果是0。也就说明 \left[   \begin{array}{ccc}     1 \\     1 \\ 1 \\   \end{array} \right]   是左零空间 A^{T} 的向量,所以行线性相关,矩阵是奇异的。
那么矩阵的零空间有哪些向量呢?
首先特征向量 x_{1} 在A的零空间中,对应的就是特征值是1的向量。
A和A^{T} 的特征值存在什么关系呢?它们是一样的。(特征值一般不好求解,但是知道一些性质总是有用的。)
证明特征值相同:(\lambda I)^{T}=\lambda I  \begin{array}{ccc}     det(A-\lambda I)=0 \\     det(A ^{T}-\lambda I)=0\\   \end{array},所以 A 的特征值 \lambda 也是 A^{T} 的特征值。
也就说明 \lambda=1 是 A的特征值,但是特征向量是不同的(左零空间不同于零空间)。1是特征值证明结束。

口算零空间中的向量,因为是线性相关的,先计算最后一行,再计算中间一行即可。
\left[   \begin{array}{ccc}     -0.9 & 0.01 & 0.3 \\    0.2 & -0.01 & 0.3 \\     0.7 & 0 & -0.6 \\   \end{array} \right]  \left[   \begin{array}{ccc}     0.6 \\     \\     0.7\\   \end{array} \right]  =  \left[   \begin{array}{ccc}     0 \\     0\\     0\\   \end{array} \right]  = \left[   \begin{array}{ccc}     -0.9 & 0.01 & 0.3 \\    0.2 & -0.01 & 0.3 \\     0.7 & 0 & -0.6 \\   \end{array} \right]  \left[   \begin{array}{ccc}     0.6 \\     33 \\     0.7\\   \end{array} \right]  =  \left[   \begin{array}{ccc}     0 \\     0\\     0\\   \end{array} \right]  
注意这里的值都是正数,矩阵的零空间就找到了。
接下来讨论马尔可夫矩阵的实际应用
如果 A是马尔可夫矩阵,那么 U_{k+1}=AU_{k} 。
例子: 使用马尔可夫矩阵来看待人口迁移问题(类似一种递归计算),矩阵A代表一年以后人口迁移,一些人搬去麻省,一些人搬去加州。这些现实情况就满足马尔可夫矩阵的条件:1、都是正数2、去留的概率在0和1之间,加起来是1。整个过程中人数不变。
有: \left[   \begin{array}{ccc}     U_{cal} \\     U_{mass} \\   \end{array} \right]_{k+1}= \left[   \begin{array}{ccc}     A   \end{array} \right]= \left[   \begin{array}{ccc}     U_{cal} \\     U_{mass} \\   \end{array} \right]_{k} ,其中A是马尔可夫矩阵,随着时间的推移保持不变。但是每次变动的概率一样,每次变动给个结果,给出合理解释即可。
假设每次变化加州有10%的人搬去麻省,90%的人留下,而麻省因为红袜队输了导致有20%的搬到加州,80%的留下,得到:(元素非负,和为1.)
\left[   \begin{array}{ccc}     U_{cal} \\     U_{mass} \\   \end{array} \right]_{k+1}= \left[   \begin{array}{ccc}     0.9 & 0.2\\  0.1 & 0.8\\   \end{array} \right]= \left[   \begin{array}{ccc}     U_{cal} \\     U_{mass} \\   \end{array} \right]_{k}
设定初始时刻(t=0)为: \left[   \begin{array}{ccc}     U_{cal} \\     U_{mass} \\   \end{array} \right]_{0}= \left[   \begin{array}{ccc}     0 \\     1000 \\   \end{array} \right]  起始时刻麻省人口1000,加州0人。
那么k步以后,人数会出现怎样的变化?
麻省的人口从1000开始下降,加州的人口从0开始增加。经过第一次变化结果为:
\left[   \begin{array}{ccc}     U_{cal} \\     U_{mass} \\   \end{array} \right]_{1}= \left[   \begin{array}{ccc}     0.9 & 0.2\\  0.1 & 0.8\\   \end{array} \right]\left[   \begin{array}{ccc}     0\\  1000\\   \end{array} \right]= \left[   \begin{array}{ccc}     200 \\     800 \\   \end{array} \right]
矩阵 \left[   \begin{array}{ccc}     .9 & .2 \\     .1  & .8\\   \end{array} \right] 的其中一个特征值是1,另一个特征值是(矩阵的迹等于特征值的和)0.9+0.8-1=0.7
一个特征值小于1,矩阵的行列式等于0.7(0.9*0.8-02*0.1=0.7)
接下来计算特征向量: \left[   \begin{array}{ccc}     0.9-1 & .2 \\     0.1  & 0.8-1\\   \end{array} \right]= \left[   \begin{array}{ccc}     -0.1 & 0.2 \\     0.1  & -0.2\\   \end{array} \right]\left[   \begin{array}{ccc}     x_{1}   \end{array} \right]=\left[   \begin{array}{ccc}     0 \\     0 \\   \end{array} \right] 得 \left[   \begin{array}{ccc}     x_{1}   \end{array} \right]=\left[   \begin{array}{ccc}     2 \\     1 \\   \end{array} \right] 稳态由这个向量给出。
\left[   \begin{array}{ccc}     0.9-0.7 & .2 \\     0.1  & 0.8-0.7\\   \end{array} \right]= \left[   \begin{array}{ccc}     0.2 & 0.2 \\     0.1  & 0.1\\   \end{array} \right]\left[   \begin{array}{ccc}     x_{2}   \end{array} \right]=\left[   \begin{array}{ccc}     0 \\     0 \\   \end{array} \right] 得 \left[   \begin{array}{ccc}     x_{2}   \end{array} \right]=\left[   \begin{array}{ccc}     -1 \\     1 \\   \end{array} \right]  
那么系数为: U_{0}=c_{1}x_{1}+c_{2}x_{2}=c_{1}\left[   \begin{array}{ccc}     2 \\     1 \\   \end{array} \right]+c_{2}\left[   \begin{array}{ccc}     -1 \\     1 \\   \end{array} \right]= \left[   \begin{array}{ccc}     0 \\     1000\\   \end{array} \right]  得 c_{1}=\frac{1000}{3}, c_{2}=\frac{2000}{3}
经过100步之后: U_{k}=c_{1}1^{k}x_{1}+c_{2}(0.7)^{k}x_{2}  , U_{100}=\frac{1000}{3}\left[   \begin{array}{ccc}     2 \\     1\\   \end{array} \right]   这就是矩阵幂得结果,用矩阵 A 对 U_{0} 进行多次作用。
人口迁徙建模结束。在其它学科中习惯使用行向量来解决问题, 行向量加起来是等于1,需要转置再计算。
从投影中引出傅里叶级数问题
主要讨论带有标准正交积的投影问题,基向量为 q_{1},q_{1}...q_{n}
空间中的任意向量 v=x_{1}q_{1}+x_{2}q_{2}+x_{3}q_{3}...x_{n}q_{n} ,将向量x展开到基上去,这组基是标准正交的。
q_{1}^{T}v=x_{1}q_{1}^{T}q_{1}+0+0...0 ( 正交基q_{1}和q_{2}做内积等于0 )
q_{1}^{T}v=x_{1}
写成矩阵的形式: \left[   \begin{array}{ccc}    | & |  &... & | \\     q_{1} &q_{2} & ... & q_{n}\\     | & | &... &|\\   \end{array} \right] \left[   \begin{array}{ccc}    x_{1}\\     ...\\     x_{n}\\   \end{array} \right]=v   记作: Qx=v  方程的解为: x=Q^{-1}v=Q^{T}v
解得: x_{1}=q_{1}^{T}v (在一个纬度上的投影可以分开表示,v乘以正交基分量的转置在投影的面上,也有无穷个分量。一个向量在x轴的投影就是它在x轴上的分量,以此类推...那么再无穷维上,就有无穷个分量。傅里叶根据这发现了无穷向量空间和函数f(x)无穷级数的关系。)
傅里叶级数: f(x)=a_{0}1+a_{1}cos(x)+b_{1}sin(x)+a_{2}cos(2x)+b_{1}sin(2x)+...
在这个方程中sin和cos依然是正交的,和上面的例子相同,从一般到特殊。可以用函数f(x)来代替向量v,用正交函数来代替正交向量 q_{1},q_{1}...q_{n} ,常数cos(x),sin(x),cos(2x),sin(2x)...也是无穷的,在向量空间中空间也是无穷维的。
基向量也是函数, a_{0} 常数的函数是1。基是:1,cos(x),sin(x),cos(2x),sin(2x)...,傅里叶级数成立的条件就是这些基向量正交。
向量的正交的意思是 y^Tx=0 ,那函数的正交是什么?
向量:v^Tw=v_1w_1+v_2w_2+...v_nw_n
其实就是1到n上的积分,比如三空间 \int_{1}^{3}v_{n}w_{n}=v_{1}w_{1}+v_{2}w_{2}+v_{3}w_{3}
函数: f^Tg=\int_{0}^{2\pi}f(x)g(x)dx
为什么是上面的方程解释一下:向量是v点乘w,那么函数也应该是f(x)乘g(x)的形式,前者是几个相加,后者是连续的,前者相加,那么后者如果也是连续相加,就得是积分的形式,而且f(x)=f(x+2\pi )  周期是2\pi
定义两个函数:f(x)=sin(x),g(x)=cos(x)。那么有
\int_{0}^{2\pi}sin(x)cos(x)dx=\frac{1}{2}(sinx)^2|_0^{2\pi}=0 ,则f(x) 和g(x)正交。

接下来让f(x)的每一项: f(x)=a_{0}1+a_{1}cos(x)+b_{1}sin(x)+a_{2}cos(2x)+b_{1}sin(2x)+... 和cos(x)作内积:
\int_{0}^{2\pi}f(x)cos(x)dx = \int_{0}^{2\pi}(0+a_{1}cos(x)cos(x)+0+...)=a_1\int_{0}^{2\pi}cos(x)^2dx=a_{1}\pi  
所以 a_{1}=\frac{1}{\pi}\int_{0}^{2\pi}f(x)cos(x)dx (这个公式就是傅里叶级数系数公式)它的确能展开到一组标准正交基上。


上一篇:麻省理工周记(230318):Deep Change & Deep Bias
下一篇:麻省理工RD放榜,申请人数爆跌20%, 录取人数历年最低 ...
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-4-25 14:42