这是在看别人面筋时看面试官问的一道题,记录一下

  • 矩阵正定性的判断

判断一个矩阵是否正定,可以看此矩阵的所有特征值是否不小于0,如果满足条件,则判定为半正定,若所有特征值都大于0,则判定为正定。

  • Hessian矩阵正定性在GD中的应用

Hessian 矩阵是一个多元函数的二阶偏导数构成的方阵,描述了函数的局部曲率。Hessian 矩阵常用于牛顿法解决优化问题,利用Hessian 矩阵可判定多元函数的极值问题。在工程实际问题的优化设计中,所列的目标函数往往很复杂,为了使问题简化,常常将目标函数在某点邻域展开成泰勒多项式来逼近原函数,此时函数在某点泰勒展开式的矩阵形式中会涉及到Hessian 矩阵。

在判断优化算法可行性时Hessian 矩阵的正定性起很大的作用。若Hessian 矩阵正定,则函数的2阶偏导恒大于0,函数的变化率处于递增状态,在牛顿法等GD方法中,Hessian 矩阵很容易判断函数是否可收敛到局部或全局最优。

 

还看到了问牛顿法和拟牛顿法的区别

  • 牛顿法和拟牛顿法

牛顿法优点:

                    1)收敛速度快

                     2)迭代次数少

牛顿法缺点:

                    1)Hessian 矩阵稠密

                    2)迭代计算量大,占存储空间大

拟牛顿法特点:

引入了Hessian 矩阵的近似矩阵,用Hessian 矩阵的逆矩阵代替Hessian 矩阵。虽然不能像牛顿法那样保证最优化的方向,始终正定,但是算法始终朝着最优化的方向在搜索。

 


版权声明:本文为qq_27172515原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/qq_27172515/article/details/98184001