拉格朗日乘子法¶
1 一般形式的拉格朗日乘子法¶
- 定义:对于函数 ,以及限制条件: 其中
定义函数 通过联立求解 可以求得得最小值所需要的
- 解释:
一定在和张成的空间
2 向量形式的拉格朗日乘子法¶
- 定义:对于函数, 和限制条件
定义函数 联立求解 可以求得得最小值所需得
3 例题¶
-
已知, , 求时最小值
-
已知, , 求时最小值
4 对偶性¶
4.1 原始问题¶
- 是定义在上连续可微函数,则称约束最优化问题
为原始优化问题
-
拉格朗日函数 其中称为松弛变量/KKT变量,是拉格朗日乘子。
-
关于是仿射函数
-
若是凸函数, 是仿射函数,则是关于的凸函数。
-
构造
-
如果某个违反约束条件, 即存在使得或者, 可以令或者, 从而
-
若均符合条件,
-
即
-
极小化问题
与原始问题等价,则有相同的解。 称为广义拉格朗日函数极小极大化问题。
- 原始问题的最优值
4.2 对偶问题¶
- 构造 则极大化问题 称为广义拉格朗日函数的极大极小问题。
表示为约束最优化问题为: 这称为原始问题的对偶问题。
-
定义对偶问题的最优值
-
性质:此函数为凹函数
-
当固定时,是一个关于的仿射函数,既是凸的也不是凹的,满足
4.3 原始问题和对偶问题的关系¶
-
弱对偶性
-
对于所有优化问题都成立,即使原始问题非凸
-
证明:
-
更进一步的解释
-
强对偶性 并不是所有的对偶问题都满足强对偶性 ,在 SVM 中是直接假定了强对偶性的成立,其实只要满足一些条件,强对偶性是成立的,比如说 Slater 条件与KKT条件。
-
Slater条件
-
凸优化条件
- 和是凸函数
- 是仿射函数
-
严格可行
- 存在, 对所有的有
则存在, 使得是原始问题的解,是对偶问题的解,并且 即:原始问题是凸优化问题并且满足严格可行条件的话,那么强对偶性成立
-
KTT条件
-
满足Slater条件
-
若是原始问题的解,是对偶问题的解的充分必要条件是满足: $$ \begin{align} &(1)\ c_i(x^) \le 0,\ i = 1,2,...,k\ &(2)\ h_j(x^) = 0,\ j = 1,2,...,l\ &(3)\ \nabla_xL(x^,\alpha^,\beta^) = 0\ &(4)\ \alpha_i^ \ge 0,\ i = 1,2,...,k\ &(5)\ \alpha_i^c_i(x^) = 0,\ i = 1,2,...,k\
\end{align} $$ 且
-
证明
-
必要性:
-
由于 是原问题的解,所以满足第 条。
-
由于, 则, 则梯度为0,满足
-
由于是对偶问题的解,所以满足
-
对于, 经过公式:
由于两侧等于,所以等号都成立,则,所以
-
充分性:
-
根据对偶问题的定义
-
由于梯度为0,且函数关于凸函数,则
-
由于是凸函数,是凹函数。且 ,我们就知道原问题肯定取到了最小值,而对偶问题肯定取到了最大值,说明我们找到了两者的解。
-
-
KTT的直观理解
约束问题:
-
称为原始可行性
-
定义可行域
-
若, 则落在可行域内,称为内部解,约束条件无效,只需要检验满足原始可行性就可, 根据拉格朗日乘子
-
若, 则在的边界,称为边界解,此时约束条件是有效的。 由于在边界取到,所以和方向相反,从而产生了对偶可行性
-
可以看到恒成立,所以称为互补松弛性
-
最后得到条件
- 对于普遍情况
得到KTT条件
-