跳转至

拉格朗日乘子法

1 一般形式的拉格朗日乘子法

  1. 定义:对于函数 ,以及限制条件: 其中

定义函数 通过联立求解 可以求得得最小值所需要的

  1. 解释:

1610705674536

一定在张成的空间

2 向量形式的拉格朗日乘子法

  1. 定义:对于函数, 和限制条件

定义函数 联立求解 可以求得得最小值所需得

3 例题

  1. 已知, , 求最小值

  2. 已知, , 求最小值

4 对偶性

4.1 原始问题

  1. 是定义在上连续可微函数,则称约束最优化问题

​ 为原始优化问题

  1. 拉格朗日函数 其中称为松弛变量/KKT变量,是拉格朗日乘子。

  2. 关于是仿射函数

  3. 是凸函数, 是仿射函数,则是关于的凸函数。

  4. 构造

  • 如果某个违反约束条件, 即存在使得或者, 可以令或者, 从而

  • 若均符合条件,

  • 极小化问题

与原始问题等价,则有相同的解。 称为广义拉格朗日函数极小极大化问题。

  • 原始问题的最优值

4.2 对偶问题

  1. 构造 则极大化问题 称为广义拉格朗日函数的极大极小问题。

表示为约束最优化问题为: 这称为原始问题的对偶问题。

  1. 定义对偶问题的最优值

  2. 性质:此函数为凹函数

  3. 固定时,是一个关于的仿射函数,既是凸的也不是凹的,满足

4.3 原始问题和对偶问题的关系

  1. 弱对偶性

  2. 对于所有优化问题都成立,即使原始问题非凸

  3. 证明:

  4. 更进一步的解释

  5. 强对偶性 并不是所有的对偶问题都满足强对偶性 ,在 SVM 中是直接假定了强对偶性的成立,其实只要满足一些条件,强对偶性是成立的,比如说 Slater 条件与KKT条件。

  6. Slater条件

  7. 凸优化条件

    • 是凸函数
    • 是仿射函数
  8. 严格可行
    • 存在, 对所有的

则存在, 使得是原始问题的解,是对偶问题的解,并且 即:原始问题是凸优化问题并且满足严格可行条件的话,那么强对偶性成立

  • KTT条件

  • 满足Slater条件

  • 是原始问题的解,是对偶问题的解的充分必要条件是满足: $$ \begin{align} &(1)\ c_i(x^) \le 0,\ i = 1,2,...,k\ &(2)\ h_j(x^) = 0,\ j = 1,2,...,l\ &(3)\ \nabla_xL(x^,\alpha^,\beta^) = 0\ &(4)\ \alpha_i^ \ge 0,\ i = 1,2,...,k\ &(5)\ \alpha_i^c_i(x^) = 0,\ i = 1,2,...,k\

    \end{align} $$ 且

  • 证明

    • 必要性:

    • 由于 是原问题的解,所以满足第 条。

    • 由于, 则, 则梯度为0,满足

    • 由于是对偶问题的解,所以满足

    • 对于, 经过公式:

    由于两侧等于,所以等号都成立,则,所以

    • 充分性:

    • 根据对偶问题的定义

    • 由于梯度为0,且函数关于凸函数,则

    • 由于是凸函数,是凹函数。且 ,我们就知道原问题肯定取到了最小值,而对偶问题肯定取到了最大值,说明我们找到了两者的解。

  • KTT的直观理解

    约束问题:

    1. 称为原始可行性

    2. 定义可行域

    3. , 则落在可行域内,称为内部解,约束条件无效,只需要检验满足原始可行性就可, 根据拉格朗日乘子

    4. , 则在的边界,称为边界解,此时约束条件是有效的。 由于在边界取到,所以方向相反,从而产生了对偶可行性

    5. 可以看到恒成立,所以称为互补松弛性

    6. 最后得到条件

    7. 对于普遍情况

    得到KTT条件