原始问题
假设f(x),ci(x),hj(x)是定义在Rn上连续可微函数,最优化问题
x∈Rnminf(x)s.tcj≤0,i=1,2,⋯,khj(x)=0,j=1,2,⋯,l(1)
引入广义拉格朗日函数
L(x,α,β)=f(x)+i=1∑kαici(x)+j=1∑lβjhj(x)
其中,αi,βj是拉格朗日乘子,αi≥0,考虑x的函数:
θp(x)=α,β:αi≥0maxL(x,α,β)
这里,下表P表示原始问题;假设给定某个x,如果违反原始问题的约束条件,就有
θp(x)=α,β:αi≥0maxL(x,α,β)=+∞
因为若某个i使约束ci(x)>0,则可令αi→+∞,若某个j使hj(x)=0则可令βi→+∞,而将其余的αi,βi均设为0;因此
θp(x)={f(x),x满足原始问题约束+∞,其他
因此考虑极小化问题
xminθp(x)=xminα,β:αi≥0maxL(x,α,β)
他和(1)是等价的;问题minxmaxα,β:αi≥0L(x,α,β)称为广义拉格朗日函数的极小极大问题,这样就把原始最优化问题表示为广义拉格朗日函数的极小极大值问题。为了方便定义原始问题的最优解
p∗=xminθp(x)
称为原始问题的值;
对偶问题
定义
θD(α,β)=xminL(x,α,β)
再考虑极大化θD(α,β),即
α,β:α≥0maxθD(α,β)=α,β:α≥0maxxminL(x,α,β)
称为广义拉格朗日函数的极大极小问题;
于是广义拉格朗日函数的极大极小问题表示为约束优化问题:
α,β:α≥0maxθD(α,β)=α,β:α≥0maxxminL(x,α,β)s.t.αi≥0,i=1,2,⋯,k
称为原始问题的对偶问题,定义对偶问题最优值
d∗=α,β:α≥0maxθD(α,β)
称为对偶问题的值;
原始问题和对偶问题的关系
-
若原始问题和对偶问题都有最优解,则d∗≤p∗;
- 推论:设x∗,α∗,β∗分别为原始问题和对偶问题的可行解,并且d∗=p∗,则x∗,α∗,β∗分别是原始问题和对偶问题的最优解;
-
假设f(x),ci(x)是凸函数,hj(x)是仿射函数;并且假设不等式约束ci(x)是严格可行的(存在x,对所有的i有ci(x)≤0),则存在x∗,α∗,β∗,使x∗是原始问题的解,α∗,β∗是对偶问题的解,且
p∗=d∗=L(x∗,α∗,β∗)
-
假设f(x),ci(x)是凸函数,hj(x)是仿射函数;并且假设不等式约束ci(x)是严格可行的,则存在x∗,α∗,β∗分别是原始问题和对偶问题的解的充分必要条件是x∗,α∗,β∗满足下面的(KKT)条件:

特别指出,式(c.22)称为KKT的对偶互补条件,由此条件可知:若ai∗>0,则ci(x∗)=0;