0%

凸优化作业-2

凸优化作业-2

问题 1

(a) 证明 KK^\circ 是一个闭合的凸锥

证明

  1. 闭合性:设 {wk}K\{w_k\} \subseteq K^\circ 是一个收敛序列,且 wkww_k \to w。我们需要证明 wKw \in K^\circ。对于任意 xKx \in K,有:

    wkTx0对于所有 k.由于内积是连续的,取极限得:wTx=limkwkTx0. w_k^T x \leq 0 \quad \text{对于所有 } k.\\ 由于内积是连续的,取极限得: \\ w^T x = \lim_{k \to \infty} w_k^T x \leq 0.

    因此,wKw \in K^\circ,所以 KK^\circ 是闭合的。

  2. 凸性:设 w1,w2Kw_1, w_2 \in K^\circ,对于任意 λ[0,1]\lambda \in [0, 1],考虑 w=λw1+(1λ)w2w = \lambda w_1 + (1 - \lambda) w_2。对于任意 xKx \in K,有:

    wTx=λw1Tx+(1λ)w2Txλ0+(1λ)0=0. w^T x = \lambda w_1^T x + (1 - \lambda) w_2^T x \leq \lambda \cdot 0 + (1 - \lambda) \cdot 0 = 0.

    因此,wKw \in K^\circ,所以 KK^\circ 是凸的。

  3. 锥性:对于任意 wKw \in K^\circα0\alpha \geq 0,有:

    (αw)Tx=α(wTx)0, (\alpha w)^T x = \alpha (w^T x) \leq 0,

    因此 αwK\alpha w \in K^\circ

综上所述,KK^\circ 是一个闭合的凸锥。

(b) 证明条件等价性

证明

  1. 假设 z=ΠK(x)z^* = \Pi_K(x)。根据投影的性质,zKz^* \in K,且 xzKx - z^* \in K^\circ,并且 (xz)Tz=0(x - z^*)^T z^* = 0,因为投影是最小化距离的,且在锥内。

  2. 反之,假设 zKz^* \in KxzKx - z^* \in K^\circ,且 (xz)Tz=0(x - z^*)^T z^* = 0。根据 xzKx - z^* \in K^\circ,对于任意 xKx \in K,有:

    (xz)Tz0. (x - z^*)^T z^* \leq 0.

    由于 (xz)Tz=0(x - z^*)^T z^* = 0,这意味着 zz^*xxKK 上的投影。

因此,z=ΠK(x)z^* = \Pi_K(x) 当且仅当满足上述条件。

(c) 证明 x=ΠK(x)+ΠK(x)x = \Pi_K(x) + \Pi_{K^\circ}(x)

证明

  1. z=ΠK(x)z^* = \Pi_K(x),根据 (b) 的条件,我们有 xzKx - z^* \in K^\circ

  2. 由于 xzKx - z^* \in K^\circ,我们可以定义 w=ΠK(x)w^* = \Pi_{K^\circ}(x),则有 xz=wx - z^* = w^*

  3. 因此,结合上述结果,我们得到:

    x=z+w=ΠK(x)+ΠK(x). x = z^* + w^* = \Pi_K(x) + \Pi_{K^\circ}(x).

综上所述, x=ΠK(x)+ΠK(x)x = \Pi_K(x) + \Pi_{K^\circ}(x)


问题 2

需要证明以下三个陈述是等价的:

  1. 函数 ffρconvex\rho-convex的,对于某个 ρR \rho \in \mathbb{R}

  2. 函数 (xf(x)+cx2)( x \mapsto f(x) + c\|x\|^2 ) 是凸的。

  3. 对于任意 (x,yRn)( x, y \in \mathbb{R}^n ),有

    f(y)f(x)+f(x),yx12yx2. f(y) \geq f(x) + \langle \nabla f(x), y-x \rangle - \frac{1}{2}\|y-x\|^2.

证明:

(1)\Rightarrow (2)

假设 ffρconvex\rho-convex的。我们考虑函数g(x)=f(x)+cx2g(x) = f(x) + c\|x\|^2 ,我们需要证明 g(x)g(x) 是凸的。

对于任意 x,yRn x, y \in \mathbb{R}^n α(0,1) \alpha \in (0, 1) ,根据 ρconvex\rho - convex性质,有:
f(αx+(1α)y)αf(x)+(1α)f(y)+p(12)αx+(1α)yy2. f(\alpha x + (1-\alpha)y) \leq \alpha f(x) + (1-\alpha)f(y) + p\left(\frac{1}{2}\right)\|\alpha x + (1-\alpha)y - y\|^2.
同时,考虑xy2 \|x - y\|^2的性质,可以得到:
αx+(1α)yy2=α(xy)2=α2xy2. \|\alpha x + (1-\alpha)y - y\|^2 = \|\alpha(x - y)\|^2 = \alpha^2 \|x - y\|^2.
因此:
f(αx+(1α)y)αf(x)+(1α)f(y)+p2α2xy2. f(\alpha x + (1-\alpha)y) \leq \alpha f(x) + (1-\alpha)f(y) + \frac{p}{2} \alpha^2 \|x - y\|^2.
再加上cαx+(1α)y2c\|\alpha x + (1-\alpha)y\|^2的项,结合后可以得到 g g是凸的。

(2)\Rightarrow (3)

假设g(x)=f(x)+cx2 g(x) = f(x) + c\|x\|^2是凸的。根据凸性的定义,对于任意x,yRnx, y \in \mathbb{R}^nalpha(0,1)alpha \in (0, 1),我们有:
g(y)g(x)+g(x),yx. g(y) \geq g(x) + \langle \nabla g(x), y - x \rangle.
展开 g g 的定义,得到:
f(y)+cy2f(x)+cx2+f(x)+2cx,yx. f(y) + c\|y\|^2 \geq f(x) + c\|x\|^2 + \langle \nabla f(x) + 2c x, y - x \rangle.
通过适当的变换,可以得到所需的不等式。

(3)\Rightarrow (1)

假设 (3) 成立。我们需要证明f fρconvex\rho-convex的。根据 (3) 的不等式,我们可以得到:
f(y)f(x)+f(x),yx12yx2. f(y) \geq f(x) + \langle \nabla f(x), y-x \rangle - \frac{1}{2} \|y-x\|^2.
这正是ρconvex\rho-convex性的定义,因此ff是的ρconvex\rho-convex

综上所述,所有三个陈述是等价的。


问题 3

(a) 证明不等式

我们需要证明:
bxf(a)f(b)f(x)f(a)babxba \frac{b-x}{f(a)-f(b)} \leq \frac{f(x)-f(a)}{b-a} \leq \frac{b-x}{b-a}
对于所有x[a,b]x \in [a, b]

  1. 左侧不等式

    • f f 的凸性,对于 x[a,b] x \in [a, b] ,有:
    f(x)f(a)+f(b)f(a)ba(xa). f(x) \geq f(a) + \frac{f(b) - f(a)}{b-a}(x - a).
    • 变形得到:
    f(x)f(a)xaf(b)f(a)ba. \frac{f(x) - f(a)}{x - a} \geq \frac{f(b) - f(a)}{b - a}.
    • 结合 x x 的位置,得到左侧不等式。
  2. 右侧不等式

    • f f 的凸性,对于 x[a,b] x \in [a, b] ,有:
    f(x)f(b)+f(a)f(b)ab(xb). f(x) \leq f(b) + \frac{f(a) - f(b)}{a - b}(x - b).
    • 变形得到:
    f(x)f(b)xbf(a)f(b)ab. \frac{f(x) - f(b)}{x - b} \leq \frac{f(a) - f(b)}{a - b}.
    • 结合 x x 的位置,得到右侧不等式。

因此,两个不等式都成立。

(b) 证明不等式

我们需要证明:
f(x)f(a)f(b)f(a)bxbaf(b)f(x)f(b)f(a) \frac{f(x)-f(a)}{f(b)-f(a)} \leq \frac{b-x}{b-a} \leq \frac{f(b)-f(x)}{f(b)-f(a)}
对于所有 x(a,b) x \in (a, b)

  1. 左侧不等式

    f f 的凸性,对于 x(a,b) x \in (a, b) ,有:

    f(x)f(a)+f(b)f(a)ba(xa). f(x) \geq f(a) + \frac{f(b) - f(a)}{b-a}(x - a).

    变形得到:

    f(x)f(a)f(b)f(a)xaba. \frac{f(x) - f(a)}{f(b) - f(a)} \leq \frac{x - a}{b - a}.
  2. 右侧不等式

    f f 的凸性,对于 x(a,b) x \in (a, b) ,有:

    f(x)f(b)+f(a)f(b)ab(xb). f(x) \leq f(b) + \frac{f(a) - f(b)}{a - b}(x - b).

    变形得到:

    f(b)f(x)f(b)f(a)bxba. \frac{f(b) - f(x)}{f(b) - f(a)} \geq \frac{b - x}{b - a}.

因此,两个不等式都成立。


问题 4

假设 f:RnR f: \mathbb{R}^n \rightarrow \mathbb{R} 是一个凸函数,且在 Rn \mathbb{R}^n 上有界上界。我们需要证明 f f 是常数。

证明

由于 f f 是凸的,任意两个点 x,yRn x, y \in \mathbb{R}^n 有:
f(αx+(1α)y)αf(x)+(1α)f(y)对于所有 α[0,1]. f(\alpha x + (1 - \alpha)y) \leq \alpha f(x) + (1 - \alpha)f(y) \quad \text{对于所有 } \alpha \in [0, 1].
假设 f f 有上界 M M ,即 f(x)M f(x) \leq M 对于所有 xRn x \in \mathbb{R}^n

选择任意 x0Rn x_0 \in \mathbb{R}^n ,并取 y y 趋近于 x0 x_0 ,由于 f f 的连续性,得到:
f(y)f(x0)当 yx0. f(y) \to f(x_0) \quad \text{当 } y \to x_0.
由于 f f 是凸的,且有界,假设 f(x0)<M f(x_0) < M ,则存在 ϵ>0 \epsilon > 0 使得在某个邻域内 f(y) f(y) 也小于 M M

通过选择不同的 x x y y ,可以得到 f f 在整个域内的值都在 [f(x0),M] [f(x_0), M] 之间。

由于 f f 是凸的,且在整个域内有界,最终得到 f f 必须是常数。

因此,得出结论:如果 f f 是凸的并且在 Rn \mathbb{R}^n 上有界,那么 f f 是常数。


问题5:

判断每个函数是否是凸的。

(a) f(x)=ex1 on Rf(x) = e^x - 1 \ on\ \mathbb{R}

解答:

  1. 一阶导数:
f(x)=ex f'(x) = e^x
  1. 二阶导数:

    由于 f(x)=ex>0 f''(x) = e^x > 0 对所有 xR x \in \mathbb{R} 恒成立,因此该函数是 凸的*。

(b) f(x1,x2)=x1x2 f(x_1, x_2) = x_1 x_2 on R++2 \mathbb{R}_{++}^2

解答:

  1. 一阶偏导数:

    fx1=x2,fx2=x1 f_{x_1} = x_2, \quad f_{x_2} = x_1
  2. 二阶偏导数:

    fx1x1=0,fx1x2=1,fx2x1=1,fx2x2=0 f_{x_1 x_1} = 0, \quad f_{x_1 x_2} = 1, \quad f_{x_2 x_1} = 1, \quad f_{x_2 x_2} = 0

Hessian 矩阵为:
H(f)=(0110) H(f) = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}

由于 Hessian 矩阵的特征值为 ±1\pm 1,它并不是半正定的,因此该函数 不是凸的。

(c) f(x1,x2)=1x1x2 f(x_1, x_2) = \frac{1}{x_1 x_2} on R++2 \mathbb{R}_{++}^2

解答:

  1. 一阶偏导数:

    fx1=1x12x2,fx2=1x1x22 f_{x_1} = -\frac{1}{x_1^2 x_2}, \quad f_{x_2} = -\frac{1}{x_1 x_2^2}
  2. 二阶偏导数:

    fx1x1=2x13x2,fx1x2=1x12x22,fx2x1=1x12x22,fx2x2=2x1x23 f_{x_1 x_1} = \frac{2}{x_1^3 x_2}, \quad f_{x_1 x_2} = \frac{1}{x_1^2 x_2^2}, \quad f_{x_2 x_1} = \frac{1}{x_1^2 x_2^2}, \quad f_{x_2 x_2} = \frac{2}{x_1 x_2^3}

Hessian 矩阵为:
H(f)=(2x13x21x12x221x12x222x1x23) H(f) = \begin{pmatrix} \frac{2}{x_1^3 x_2} & \frac{1}{x_1^2 x_2^2} \\ \frac{1}{x_1^2 x_2^2} & \frac{2}{x_1 x_2^3} \end{pmatrix}

检查 Hessian 矩阵的正定性,经过计算可得该矩阵是正定的,因此函数 f(x1,x2)=1x1x2 f(x_1, x_2) = \frac{1}{x_1 x_2} 是凸的。

(d) f(x1,x2)=x1x2 f(x_1, x_2) = \frac{x_1}{x_2} on R++2 \mathbb{R}_{++}^2

解答:

计算一阶和二阶偏导数:

  1. 一阶偏导数:

    fx1=1x2,fx2=x1x22 f_{x_1} = \frac{1}{x_2}, \quad f_{x_2} = -\frac{x_1}{x_2^2}
  2. 二阶偏导数:

    fx1x1=0,fx1x2=0,fx2x1=0,fx2x2=2x1x23 f_{x_1 x_1} = 0, \quad f_{x_1 x_2} = 0, \quad f_{x_2 x_1} = 0, \quad f_{x_2 x_2} = \frac{2x_1}{x_2^3}

Hessian 矩阵为:
H(f)=(0002x1x23) H(f) = \begin{pmatrix} 0 & 0 \\ 0 & \frac{2x_1}{x_2^3} \end{pmatrix}

Hessian 矩阵的特征值为 0 0 2x1x23 \frac{2x_1}{x_2^3} 。对于 x1,x2>0 x_1, x_2 > 0 ,第二个特征值大于零,因此该函数是凸的。

(e) f(x1,x2)=x12x2 f(x_1, x_2) = \frac{x_1^2}{x_2} on R×R++ \mathbb{R} \times \mathbb{R}_{++}

解答:

我们计算一阶和二阶偏导数:

  1. 一阶偏导数:

    fx1=2x1x2,fx2=x12x22 f_{x_1} = \frac{2x_1}{x_2}, \quad f_{x_2} = -\frac{x_1^2}{x_2^2}
  2. 二阶偏导数:

    fx1x1=2x2,fx1x2=2x1x22,fx2x1=2x1x22,fx2x2=2x12x23 f_{x_1 x_1} = \frac{2}{x_2}, \quad f_{x_1 x_2} = -\frac{2x_1}{x_2^2}, \quad f_{x_2 x_1} = -\frac{2x_1}{x_2^2}, \quad f_{x_2 x_2} = \frac{2x_1^2}{x_2^3}

Hessian 矩阵为:
H(f)=(2x22x1x222x1x222x12x23) H(f) = \begin{pmatrix} \frac{2}{x_2} & -\frac{2x_1}{x_2^2} \\ -\frac{2x_1}{x_2^2} & \frac{2x_1^2}{x_2^3} \end{pmatrix}

Hessian 矩阵的特征值不完全为正,因此该函数不是凸的。

(f) f(x1,x2)=x1αx21α f(x_1, x_2) = x_1^\alpha x_2^{1-\alpha} where 0α1 0 \leq \alpha \leq 1 on R++2 \mathbb{R}_{++}^2

解答:

这是一个均匀函数,它是凸函数。


题目6:

要证明函数

f(x)=(i=1nxip)1/p,定义域为 R+ f(x) = \left( \sum_{i=1}^{n} x_i^p \right)^{1/p}, \quad \text{定义域为 } \mathbb{R}^+

解答:

a. 齐次性

函数 f(x) f(x) 是正齐次函数,即 f(kx)=kf(x) f(k\mathbf{x}) = kf(\mathbf{x}) 对任意 k>0 k > 0 成立。

b. Minkowski 不等式

对于 p<1 p < 1 ,Minkowski 不等式表明 p p -范数是凹函数。具体来说,对于任意 x,yR+ \mathbf{x}, \mathbf{y} \in \mathbb{R}^+ ,有:
(i=1n(λxi+(1λ)yi)p)1/pλ(i=1nxip)1/p+(1λ)(i=1nyip)1/p. \left( \sum_{i=1}^{n} (\lambda x_i + (1-\lambda) y_i)^p \right)^{1/p} \geq \lambda \left( \sum_{i=1}^{n} x_i^p \right)^{1/p} + (1-\lambda) \left( \sum_{i=1}^{n} y_i^p \right)^{1/p}.

该不等式成立是因为 p<1 p < 1 导致函数具有次可加性。

c. 二阶导数验证(可选)

虽然对于该多元函数,直接计算二阶导数较为复杂,但通过上述不等式分析已可证明凹性。

由于 p<1 p < 1 ,函数

f(x)=(i=1nxip)1/p f(x) = \left( \sum_{i=1}^{n} x_i^p \right)^{1/p}

满足凹性定义,其次可加性确保其是一个凹函数。