✍️
mathematics_basic_for_ML
  • README
  • README
    • Summary
    • Geometry
      • EulerAngle
      • Gimbal lock
      • Quaternion
      • RiemannianManifolds
      • RotationMatrix
      • SphericalHarmonics
    • Information
      • Divergence
      • 信息熵 entropy
    • LinearAlgebra
      • 2D仿射变换(2D Affine Transformation)
      • 2DTransformation
      • 3D变换(3D Transformation)
      • ComplexTransformation
      • Conjugate
      • Hessian
      • IllConditioning
      • 逆变换(Inverse transform)
      • SVD
      • det
      • eigendecomposition
      • 矩阵
      • norm
      • orthogonal
      • special_matrix
      • trace
      • vector
    • Mathematics
      • Complex
      • ExponentialDecay
      • average
      • calculus
      • convex
      • derivative
      • 距离
      • function
      • space
      • Formula
        • euler
        • jensen
        • taylor
        • trigonometric
    • Numbers
      • 几何级数
      • SpecialNumbers
    • NumericalComputation
      • ConstrainedOptimization
      • GradientDescent
      • Newton
      • Nominal
      • ODE_SDE
      • Preprocessing
    • Probability
      • bayes
      • distribution
      • expectation_variance
      • 贝叶斯公式
      • functions
      • likelihood
      • mixture_distribution
      • 一些术语
      • probability_distribution
Powered by GitBook
On this page

Was this helpful?

  1. README
  2. NumericalComputation

ConstrainedOptimization

约束优化是指在x的某些集合S中找到f(x)的最大值或最小值。 集合S内的点称为s的可行点。

求解方法:KKT KKT方法是将原始的约束优化问题转换为一无约束的优化问题。

  1. 将S描述为m个等式g(i)(x)=0g^{(i)}(x)=0g(i)(x)=0和n个不等式h(j)(x)<0h^{(j)}(x)<0h(j)(x)<0。

  2. 为每个约束引入新的变量λi\lambda_iλi​和αj\alpha_jαj​

  3. 定义广义Lagrangian函数为:

L(x,λ,α)=f(x)+∑iλig(i)(x)+∑jαjh(j)(x)L(x,\lambda,\alpha) = f(x) + \sum_i \lambda_i g^{(i)}(x) + \sum_j \alpha_j h^{(j)}(x)L(x,λ,α)=f(x)+i∑​λi​g(i)(x)+j∑​αj​h(j)(x)
  1. 通过优化无约束的广义Lagrangian 解决约束最小化问题。以下两个公式具有相同的最优点集x。

min⁡xmax⁡λmax⁡α,α>0L(x,λ,α)(1)min⁡x∈Sf(x)(2)\begin{aligned} \min_x\max_{\lambda}\max_{\alpha,\alpha>0}L(x,\lambda,\alpha) && (1)\\ \min_{x\in S}f(x) && (2) \end{aligned}xmin​λmax​α,α>0max​L(x,λ,α)x∈Smin​f(x)​​(1)(2)​

在公式(1)中,保证可行点不是最佳,可行点范围内的最优点不变。

[?]后面的不太懂

PreviousNumericalComputationNextGradientDescent

Last updated 2 years ago

Was this helpful?