最优控制理论

动态最优化问题一般有三种处理办法:

  1. 变分法;
  2. 贝尔曼方程;
  3. 最优控制理论。

变分法的目标是找到状态变量 y 的最优时间路径,最优控制理论的目标是找到控制变量 u 的最优时间路径。

最优控制问题的特殊性质:

  1. 控制变量的时间路径只需要分段连续性(piecewise continuous);
  2. 状态变量的时间路径只需要分段可微性(piecewise differentiable)

最优控制的最简单问题可以表达为

max V=0TF(t,y,u)dts.t. y˙=f(t,y,u) y(0)=A,y(T)自由 u(t)Ut[0,T]

根据函数 f 可知,在初始时间有 t=0y(0)=A,因此只需要选择 u(0) 就可以得到 y˙(0) ,从而决定 y(1),接着只需要选择 u(1),以此类推……因此 y˙=f() 称为状态变量的运动方程(equation of motion),或简称为状态方程

Hamiltonian function

一般地,Hamiltonian function 的定义式为

H(t,y,u,λ)λ0F(t,y,u)+λ(t)f(t,y,u)

其中 λ00 是一个常数,但 λ0=0 十分罕见且缺乏经济意义,所以将其标准化为 1 更常规,即

H(t,y,u,λ)F(t,y,u)+λ(t)f(t,y,u)

其中 λ(t) 称为共态变量(costate variable)或辅助变量(auxiliary variable),用于衡量状态变量的影子价格。

The maximum principle

Hu=0Hy=λ˙Hλ=y˙λ(T)=0

current-value Hamiltonian function

考虑被积函数含有贴现因子的情形,即

F(t,y,u)=G(t,y,u)eρt

定义 current-value Hamiltonian function 为

H^Heρt=G(t,y,u)+μf(t,y,u)

其中 λ=μeρtμλeρt

此时最大值原理修改为

H^u=0H^y=μ˙+ρμH^μ=y˙λ(T)=m(T)eρT=0

其中

H^yHyeρtHy=λ˙λ˙=μ˙eρtρμeρt}H^y=μ˙+ρμ