论文部分内容阅读
本文中,考虑了两种平均场类型的随机控制问题,状态方程的系数依赖于解以及解的分布,且代价泛函也是平均场类型的。 我们首先来看如下的状态过程,平均场SDE的控制问题: {dXt=b(Xt,PXt,vt)dt+σ(Xt,PXt,vt)dBt,(1)X0=x,t≥0. 代价泛函为J(v)=E[Φ(XT,PXT)+∫T0h(Xt,PXt,vt)d].(2) 有如下假设: (H3.1) (1)b(x,μ,v):Rn×P2(Rn)×U→Rn.σ(x,μ,v):Rn×P2(Rn)×U→Rn×d.h(x,μ,v):Rn×P2(Rn)×U→R.Φ(x,μ):Rn×P2(Rn)→R,x∈Rn,μ∈P2(Rn),v∈U.分别对(x,μ,v)和(x,μ)是可导的。 (2)b,σ关于(x,μ,v)的导数满足Lipschitz条件并有界。 (3)h,Φ关于(x,μ,v)和(x,μ)的导数是Lipschitz连续的且被C(1+|x|+|v|)和C(1+|x|)界住。 (4)b,σ关于(x,μ)是Lipschitz连续和线性增长的,关于控制v是一致的。(H3.2)H(x,μ,p,q,v)关于v是凸的。 在控制域为凸的情况下,我们考虑使得代价泛函达到最小值随机最优控制所满足的条件。通过凸扰动和对偶的技巧得到最优化控制的必要条件,也得到了控制最优的充分条件。 我们接下来看如下的状态过程,解耦的控制问题: {dXut=b(Xut,Pxut,ut)dt+σ(Xut,Pxut,ut)dBt,dYut=-f(Xut,Yut,Zut,P(Xut,Yut,Zut),ut)dt+ZutdBt,(3)Xu0=ζ,YuT=Φ(XuT,PXuT). 其中b,σ,f,Φ是给定的映射且初值ζ是一个F0可测的随机变量。有如下假设: (H4.1) (1)b(x,μ,u):R×P2(R)×U→R.σ(x,μ,u):R×P2(R)×U→R.f(x,y,z,v,u):R×R×R×P2(R3)×U→R.Φ(x,μ):R×P2(R)→R. 分别对(x,μ,u),(x,y,z,v,u)和(x,μ)是可导的。 (2)b,σ,f关于(x,μ,u),(x,y,z,v,u)的导数是Lipschitz连续的且有界。 (3)Φ关于(x,μ)的导数是Lipschitz连续的且被C(1+|x|)界住。 (4)对任意的控制u,f(·,0,0,δ0,u)∈H2F(0,T;Rm)。 (5)b,σ关于(x,μ)是Lipschitz连续和线性增长的,f关于(x,y,z,v)是Lipschitz连续的,关于控制u是一致的。 代价泛函为J(u)=E[Y0].(4) 同理,我们利用凸扰动和对偶的技巧,便可以得到满足最优控制的必要条件。