一般情形下的平均场随机最大值原理

来源 :山东大学 | 被引量 : 0次 | 上传用户:ssskkkmmm77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文中,考虑了两种平均场类型的随机控制问题,状态方程的系数依赖于解以及解的分布,且代价泛函也是平均场类型的。  我们首先来看如下的状态过程,平均场SDE的控制问题:  {dXt=b(Xt,PXt,vt)dt+σ(Xt,PXt,vt)dBt,(1)X0=x,t≥0.  代价泛函为J(v)=E[Φ(XT,PXT)+∫T0h(Xt,PXt,vt)d].(2)  有如下假设:  (H3.1)  (1)b(x,μ,v):Rn×P2(Rn)×U→Rn.σ(x,μ,v):Rn×P2(Rn)×U→Rn×d.h(x,μ,v):Rn×P2(Rn)×U→R.Φ(x,μ):Rn×P2(Rn)→R,x∈Rn,μ∈P2(Rn),v∈U.分别对(x,μ,v)和(x,μ)是可导的。  (2)b,σ关于(x,μ,v)的导数满足Lipschitz条件并有界。  (3)h,Φ关于(x,μ,v)和(x,μ)的导数是Lipschitz连续的且被C(1+|x|+|v|)和C(1+|x|)界住。  (4)b,σ关于(x,μ)是Lipschitz连续和线性增长的,关于控制v是一致的。(H3.2)H(x,μ,p,q,v)关于v是凸的。  在控制域为凸的情况下,我们考虑使得代价泛函达到最小值随机最优控制所满足的条件。通过凸扰动和对偶的技巧得到最优化控制的必要条件,也得到了控制最优的充分条件。  我们接下来看如下的状态过程,解耦的控制问题:  {dXut=b(Xut,Pxut,ut)dt+σ(Xut,Pxut,ut)dBt,dYut=-f(Xut,Yut,Zut,P(Xut,Yut,Zut),ut)dt+ZutdBt,(3)Xu0=ζ,YuT=Φ(XuT,PXuT).  其中b,σ,f,Φ是给定的映射且初值ζ是一个F0可测的随机变量。有如下假设:  (H4.1)  (1)b(x,μ,u):R×P2(R)×U→R.σ(x,μ,u):R×P2(R)×U→R.f(x,y,z,v,u):R×R×R×P2(R3)×U→R.Φ(x,μ):R×P2(R)→R.  分别对(x,μ,u),(x,y,z,v,u)和(x,μ)是可导的。  (2)b,σ,f关于(x,μ,u),(x,y,z,v,u)的导数是Lipschitz连续的且有界。  (3)Φ关于(x,μ)的导数是Lipschitz连续的且被C(1+|x|)界住。  (4)对任意的控制u,f(·,0,0,δ0,u)∈H2F(0,T;Rm)。  (5)b,σ关于(x,μ)是Lipschitz连续和线性增长的,f关于(x,y,z,v)是Lipschitz连续的,关于控制u是一致的。  代价泛函为J(u)=E[Y0].(4)  同理,我们利用凸扰动和对偶的技巧,便可以得到满足最优控制的必要条件。
其他文献
II-型模糊集作为I-型模糊集的扩展,能够更好地表达和处理复杂的不确定性问题,已经在空间数据挖掘、模糊控制、模式识别等方面得到了广泛的应用和发展。不过,II-型模糊集的理
图论与组合数学是数学的一个分支,它的历史可以追溯到18世纪,最早来源于Euler关于哥尼斯堡七桥问题的研究,并且至今仍然具有很强的活力.它在计算机科学,生命科学以及其它科学中具
最早的传染病模型是由Kermack-McKendrick提出的,其目的是通过对模型的动力学性质分析,从而使人们认识传染病的传播机制及传播规律。并且,模型能预测传染病的发展趋势,寻求对
支持向量机作为一种新的基于统计学习理论的机器学习方法,是对传统的机器学习方法的一个很好的替代,其在小样本、高维空间和非线性情况下表现出许多特有的优势。现存的支持向量
集值优化的对偶理论在集值优化理论中占有极其重要地位,它的理论和方法被广泛应用于微分包含、博弈论、经济平衡问题等领域,而且它对集值最优化问题的求解及最优性条件的确定等
学位