随机平稳策略相关论文
基于性能势理论和等价Markov过程方法,研究了一类半Markov决策过程(SMDP)在参数化随机平稳策略下的仿真优化算法,并简要分析了算法的收......
论文在Markov性能势理论基础上, 研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法;分析了它......