近端策略优化相关论文
为了解决数字孪生边缘网络数据共享面临的隐私和安全问题,提出一种基于区块链分片的数字孪生边缘网络数据安全共享机制。考虑动态时......
面对复杂的三维环境,传统的路径规划算法计算复杂度极度增加,失去了原有的效果。深度强化学习可以不依赖于精确的环境模型,其总体效率......
调头任务是自动驾驶研究的内容之一,大多数在城市规范道路下的方案无法在非规范道路上实施。针对这一问题,建立了一种车辆掉头动力学......
针对无人机近距空战的自主决策问题,提出了一种基于近端策略优化(PPO)算法的无人机自主引导方法。针对敌我距离、角度、速度以及任务......
随着综合能源系统中间歇性能源和负荷不确定性的逐步增强,传统的调度方法局限于固定物理模型及参数设定,难以较好地动态响应源荷的随......
随着传感器以及电机、微型处理器的发展,各类无人机在各个领域获得了广泛的应用。各类飞行任务也对无人机飞行的自主性提出了更高......
针对空中对接任务中的目标自主跟踪问题,提出了一种基于深度强化学习的端到端的目标跟踪方法;该方法采用近端策略优化算法,Actor网络......
提出一种结合深度特征与美学特征的图像增强方法.首先,结合多种图像特征重构智能体评估网络,该网络通过拼接图像语义特征、图像色彩......
针对多无人艇对海上逃逸目标的围捕问题,提出了一种基于多智能体强化学习的围捕算法.首先,以无人艇协同进攻为背景建立无边界围捕......
采用电推力器实现自主轨道转移是全电推进卫星领域的关键技术之一。针对地球同步轨道(geostationary orbit, GEO)全电推进卫星的轨道......
为解决数量不定的同构水面无人艇(USV)集群以期望队形协同集结的问题,提出了一种基于多智能体深度强化学习的分布式控制方法。首先,针......
针对无人机地面动态目标跟踪问题,建立了远距离自主引导与近距离伴飞避障两个阶段的马尔可夫决策过程模型。在此基础上,提出了一种改......
无线通信系统的信道开放性使其极易受到外部恶意干扰、通信链路质量难以保证,针对以上问题,本文设计了一种基于深度强化学习的多域联......
针对传统的火力分配算法仅适用于静态火力分配,无法估计战场态势的实时变化。文章提出多智能体近端策略优化方法,该方法可以处理分布......
新能源和负荷波动给无功优化带来更大的挑战。本文考虑新能源和负荷时变特性,将无功优化问题构建成强化学习问题。提出了约束—目标......
面对高维连续状态空间或稀疏奖励等复杂任务时,仅依靠深度强化学习算法从零学习最优策略十分困难,如何将已有知识表示为人和学习型......
传统的机器人局部路径规划方法多为已有先验地图的情况设计,导致其在与视觉SLAM结合的导航中效果不佳。为此传统的机器人局部路径规......
全球气候变化对人类生产生活的不利影响越来越突出,已经成为人类社会共同面临的最严峻挑战之一。为应对全球气候变化,我国提出在20......
在深度强化学习等人工智能领域蓬勃发展的今天,机器人应用的智能化升级仍然进展缓慢,在机器人作业生产线上,机器人一些基本的抓取......
六足机器人由于具有运动方式多样、稳定性好、承载力强等优点,面对复杂的、非结构化的地形具有较强的适应能力,其应用场景较为广泛......
针对无人机在电力巡检中的全自主性进行研究,提出全自主电力巡检系统,该系统由无人机智能体、充电桩和待巡检目标构成.借助无线充......
针对在Unity3D游戏引擎的复杂环境中进行学习和控制的问题,探讨了深度增强学习训练框架的设计和实现.利用Unity3D实现了三个游戏场......
强化学习领域中策略单调提升的优化算法是目前的一个研究热点,在离散型和连续型控制任务中都具有了良好的性能表现.近端策略优化(P......
智能汽车作为智能交通系统重要组成部分之一,其有助于缓解交通拥堵、减少交通事故等,是当前车辆工程领域研究的热点。在智能汽车搭......
对话生成是自然语言处理的重点研究方向。随着深度学习的兴起,对话生成得到了较快的发展。但是还存在一定的挑战,首先,生成回复的......
针对铝电解过程中参数调控没有科学的标准问题,本文探索了利用深度强化学习训练智能体,代替工艺人员对铝电解过程进行参数控制的离......
为优化虚拟数据空间网络传输性能,提出了基于近端策略优化的智能TCP拥塞控制算法TCP-PPO2。将TCP拥塞控制过程抽象为一个可部分观......
针对一种大地图和稀疏奖励的兵棋推演对抗环境下,单纯的深度强化学习算法会导致训练无法快速收敛以及智能体对抗特定规则智能体胜......
进入到21世纪后,随着科技的发展以及工业4.0和中国智能制造2025等概念的提出,传统制造业正在经历着巨大的变革。AGV作为自动化仓储......
目前,深度强化学习(Deep Reinforcement Learning,DRL)已成为人工智能领域中重要的前沿方向,在各个领域中基于DRL方法的应用都已取......
对话生成是自然语言处理的重点研究方向,对抗生成网络GAN最近在对话生成领域得到了较好的应用。为了进一步改善对话生成的质量,并......
目前的DASH客户端码率决策依赖基于特定环境的低准确性的建模来实现固定的控制算法,很难捕获和反映真实网络环境中动态网络的变化......
足式机器人步态控制是机器人研究领域的难点问题,应用强化学习让机器人自主学习策略提供了一种很好的解决思路.基于ROS机器人操作......