近端策略优化相关硕士博士期刊学术论文

近端策略优化相关论文

面向数字孪生边缘网络的区块链分片及资源自适应优化机制

为了解决数字孪生边缘网络数据共享面临的隐私和安全问题，提出一种基于区块链分片的数字孪生边缘网络数据安全共享机制。考虑动态时......

期刊

数字孪生边缘网络区块链分片近端策略优化

改进PPO算法的AUV路径规划研究

面对复杂的三维环境，传统的路径规划算法计算复杂度极度增加，失去了原有的效果。深度强化学习可以不依赖于精确的环境模型，其总体效率......

期刊

AUV 路径规划近端策略优化深度强化学习

基于分层强化学习的自动驾驶车辆掉头问题研究

调头任务是自动驾驶研究的内容之一，大多数在城市规范道路下的方案无法在非规范道路上实施。针对这一问题，建立了一种车辆掉头动力学......

期刊

分层强化学习汽车掉头稀疏奖励近端策略优化

基于PPO算法的无人机近距空战自主引导方法

针对无人机近距空战的自主决策问题，提出了一种基于近端策略优化（PPO）算法的无人机自主引导方法。针对敌我距离、角度、速度以及任务......

期刊

近距空战近端策略优化自主引导长短时记忆网络

基于强化学习的高速公路自动驾驶决策方法研究

近年来,各种基于人工智能的应用在越来越多的领域中逐步取得比原有方法更好的效果。其中,自动驾驶逐渐成为人工智能领域最重要的落......

学位

强化学习车道跟随自动超车深度确定性策略梯度近端策略优化

不确定性环境下基于深度强化学习的综合能源系统动态调度

随着综合能源系统中间歇性能源和负荷不确定性的逐步增强，传统的调度方法局限于固定物理模型及参数设定，难以较好地动态响应源荷的随......

期刊

综合能源系统动态调度不确定性深度强化学习近端策略优化

基于深度强化学习的四旋翼无人机控制方法研究

随着传感器以及电机、微型处理器的发展,各类无人机在各个领域获得了广泛的应用。各类飞行任务也对无人机飞行的自主性提出了更高......

学位

四旋翼无人机模型预测控制深度强化学习反馈线性化近端策略优化

基于深度强化学习的无人机空中目标自主跟踪

针对空中对接任务中的目标自主跟踪问题，提出了一种基于深度强化学习的端到端的目标跟踪方法；该方法采用近端策略优化算法，Actor网络......

期刊

深度强化学习近端策略优化无人机目标跟踪端到端

多特征融合的深度强化学习色彩增强方法

提出一种结合深度特征与美学特征的图像增强方法.首先，结合多种图像特征重构智能体评估网络，该网络通过拼接图像语义特征、图像色彩......

期刊

图像增强深度强化学习近端策略优化深度特征美学特征

基于深度强化学习的无人艇轨迹跟踪算法研究

针对欠驱动水面无人艇（USV）轨迹跟踪控制问题，提出一种基于近端策略优化（PPO）的深度强化学习轨迹跟踪控制算法．为引导控制器网络的正确收......

期刊

无人艇轨迹跟踪深度强化学习近端策略优化轨迹任务数据集

基于多智能体强化学习的无人艇协同围捕方法研究

针对多无人艇对海上逃逸目标的围捕问题,提出了一种基于多智能体强化学习的围捕算法.首先,以无人艇协同进攻为背景建立无边界围捕......

期刊

无人艇多智能体强化学习深度学习协同围捕近端策略优化

基于强化学习的全电推进卫星变轨优化方法

采用电推力器实现自主轨道转移是全电推进卫星领域的关键技术之一。针对地球同步轨道（geostationary orbit, GEO）全电推进卫星的轨道......

期刊

全电推进卫星小推力变轨优化强化学习近端策略优化训练加速方法

基于多智能体强化学习的无人艇集群集结方法

为解决数量不定的同构水面无人艇（USV）集群以期望队形协同集结的问题，提出了一种基于多智能体深度强化学习的分布式控制方法。首先，针......

期刊

无人艇集群系统多智能体强化学习深度强化学习集结算法近端策略优化

无人机自主引导跟踪与避障的近端策略优化

针对无人机地面动态目标跟踪问题，建立了远距离自主引导与近距离伴飞避障两个阶段的马尔可夫决策过程模型。在此基础上，提出了一种改......

期刊

多旋翼无人机自主引导马尔可夫决策过程近端策略优化长短期记忆

基于深度强化学习的多域联合干扰规避

无线通信系统的信道开放性使其极易受到外部恶意干扰、通信链路质量难以保证，针对以上问题，本文设计了一种基于深度强化学习的多域联......

期刊

干扰规避深度强化学习近端策略优化

基于多智能体近端策略优化的分布式动态火力分配方法

针对传统的火力分配算法仅适用于静态火力分配，无法估计战场态势的实时变化。文章提出多智能体近端策略优化方法，该方法可以处理分布......

期刊

动态火力分配分布式多智能体深度强化学习近端策略优化

基于深度强化学习近端策略优化的电网无功优化方法

新能源和负荷波动给无功优化带来更大的挑战。本文考虑新能源和负荷时变特性，将无功优化问题构建成强化学习问题。提出了约束—目标......

期刊

无功优化新型电力系统深度强化学习近端策略优化数据驱动

融合认知行为模型的深度强化学习框架及算法

面对高维连续状态空间或稀疏奖励等复杂任务时,仅依靠深度强化学习算法从零学习最优策略十分困难,如何将已有知识表示为人和学习型......

期刊

认知行为模型强化学习近端策略优化深度Q网络 BDI GOAL 空战机动决策

基于深度强化学习的室内视觉局部路径规划

传统的机器人局部路径规划方法多为已有先验地图的情况设计，导致其在与视觉SLAM结合的导航中效果不佳。为此传统的机器人局部路径规......

期刊

视觉导航深度学习强化学习局部路径规划避障视觉SLAM 近端策略优化移动机器人

基于深度强化学习的实时家庭需求响应策略研究

全球气候变化对人类生产生活的不利影响越来越突出,已经成为人类社会共同面临的最严峻挑战之一。为应对全球气候变化,我国提出在20......

学位

家庭需求响应深度强化学习模仿学习近端策略优化

基于深度强化学习的机器人智能抓取控制技术

在深度强化学习等人工智能领域蓬勃发展的今天,机器人应用的智能化升级仍然进展缓慢,在机器人作业生产线上,机器人一些基本的抓取......

学位

机器人抓取控制深度强化学习异步训练近端策略优化

基于深度强化学习的六足机器人运动规划

六足机器人由于具有运动方式多样、稳定性好、承载力强等优点,面对复杂的、非结构化的地形具有较强的适应能力,其应用场景较为广泛......

学位

六足机器人运动规划深度强化学习近端策略优化课程学习

基于强化学习的无人机全自主电力巡检

针对无人机在电力巡检中的全自主性进行研究,提出全自主电力巡检系统,该系统由无人机智能体、充电桩和待巡检目标构成.借助无线充......

期刊

电力巡检强化学习近端策略优化无线充电能量优化

面向Unity3D的深度增强学习训练框架研究

针对在Unity3D游戏引擎的复杂环境中进行学习和控制的问题,探讨了深度增强学习训练框架的设计和实现.利用Unity3D实现了三个游戏场......

期刊

Unity3D 深度增强学习近端策略优化

面向云网融合SaaS安全的虚拟网络功能映射方法

在云网融合背景下,承载软件即服务(SaaS)业务功能的云基础设施可能横跨多个数据中心和归属网络,难以保证云资源安全可控.为缩短Saa......

期刊

云计算软件即服务云网融合虚拟网络映射网络空间拟态防御服务功能链近端策略优化

基于自指导动作选择的近端策略优化算法

强化学习领域中策略单调提升的优化算法是目前的一个研究热点,在离散型和连续型控制任务中都具有了良好的性能表现.近端策略优化(P......

期刊

强化学习深度强化学习策略梯度近端策略优化自指导

基于元强化学习的无人驾驶车辆行为决策研究

智能汽车作为智能交通系统重要组成部分之一,其有助于缓解交通拥堵、减少交通事故等,是当前车辆工程领域研究的热点。在智能汽车搭......

学位

无人驾驶近端策略优化元学习多智能体强化学习行为决策

基于近端策略优化与对抗学习的对话生成方法研究

对话生成是自然语言处理的重点研究方向。随着深度学习的兴起,对话生成得到了较快的发展。但是还存在一定的挑战,首先,生成回复的......

学位

对话生成近端策略优化强化学习对抗生成网络序列到序列模型

基于改进RMSProp-PPO算法的铝电解参数寻优模型

针对铝电解过程中参数调控没有科学的标准问题,本文探索了利用深度强化学习训练智能体,代替工艺人员对铝电解过程进行参数控制的离......

期刊

铝电解多参数 RMSProp 深度强化学习奖励机制近端策略优化

基于深度强化学习的能源互联网智能巡检任务分配机制

在能源互联网中引入无人机进行电力线路巡查,并借助移动边缘计算技术实现巡检任务的接入和处理,可降低服务成本,提高工作效率。但......

期刊

巡检无人机任务卸载近端策略优化李雅普诺夫优化人工智能

面向虚拟数据空间的智能TCP拥塞控制算法

为优化虚拟数据空间网络传输性能,提出了基于近端策略优化的智能TCP拥塞控制算法TCP-PPO2。将TCP拥塞控制过程抽象为一个可部分观......

期刊

虚拟数据空间近端策略优化拥塞控制 TCP

基于近端策略优化的作战实体博弈对抗算法

针对一种大地图和稀疏奖励的兵棋推演对抗环境下,单纯的深度强化学习算法会导致训练无法快速收敛以及智能体对抗特定规则智能体胜......

期刊

兵棋推演深度强化学习监督学习近端策略优化稀疏奖励 wargame deduction deep reinforcement learning super

仓储搬运机器人路径规划仿真研究

进入到21世纪后,随着科技的发展以及工业4.0和中国智能制造2025等概念的提出,传统制造业正在经历着巨大的变革。AGV作为自动化仓储......

学位

AGV 任务调度路径规划无先验知识近端策略优化

基于强化学习的机械臂自学习控制

目前,深度强化学习(Deep Reinforcement Learning,DRL)已成为人工智能领域中重要的前沿方向,在各个领域中基于DRL方法的应用都已取......

学位

机械臂控制策略深度强化学习确定性策略梯度近端策略优化

基于近端策略优化与对抗学习的对话生成

对话生成是自然语言处理的重点研究方向,对抗生成网络GAN最近在对话生成领域得到了较好的应用。为了进一步改善对话生成的质量,并......

期刊

对话生成近端策略优化强化学习对抗生成网络序列到序列模型 dialog generationproximal policy optimization(PP

基于强化学习的DASH自适应码率决策算法研究

目前的DASH客户端码率决策依赖基于特定环境的低准确性的建模来实现固定的控制算法,很难捕获和反映真实网络环境中动态网络的变化......

期刊

自适应流媒体传输 DASH 深度强化学习近端策略优化 HTTP adaptive streamingDASHdeep reinforcement learni

基于近端策略优化算法的四足机器人步态控制研究

足式机器人步态控制是机器人研究领域的难点问题,应用强化学习让机器人自主学习策略提供了一种很好的解决思路.基于ROS机器人操作......

期刊

深度强化学习近端策略优化机器人控制 deep reinforcement learningproximal policy optimizationrobot

基于强化学习的无地图导航策略研究

导航即机器人从当前位置到达目标姿态,并在这个过程中不与任一障碍物发生碰撞的能力,是移动机器人的核心功能之一。目前已有的成熟......

学位

无地图导航强化学习近端策略优化 RGB图像采样效率推理堆叠长短时记忆

看过本文同时还关注