首页 > 期刊导航 > 逻辑伦理测绘学报 2026年3期 > 2026年2期 > 多维偏好增强型对抗深度强化学习驱动的行人路径规划
多维偏好增强型对抗深度强化学习驱动的行人路径规划
简介:随着智慧城市与精准导航技术的发展,行人路径规划正从单一效率导向转向多维个性化需求驱动,旨在构建融合复杂城市环境与用户偏好的路径规划模型,提供高效灵活的个性化推荐.然而,现有研究仍面临群体差异建模不足、动态偏好机制缺失及复杂场景适应性有限等关键挑战.本文提出一种基于多维偏好建模与对抗深度强化学习的行人路径规划方法.该方法首先构建"情境感知-动态修正"多维偏好模型,为行人路径选择提供动态偏好权重,辅助深度强化学习网络奖励函数重塑,形成"效率-安全-舒适"多目标协同优化机制;然后,构建偏好增强型对抗深度强化学习算法(PEA-DQN),通过引入双经验池预训练策略和自适应训练机制,加速模型收敛并避免冗余计算.试验以武汉市为例,验证PEA-DQN训练得到的模型在混合路网动态干扰情况下的路径规划性能.结果表明:与DQN算法相比,PEA-DQN在路径规划任务中的避障成功率提升超过50%,平均路径长短缩短40.40%;在消融试验中,相较于Dueling DQN,引入多目标奖励函数后的路径质量提升100.4%,自适应机制使算法在动态障碍场景中的计算效率提升40%.PEA-DQN的综合性能显著优于动态A*算法及其他同类深度强化学习方法.展开
学者:冉耘博杨雪周文豪吴承恩周宝定唐炉亮李清泉
关键词:行人路径规划深度强化学习多维偏好建模个性化出行
分类号:P208(一般性问题)
资助基金:
论文发表日期:
在线出版日期:2026-04-01 (网站首发日期)
页数:15(191-205)
测绘学报 2026年3期
ISSN:
年,卷(期):2026,55(2)
所属栏目:逻辑伦理