留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于DQN的车辆驾驶行为决策方法

罗鹏 黄珍 秦易晋 陈志军

罗鹏, 黄珍, 秦易晋, 陈志军. 基于DQN的车辆驾驶行为决策方法[J]. 交通信息与安全, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008
引用本文: 罗鹏, 黄珍, 秦易晋, 陈志军. 基于DQN的车辆驾驶行为决策方法[J]. 交通信息与安全, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008
LUO Peng, HUANG Zhen, QING Yijin, CHEN Zhijun. A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm[J]. Journal of Transport Information and Safety, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008
Citation: LUO Peng, HUANG Zhen, QING Yijin, CHEN Zhijun. A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm[J]. Journal of Transport Information and Safety, 2020, 38(5): 67-77,112. doi: 10.3963/j.jssn.1674-4861.2020.05.008

基于DQN的车辆驾驶行为决策方法

doi: 10.3963/j.jssn.1674-4861.2020.05.008
基金项目: 

国家重点研发计划项目

湖北省创新群体项目

详细信息
  • 中图分类号: U471.1

A Method of Vehicle Driving Behavior Decision Based on DQN Algorithm

  • 摘要: 针对传统DQN算法下网联车驾驶行为决策的动作选择过程随机性强、探索空间大的问题,研究了结合专家知识和DQN算法的智能车辆决策框架,设计了奖励值函数来引导算法的训练.通过层次分析法(AHP)选取高速场景下车辆驾驶决策中的重要影响因素,利用ID3决策树构建简单而有效的专家规则库;在传统算法基础上,通过设计奖励值函数来优化DQN网络结构,由奖励值函数引导DQN算法来解决高速场景下的车辆决策问题,并在Python仿真环境中构建高速交通场景对该算法进行分析和验证.实验结果表明,在高速直道和并道场景下,达到95%成功率的平均训练次数分别减少了100次和200次,平均奖励值分别提高了4.02和1.34,有效加快了DQN算法的动作选择,降低了探索过程中的动作随机性.

     

  • 加载中
计量
  • 文章访问数:  640
  • HTML全文浏览量:  86
  • PDF下载量:  14
  • 被引次数: 0
出版历程
  • 刊出日期:  2020-10-28

目录

    /

    返回文章
    返回