- 强化学习算法、小车代码:https://github.com/RyanLiu112/RL_parking
- echarts代码:https://github.com/RyanLiu112/RL_parking/tree/main/echarts%E4%BB%A3%E7%A0%81
- PDF版论文:https://github.com/RyanLiu112/RL_parking/blob/main/%E8%87%AA%E5%8A%A8%E9%A9%BE%E9%A9%B6%E4%B8%AD%E7%9A%84%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%92%8C%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E6%8A%80%E6%9C%AF%E7%BB%BC%E8%BF%B0.pdf
- 网页版论文及echarts可视化:
- 目标:小车从车位前出发,车头方向与车位方向对齐,倒车过程中不能碰撞墙壁,实现垂直倒车入库。
- 效果:
- 目标:小车从 [0, 0] 出发,车头方向与车位垂直,倒车过程中不能碰撞墙壁,实现倒车入库。
- 效果:
- 目标:小车从 [0, 0] 出发,车头方向与车位垂直,倒车过程中不能碰撞墙壁和车位旁的小车,实现倒车入库。
- 效果:
- 目标:小车从 [0, 0] 出发,车头方向与车位平行,倒车过程中不能碰撞墙壁,实现倒车入库。
- 效果:
- 目标:小车从 [0, 0] 出发,车头方向与车位成 60 度角,倒车过程中不能碰撞墙壁,实现倒车入库。
- 效果:
- 目标:小车从任意点出发,车头方向随机,倒车过程中不能碰撞墙壁和车位旁的小车,实现倒车入库。
- 效果:
我们定义环境中心点为 [0, 0],使用pybullet实时获取小车的坐标、速度和方向等信息,作为小车当前的状态。
对于大部分状态-动作对,我们定义如下 reward:
当小车碰撞到墙壁或其他小车时,定义 reward = -500。
- 克隆本项目
git clone https://github.com/RyanLiu112/RL_parking
- 进入项目目录
cd RL_parking
- 安装停车环境(会同时安装gym、pybullet、stable-baselines3、torch、moviepy等第三方库)
pip install -e parking_env
在算法方面,我们选择了适用于离散动作空间的经典算法——DQN (Deep Q Network)。DQN是一种基于Q-learning的off-policy强化学习算法,使用replay buffer存放智能体在环境中探索得到的经验。
- 任务1:垂直倒车入库
python dqn_agent.py --mode=1
- 任务2:侧方位-垂直倒车入库
python dqn_agent.py --mode=2
- 任务3:侧方位-垂直倒车入库(车位旁边有小车)
python dqn_agent.py --mode=3
- 任务4:侧方位-平行倒车入库
python dqn_agent.py --mode=4
- 任务5:斜方位-60度倒车入库
python dqn_agent.py --mode=5
- 任务6:任意位置出发倒车入库(车位旁边有小车)
python dgn_agent.py --mode=6
python sac_her_agent.py
- mean episode reward
- success rate
# 需指定 mode 和 ckpt_path
python evaluate.py --mode=mode --ckpt_path=ckpt_path
python play.py
# 需指定 mode 和 ckpt_path
python render_video.py --mode=mode --ckpt_path=ckpt_path
# 需指定 mode 和 ckpt_path
python render_training_video.py --mode=mode --ckpt_path=ckpt_path
# 需指定 mode
python render_env_video.py --mode=mode
