来,让你的车20分钟学会自动驾驶

这段视频中,Wayve明确表示他们将通过这个实验去证明加强学习的算法是可以教会一辆汽车如何自动驾驶的。

来,让你的车20分钟学会自动驾驶

这辆通过改造的雷诺小车在行驶中的控制逻辑根据随机的参数进行了初始化。在训练阶段,试验车显然一开始是处于一种随机尝试的状态,一旦算法出现了错误的判断,安全驾驶员将会介入终止它的操作并帮助车辆从正确的动作重新开始,而算法在出现错误并被终止之前的行驶行为将得到嘉奖,这显然是为了让算法能够得到足够的信息去判断自己的行为是否正确。

来,让你的车20分钟学会自动驾驶

每一次安全驾驶员对于车辆的重新设置都是对于控制逻辑的一种优化,也是对算法的一种进阶推动,而所有的优化都是在车上完成,并没有单独再进行脱机的计算和优化。

来,让你的车20分钟学会自动驾驶

通过视频我们可以看到,经过四个小训练周期之后,Wayve开启了对试验车的第一个评估测试。从结果来看,经过四个小训练周期显然还不足以让系统胜任自动驾驶的任务,第一次评估测试仅仅安全行驶了9.8米。

来,让你的车20分钟学会自动驾驶

重复了另外两个小训练周期之后,开始了第二次评估测试,这一次系统算法的表现有所进步,毕竟已经经过了六个训练周期。从表现来看,系统有了一定的纠错能力,但是表现依然不够稳定。这套系统的运行基于一套深度卷积神经网络,它接受的输入信号来自于单目摄像头摄取的图片,而系统的输出则体现为对于方向和速度的控制。第二次评估测试的安全行驶距离达到了53.8米,比之于第一次显然有了极大的提高。

来,让你的车20分钟学会自动驾驶

又经过了四轮小训练周期之后,驾驶员开启了第三次评估测试。最终,经过十一轮的训练,这套车载系统掌握了如何在这条车道上自动循迹驾驶并成功地行驶完了整条道路。

来,让你的车20分钟学会自动驾驶

为验证实验结果,Wayve在不同的天气条件下重复了多次这个实验,这辆测试车也是第一辆由强化学习方法驾驶的车辆。这个实验某种程度上也证明了强化学习即使在缺乏程序和地图加持的情况下,也可以使车辆学会如何自动驾驶,而Wayve下一步将会推进这项技术尽快规模化以使其能够适应更为复杂的驾驶任务。


分享到:


相關文章: