扫码下载APP

您的位置

资讯详情

本人可编辑资讯

仅支持在APP编辑资讯扫描二维码即可下载APP

布达佩斯科技经济大学最新研究:基于后继特征的深度强化学习智能体交通信号控制

论论资讯 | 2023-03-01 3热度

Electronics (Switzerland)

Explore content

About the journal

Publish with us

Traffic Signal Control with Successor Feature-Based Deep Reinforcement Learning Agent

Szoke L.; Aradi S.; Bécsi T.

Published:2023-03-01
DOI:10.3390/electronics12061442

研究背景

现今,随着越来越多的车辆进入相同的基础设施,交通拥堵和道路使用量显著增加。为了减少旅行时间或最大化网络容量(吞吐量),需要新的解决方案。近年来,机器学习方法已经得到广泛应用,以帮助优化交通流量。然而,大多数强化学习算法在目标函数方面缺乏适应性。因此,本研究提出了一种新颖的后继特征解决方案,以控制单个路口以优化交通流量,减少环境影响并促进可持续发展。

研究内容

本文研究了如何使用最近的强化学习技术解决一般路口的交通信号控制问题。通过引入后继特征到领域中,我们定义了交通信号控制系统的基本后继特征、基本奖励函数和目标偏好。本研究的主要方向是减少环境影响并支持优先车辆通勤。我们还对如何评估我们的方法在考虑环境影响时实现更有效的操作以及与一般Deep-Q-Network解决方案相比的适应性进行了评估。此外,我们还将标准基于规则的和自适应信号控制技术与我们的方法进行了比较,以展示其优势。此外,我们对代理的适应性进行了消融分析,并展示了在类似情况下保持一致的性能水平。

研究意义

本研究提供了一种新颖的后继特征解决方案,以控制单个路口以优化交通流量,减少环境影响并促进可持续发展。该方法具有灵活性和适应性,可以适应不断变化的情况和目标。在推理过程中,它支持偏好的变化,因此受过训练的代理(交通信号控制器)的行为可以在推理时间内快速更改。此外,本研究还对如何评估我们的方法在考虑环境影响时实现更有效的操作以及与一般Deep-Q-Network解决方案相比的适应性进行了评估,对于未来的交通流量优化研究具有重要意义。

微信扫码即可查看