扫码下载APP

您的位置

资讯详情

本人可编辑资讯

仅支持在APP编辑资讯扫描二维码即可下载APP

浙江工业大学最新研究:将在线学习纳入基于MCTS的意图进展

论论资讯 | 2024-04-29 35热度

IEEE Access

Explore content

About the journal

Publish with us

Incorporating Online Learning into MCTS-based Intention Progression

Song C.; Yao Y.; Chan S.

Published:2024-01-01
DOI:10.1109/access.2024.3390796

研究背景

在当今社会,智能代理在各个领域被广泛应用,如电力系统和航天器。其中,信念-欲望-意图(BDI)代理是最常用和研究最多的架构之一,具有可以并行追求多个目标的优势。然而,在代理的思考周期中决定“下一步该做什么”是BDI代理面临的关键问题,被定义为意图推进问题(IPP)。现有的大多数IPP方法忽视了运行时的历史数据的重要性,从而在一定程度上限制了代理的适应性和决策能力。

研究内容

这篇论文提出将在线学习融入当前最先进的意图推进方法<italic>S<sub>A</sub></italic>,以克服<italic>S<sub>A</sub></italic>无法利用历史数据指导代理决策的局限性。这种方法不仅可以防止<italic>S<sub>A</sub></italic>在无效和低效的模拟上耗费计算资源,还显著提高了代理的执行效率。尤其在处理大规模问题领域时,这种改进显著增强了代理的规划能力。我们提出了<italic>SA<sub>Q</sub></italic>和<italic>SA<sub>L</sub></italic>调度器,两者都能根据运行时的历史模拟数据学习如何在MCTS的模拟阶段生成“合理”的模拟。 我们在一系列难度逐渐增加的情景中将我们的方法与最先进的<italic>S<sub>A</sub></italic>进行了性能比较。结果表明,我们的方法在实现目标数量和所需计算开销方面均优于<italic>S<sub>A</sub></italic>。

研究意义

这项研究的创新之处在于成功将在线学习融入到意图推进方法中,从而提高了代理的决策能力和执行效率。这种方法的应用不仅可以节省计算资源,还能在各种场景中取得更好的表现。这对未来智能代理系统的发展具有重要意义,为解决复杂问题提供了新的思路和方法。 通过这篇论文,我们看到了在智能代理领域的新进展,希望这项研究能够为未来的技术发展和应用带来更多启发。 (以上内容参考论文《Incorporating Online Learning into MCTS-based Intention Progression》)

微信扫码即可查看