浙江工业大学最新研究:将在线学习纳入基于MCTS的意图进展
论论资讯 | 2024-04-29 |
35热度
IEEE Access
Explore content
About the journal
Publish with us
Incorporating Online Learning into MCTS-based Intention Progression
Song C.; Yao Y.; Chan S.
Published:2024-01-01
DOI:10.1109/access.2024.3390796
研究背景
在当今社会,智能代理在各个领域被广泛应用,如电力系统和航天器。其中,信念-欲望-意图(BDI)代理是最常用和研究最多的架构之一,具有可以并行追求多个目标的优势。然而,在代理的思考周期中决定“下一步该做什么”是BDI代理面临的关键问题,被定义为意图推进问题(IPP)。现有的大多数IPP方法忽视了运行时的历史数据的重要性,从而在一定程度上限制了代理的适应性和决策能力。
研究内容
这篇论文提出将在线学习融入当前最先进的意图推进方法<italic>S<sub>A</sub></italic>,以克服<italic>S<sub>A</sub></italic>无法利用历史数据指导代理决策的局限性。这种方法不仅可以防止<italic>S<sub>A</sub></italic>在无效和低效的模拟上耗费计算资源,还显著提高了代理的执行效率。尤其在处理大规模问题领域时,这种改进显著增强了代理的规划能力。我们提出了<italic>SA<sub>Q</sub></italic>和<italic>SA<sub>L</sub></italic>调度器,两者都能根据运行时的历史模拟数据学习如何在MCTS的模拟阶段生成“合理”的模拟。
我们在一系列难度逐渐增加的情景中将我们的方法与最先进的<italic>S<sub>A</sub></italic>进行了性能比较。结果表明,我们的方法在实现目标数量和所需计算开销方面均优于<italic>S<sub>A</sub></italic>。
研究意义
这项研究的创新之处在于成功将在线学习融入到意图推进方法中,从而提高了代理的决策能力和执行效率。这种方法的应用不仅可以节省计算资源,还能在各种场景中取得更好的表现。这对未来智能代理系统的发展具有重要意义,为解决复杂问题提供了新的思路和方法。
通过这篇论文,我们看到了在智能代理领域的新进展,希望这项研究能够为未来的技术发展和应用带来更多启发。
(以上内容参考论文《Incorporating Online Learning into MCTS-based Intention Progression》)
学术热榜
查看全部
相关资讯
换一批