浙江工业大学最新研究：将在线学习纳入基于MCTS的意图进展

论论资讯｜ 2024-04-29 ｜ 35热度

IEEE Access

Explore content

About the journal

Publish with us

Incorporating Online Learning into MCTS-based Intention Progression

Song C.; Yao Y.; Chan S.

Published：2024-01-01

DOI：10.1109/access.2024.3390796

研究背景

在当今社会，智能代理在各个领域被广泛应用，如电力系统和航天器。其中，信念-欲望-意图（BDI）代理是最常用和研究最多的架构之一，具有可以并行追求多个目标的优势。然而，在代理的思考周期中决定“下一步该做什么”是BDI代理面临的关键问题，被定义为意图推进问题（IPP）。现有的大多数IPP方法忽视了运行时的历史数据的重要性，从而在一定程度上限制了代理的适应性和决策能力。

研究内容

这篇论文提出将在线学习融入当前最先进的意图推进方法<italic>SA</italic>，以克服<italic>SA</italic>无法利用历史数据指导代理决策的局限性。这种方法不仅可以防止<italic>SA</italic>在无效和低效的模拟上耗费计算资源，还显著提高了代理的执行效率。尤其在处理大规模问题领域时，这种改进显著增强了代理的规划能力。我们提出了<italic>SAQ</italic>和<italic>SAL</italic>调度器，两者都能根据运行时的历史模拟数据学习如何在MCTS的模拟阶段生成“合理”的模拟。我们在一系列难度逐渐增加的情景中将我们的方法与最先进的<italic>SA</italic>进行了性能比较。结果表明，我们的方法在实现目标数量和所需计算开销方面均优于<italic>SA</italic>。

研究意义

这项研究的创新之处在于成功将在线学习融入到意图推进方法中，从而提高了代理的决策能力和执行效率。这种方法的应用不仅可以节省计算资源，还能在各种场景中取得更好的表现。这对未来智能代理系统的发展具有重要意义，为解决复杂问题提供了新的思路和方法。通过这篇论文，我们看到了在智能代理领域的新进展，希望这项研究能够为未来的技术发展和应用带来更多启发。（以上内容参考论文《Incorporating Online Learning into MCTS-based Intention Progression》）

IEEE Access

IF 3.9 论文数6W+ 被引数 53W+

材料学论文数前10%

265人阅读

学术热榜

查看全部