Mirage-1: Augmenting and Updating GUI Agent with Hierarchical Multimodal Skills
Mirage-1: Augmenting and Updating GUI Agent with Hierarchical Multimodal Skills [57.7] 本稿では,知識不足の問題に対処するため,階層型マルチモーダルスキル(HMS)モジュールを提案する。 トラジェクトリを実行スキル、コアスキル、そして最終的にはメタスキルに徐々に抽象化し、長期のタスク計画のための階層的な知識構造を提供する。 ドメインギャップを埋めるために,Skill-Augmented Monte Carlo Tree Search (SA-MCTS)アルゴリズムを提案する。 論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:21:19 GMT)
「Hierarchical Multimodal Skills (HMS) module for long-horizon planning」、「A Skill-Augmented Monte Carlo Tree Search (SA-MCTS) algorithm for knowledge exploration in online settings.」をキーとするcross-platform, plug-and-play GUI agent、Mirage-1の提案