Mobile-Bench: An Evaluation Benchmark for LLM-based Mobile Agents

Mobile-Bench: An Evaluation Benchmark for LLM-based Mobile Agents [46.8]
大規模言語モデル(LLM)は人間とコンピュータの相互作用においてホットスポットとなっている。 Mobile-Benchは、LLMベースのモバイルエージェントの能力を評価するための新しいベンチマークである。
論文参考訳（メタデータ） (Mon, 01 Jul 2024 06:10:01 GMT)
モバイルエージェント向けベンチマーク
リポジトリはhttps://github.com/XiaoMi/MobileBenchとのこと（arXivへの公開時点では404）

コメントを残す

コメントを残す コメントをキャンセル