Mobile-Bench: An Evaluation Benchmark for LLM-based Mobile Agents

  • Mobile-Bench: An Evaluation Benchmark for LLM-based Mobile Agents [46.8]
    大規模言語モデル(LLM)は人間とコンピュータの相互作用においてホットスポットとなっている。 Mobile-Benchは、LLMベースのモバイルエージェントの能力を評価するための新しいベンチマークである。
    論文  参考訳(メタデータ)   (Mon, 01 Jul 2024 06:10:01 GMT)
  • モバイルエージェント向けベンチマーク
  • リポジトリはhttps://github.com/XiaoMi/MobileBenchとのこと(arXivへの公開時点では404)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です