2021年11月6日 – arXiv最新論文の紹介

EfficientZero: 高効率な強化学習

Mastering Atari Games with Limited Data [73.6]
我々は,MuZero上に構築したモデルベースビジュアルRLアルゴリズムのサンプルを提案し,これをEfficientZeroと呼ぶ。提案手法は,Atari 100kベンチマークで平均190.4%の人的パフォーマンスを達成し,実戦経験は2時間に過ぎなかった。アルゴリズムがそのような小さなデータでアタリゲーム上で超人的パフォーマンスを達成するのは、これが初めてである。
論文参考訳（メタデータ） (Sat, 30 Oct 2021 09:13:39 GMT)
DQNが2億フレームで到達する性能を、その500分の1のフレーム数で達成できる強化学習のアルゴリズム。
リポジトリはhttps://github.com/YeWR/EfficientZero/

人間の注意を併用する学習

Human Attention in Fine-grained Classification [38.7]
我々は,人間の注意が分類などの意思決定プロセスに有用な情報を含んでいることを検証した。まずデータセットCUBに対して人間の視線データを収集し,CUB-GHA(Gaze-based Human Attention)を構築する。次に人間の視線を分類モデルに統合するために、GAT(Gaze Augmentation Training)とKFN(Knowledge Fusion Network)を提案する。
論文参考訳（メタデータ） (Tue, 2 Nov 2021 14:41:11 GMT)
- 人間の視線を用いることで分類性能を上げることができたとの報告。
- リポジトリはhttps://github.com/yaorong0921/CUB-GHA
- 脳からの知識蒸留で可能性を感じていた視線情報の併用と発想が似ていて面白かった。