CLEVER(Curious Layperson-to-Expert Visual Entity Recognition): エキスパートのアノテーションを使わない画像認識

The Curious Layperson: Fine-Grained Image Recognition without Expert Labels [90.9]
我々は、専門家のアノテーションを使わずに、画像認識する新しい問題を考える。非専門的な画像記述を用いてオブジェクトの視覚的外観を記述するモデルを学ぶ。次に、画像記述と文書とを文レベルでマッチングする、きめ細かいテキスト類似性モデルを訓練する。
論文参考訳（メタデータ）参考訳（全文） (Fri, 5 Nov 2021 17:58:37 GMT)
- 百科事典のようなデータがある状況下でその記載を読み解いて画像分類につなげる問題を扱った論文。専門家によるラベルは存在しない。普通の人がWikipediaを見ながら勉強するような状況を想定しているようで、面白い問題設定。
- リポジトリはhttps://github.com/subhc/clever

コメントを残す

コメントを残す コメントをキャンセル