2022年12月1日 – arXiv最新論文の紹介

Human or Machine? Turing Tests for Vision and Language

Human or Machine? Turing Tests for Vision and Language [22.1]
我々は、現在のAIを人間を模倣する能力で体系的にベンチマークする。実験では、769人の人的エージェント、24人の最先端AIエージェント、896人の人的裁判官、8人のAI裁判官がテストされた。その結果、現在のAIは、性別、年齢、教育レベルによって人間の裁判官を偽装できるわけではないことが判明した。
論文参考訳（メタデータ） (Wed, 23 Nov 2022 16:16:52 GMT)
大規模なチューリングテスト。AIがチューリングテストを受けるだけでなく、ジャッジもしているのが面白い。
チューリングテストには批判も多いが大規模実験の結果は面白い。長い対話はともかくとしてAIか人間かの判断は難しいように思えるし、その判断ですらAIの性能は高いよう。
データ等はhttps://tinyurl.com/8x8nha7pで公開されているとのこと

The Lean Data Scientist

The Lean Data Scientist: Recent Advances towards Overcoming the Data Bottleneck [16.2]
機械学習(ML)は、ほとんどすべての科学と産業に影響を及ぼし、世界を変えつつある。最近のアルゴリズムはますますデータに飢えており、トレーニングには大規模なデータセットが必要である。しかし、そのような規模の高品質なデータセットを取得することは難しい課題である。
論文参考訳（メタデータ） (Tue, 15 Nov 2022 07:44:56 GMT)
データが少ない問題に対応する手法を整理した論文
それほど長くもなく頭の整理には良いなと思う。

PIDray: A Large-scale X-ray Benchmark for Real-World Prohibited Item Detection

PIDray: A Large-scale X-ray Benchmark for Real-World Prohibited Item Detection [21.1]
PIDrayという名前の大規模データセットを提示し、実世界の様々なケースを対象とし、アイテム検出を禁止している。具体的には、PIDrayは禁止アイテムの12のカテゴリに対して124,486枚のX線画像を収集する。そこで本研究では,PIDrayに基づくベースラインアルゴリズムを開発するために,汎用的な分割・コンカレントパイプラインを提案する。
論文参考訳（メタデータ） (Sat, 19 Nov 2022 18:31:34 GMT)
セキュリティ検査などにおける禁止物のX線画像データセット。Easy / Hard / Hiddenと難易度が設定されているのが面白い。
リポジトリはlutao2021/PIDray (github.com)