arXiv最新論文の紹介

TwiBot-22: Twitterボット検出用ベンチマーク

TwiBot-22: Towards Graph-Based Twitter Bot Detection [39.4]
TwiBot-22はグラフベースのTwitterボット検出ベンチマークで、これまでで最大のデータセットを示している。 35の代表的なTwitterボット検出ベースラインを再実装し、TwiBot-22を含む9つのデータセットで評価します。さらなる研究を容易にするため、実装済みのコードとデータセットをTwiBot-22評価フレームワークに統合する。
論文参考訳（メタデータ） (Sun, 12 Jun 2022 09:05:30 GMT)
- 大規模なTwitterボット検出用データセット・ベンチマーク。マルチモーダルの利用も可能とのこと。
- リポジトリはTwiBot-22: Towards Graph-Based Twitter Bot Detection (twibot22.github.io)

MLP-3D

MLP-3D: A MLP-like 3D Architecture with Grouped Time Mixing [123.4]
ビデオ認識のための斬新な3Dアーキテクチャを提案する。結果は、最先端の3D CNNやビデオトランスフォーマーに匹敵する。
論文参考訳（メタデータ） (Mon, 13 Jun 2022 16:21:33 GMT)
- 動画に対する処理でもMLPがCNNやtransformerに匹敵とのこと。2次元画像でも繰り広げられた話題であるが、結局どこがポイントになっとるんだろうか。
- リポジトリはGitHub – ZhaofanQiu/MLP-3D: PyTorch implementation of CVPR2022 paper MLP-3D: A MLP-like 3D Architecture with Grouped Time Mixing.

SHIFT: A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation

SHIFT: A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation [152.6]
ShiFTは、自動運転のための最大規模のマルチタスク合成データセットである。曇り、雨と霧の強さ、昼の時間、車と歩行者の密度を個別に連続的に変化させる。私たちのデータセットとベンチマークツールキットはwww.vis.xyz/shift.comで公開されています。
論文参考訳（メタデータ） (Thu, 16 Jun 2022 17:59:52 GMT)
- 自動運転のための大規模合成データセット。気象条件、時刻、車両・歩行者の密度、カメラの向きといった変化に対応できるか検証可能な構成となっている。合成データではあるが、ドメイン間の性能差異は実環境のデータセットと同様であるとのこと。
- プロジェクトサイトはSHIFT Dataset (vis.xyz)、ライセンスは CC BY-SA 4.0

APT-36K: 動物のポーズ推定・追跡データセット

APT-36K: A Large-scale Benchmark for Animal Pose Estimation and Tracking [77.9]
APT-36Kは動物のポーズ推定と追跡のための最初の大規模ベンチマークである。このビデオは、30種の動物から収集・フィルタリングされた2,400のビデオクリップと、各ビデオの15フレームで構成されており、合計で36,000フレームとなっている。我々は,(1)ドメイン内およびドメイン間移動学習環境下での単一フレームでの動物ポーズ推定,(2)未確認動物に対する種間ドメイン一般化テスト,(3)動物追跡による動物ポーズ推定の3つのモデルについて,いくつかの代表的モデルをベンチマークした。
論文参考訳（メタデータ） (Sun, 12 Jun 2022 07:18:36 GMT)
- 動物のポーズ推定だけでなく追跡にも焦点を当てたデータセット。
- リポジトリはhttps://github.com/pandorgan/APT-36Kとのことだが、現時点では404

AIとクラウド環境と炭素排出

Measuring the Carbon Intensity of AI in Cloud Instances [91.3]
我々は,ソフトウェアの炭素強度を測定するための枠組みを提供し,運転中の炭素排出量を測定することを提案する。私たちは、Microsoft Azureクラウドコンピューティングプラットフォームにおける排出削減のための一連のアプローチを評価します。
論文参考訳（メタデータ）参考訳（全文） (Fri, 10 Jun 2022 17:04:04 GMT)
- AI構築（と利用）におけるエネルギーの利用やCO2の排出は最近よく話題になる。そのようなテーマに対して整理し環境負荷を下げる方法をサジェストしている論文。
- 本論文とは別件だが、Machine Learning CO2 Impact Calculator (mlco2.github.io)というサイトがあるくらい重要な話題になっている。

ソースコードのNaturalizing

NatGen: Generative pre-training by “Naturalizing” source code [18.4]
我々は,ソースコードの「成熟化」という新たな事前学習目標を提案する。自然言語とは異なり、コードのバイモーダルでデュアルチャネルの性質により、意味論的に等価なコードを大規模に生成することができます。私たちは、CodeT5に匹敵する最先端のパフォーマンスを達成するために、3つの生成ソフトウェアエンジニアリングタスクでモデルを微調整します。
論文参考訳（メタデータ） (Wed, 15 Jun 2022 15:08:29 GMT)
- ソースコードを同等でより自然なスタイルに変換するよう事前学習することでCodeT5より優れた結果を達成とのこと。
  - 汚いコードを綺麗にしてくれるようなモデルを作るときにも役立ちそうで非常に面白い。
- リポジトリはGitHub – natgen-team/NatGen

大規模言語モデルの創発的能力

Emergent Abilities of Large Language Models [172.1]
より小さなモデルには存在しないが、より大きなモデルには存在しない場合、創発する能力を考える。このような出現の存在は、さらなるスケーリングが言語モデルの機能範囲をさらに拡大することを意味している。
論文参考訳（メタデータ） (Wed, 15 Jun 2022 17:32:01 GMT)
- 近年の巨大言語モデルはパラメータ数増加により性能が上がることが知られている。その中で一定のパラメータ数を超えた時に劇的な性能向上がみられる事例を扱った論文。これらは「Emergent abilities would not have been directly predicted by extrapolating a scaling law (i.e. consistent performance improvements) from small-scale models.」とのことで予測することが難しい。
- 論文で挙げられている実例、Beyond the Imitation Game benchmark (BIG-bench) – arXiv最新論文の紹介 (devneko.jp)を合わせて考えるとやはり総合的に人間の能力を抜くようなモデルは意外に早くできてしまうのかもしれない。

META LM: Language Models are General-Purpose Interfaces

Language Models are General-Purpose Interfaces [109.5]
本稿では,様々な基礎モデルに対する汎用インタフェースとして言語モデルを提案する。事前訓練されたエンコーダのコレクションは、様々なモダリティ(ビジョンや言語など)を知覚するインタフェースとモジュールエンコーダを協調的に事前学習するための半因果言語モデリング手法を提案する。
論文参考訳（メタデータ） (Mon, 13 Jun 2022 17:34:22 GMT)
- マルチモーダル、マルチタスクに対応した言語モデルの提案。言語、画像のタスクで優れた性能を達成とのこと。エンコーダ部分でマルチモーダルに対応、実際タスクを「解く」のはsemi-causal language modelというデコーダのよう。この構造を汎用目的インタフェースといっている。
  - タスクに関する記述や出力は自然言語として書け、マルチモーダルな構造とも接続できるのであれば汎用インタフェースと言える気はする。そして、semi-causal language modelingというのは刺激的なワード。
- リポジトリはGitHub – microsoft/unilm: Large-scale Self-supervised Pre-training Across Tasks, Languages, and Modalities

GAN I hire you?

“GAN I hire you?” — A System for Personalized Virtual Job Interview Training [49.2]
本研究では,GAN(Generative Adversarial Network)に基づく対話型面接訓練システムを開発した。その結果,GANをベースとした行動フィードバックが有用であることが示唆された。
論文参考訳（メタデータ）参考訳（全文） (Wed, 8 Jun 2022 13:03:39 GMT)
- GANを用いた対話型面接トレーニングシステム、フィードバックを生成してくれるとのこと。
- 取り組みは面白いが、評価方法とかこれで大丈夫なのだろうか。

アノテーションエラー検出手法の検証

Annotation Error Detection: Analyzing the Past and Present for a More Coherent Future [64.0]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文参考訳（メタデータ） (Sun, 5 Jun 2022 22:31:45 GMT)
- AED(Annotation Error Detection)のサーベイ。対象は自然言語。
- 実用上重要な技術でとても参考になるサーベイ
- リポジトリはGitHub – UKPLab/nessie: Automatically detect errors in annotated corpora.

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30