arXiv – ページ 185 – arXiv最新論文の紹介

DiVeRSe: Diverse Verifier on Reasoning Step

On the Advance of Making Language Models Better Reasoners [49.2]
GPT-3 や PaLM のような大規模言語モデルは、数発の学習で顕著な性能を示した。最近の進歩は、最終回答を生成する前に、言語モデルを意図的に導き、推論ステップの連鎖を生成する。推論能力をさらに向上するための新しいアプローチであるDiVeRSeを提案する。
論文参考訳（メタデータ） (Mon, 6 Jun 2022 03:38:36 GMT)
- 多段階推論パスを用いてGSM8Kのようなタスクでの性能が改善するが、それをさらに推し進めた研究。多段階推論に加えて「言語モデルからより多様な推論経路を誘導する多様なプロンプトを活用」「複数の推論経路から最終的な答えを引き出す投票検証モデルの利用」「ステップ毎の正しさを利用した投票検証モデルの強化」を行っているとのこと。

医療画像分野のTransformer利用サーベイ

Transforming medical imaging with Transformers? A comparative review of key properties, current progresses, and future perspectives [18.0]
ディープラーニングの最新技術進歩であるTransformerは、自然言語処理やコンピュータビジョンで普及している。我々は、医療画像に対する最先端のTransformerベースのアプローチを包括的にレビューする。
論文参考訳（メタデータ） (Thu, 2 Jun 2022 16:38:31 GMT)
- 医療分野の画像処理でTransformerがどのように使われているかのサーベイ。
- 医療分野とあるが一般的な画像処理でも重要な考え方が多く参考になる。当然ながらMedical image reconstructionなどドメイン依存のタスクも興味深い。

Beyond the Imitation Game benchmark (BIG-bench)

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models [645.0]
言語モデルは、規模が大きくなるにつれて量的改善と新しい質的能力の両方を示す。ビッグベンチは204のタスクで構成され、132の機関で442人の著者が貢献している。我々は,OpenAIのGPTモデル,Google内部の高密度トランスアーキテクチャ,BIGベンチ上のスイッチ型スパーストランスの挙動を評価する。
論文参考訳（メタデータ） (Thu, 9 Jun 2022 17:05:34 GMT)
- 204タスクからなる大規模ベンチマークと大規模言語モデルを用いた評価の報告。
  - 著者が極めて多く、スコア=645はfugumt.com内で最高。
- 大規模言語モデルを用いたAIでも総合的には人間は及ばない、開発者（OpenAI or Google）が異なっていてもAIは似た挙動を示すなど非常に興味深い。
  - 最近の「パラメータ数の増加（大規模化）によりAIの性能は人間に並べる」という雰囲気との整合性は謎で、5ページのPaLMの結果によって解釈が変わるレベルの影響がありそう。PaLMが無ければ総合的に人間のレベルに到達する道のりは長そうだが、PaLMの結果があると行けそうに思える。
  - 「During the writing of this work, results for the Pathways Language Model (PaLM) on BIG-bench were published (Chowdhery et al., 2022) and we included them in Figure 1. Most of the analysis in the paper is focused on results from models we evaluated BIG-bench on.」とのことで、この分野は進展が速すぎるという印象
- リポジトリはGitHub – google/BIG-bench: Beyond the Imitation Game collaborative benchmark for measuring and extrapolating the capabilities of language models

論文探索システム

Augmenting Scientific Creativity with Retrieval across Knowledge Domains [31.7]
論文要約から,エンドユーザが関心のあるテキストコアの一部を選択できる探索検索システムを開発した。研究者らによるケーススタディは、クロスドメイン探索とインスピレーションを促進することを目的としたシステムにおける機会と設計の意味を明らかにする。
論文参考訳（メタデータ）参考訳（全文） (Thu, 2 Jun 2022 22:55:51 GMT)
- 便利そうな論文探索システム、fugumt.comにも取り入れたい…
- リポジトリはGitHub – olivettigroup/cross-domain-exploration

スポーツの映像行動認識のサーベイ

A Survey on Video Action Recognition in Sports: Datasets, Methods and Applications [60.3]
本稿では,スポーツ分析のための映像行動認識に関する調査を行う。サッカー、バスケットボール、バレーボール、ホッケー、フィギュアスケート、体操、卓球、ダイビング、バドミントンなど10種以上のスポーツを紹介します。本研究では,サッカー,バスケットボール,卓球,フィギュアスケート動作認識をサポートするPaddlePaddleを用いたツールボックスを開発した。
論文参考訳（メタデータ） (Thu, 2 Jun 2022 13:19:36 GMT)
- スポーツへのAI応用の面からも興味深いサーベイ。

映画での対話のバイアスデータセット

Hollywood Identity Bias Dataset: A Context Oriented Bias Analysis of Movie Dialogues [20.2]
映画に登場する社会的偏見やステレオタイプは、リーチによって大きなダメージを与える可能性がある。同一性バイアスに注釈を付けた映画脚本のデータセットを新たに導入する。データセットには、(i) バイアスラベルに、性別、人種/民族、宗教、年齢、職業、LGBTQ、その他の7つのカテゴリのダイアログがアノテートされている。
論文参考訳（メタデータ） (Wed, 1 Jun 2022 05:43:53 GMT)
- 映画内の対話における偏見などバイアスをアノテーションしたデータセットの提案。35の映画における対話をアノテーションし、49117文のうちバイアスは1181文に存在したとのこと。
- リポジトリはGitHub – sahoonihar/HIBD_LREC_2022

MentSum: Mental Health Summarization dataset

MentSum: A Resource for Exploring Summarization of Mental Health Online Posts [19.2]
メンタルヘルスは、世界中の公衆衛生にとって重要な課題である。オンラインプラットフォームの人気が高まるにつれて、多くの人々がプラットフォームを使ってメンタルヘルス状態を共有し、感情を表現し、コミュニティやカウンセラーからの助けを求めている。 Reachoutのようなプラットフォームの中には、ユーザーが助けを求めるために登録する専用のフォーラムもある。 Redditなど他のサービスでは、ユーザーが公開でも匿名でメンタルヘルスの苦痛を投稿するサブレディットを提供している。ポストの長さは様々であるが、カウンセラーによる高速な処理のために短いが情報的な要約を提供することは有益である。
論文参考訳（メタデータ）参考訳（全文） (Thu, 2 Jun 2022 03:08:34 GMT)
- オンラインのメンタルヘルス議論プラットフォームから作られたデータセット。
- データの取得にはir@Georgetown – Resourcesからリクエストが必要なよう。

CogVideo: テキストからのビデオ生成

CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers [16.3]
大規模事前学習型トランスフォーマーは、テキスト(GPT-3)とテキスト・トゥ・イメージ(DALL-EとCagView)生成のマイルストーンを作成した。 CogVideoは、事前訓練されたテキスト・ツー・イメージモデルであるCogView2を継承することでトレーニングされる。 CogVideoは、マシンと人間の評価において、すべての公開モデルをはるかに上回っている。
論文参考訳（メタデータ） (Sun, 29 May 2022 19:02:15 GMT)
- テキストからのビデオ生成、すでにクオリティが高い。「Nightfall in a metropolis.」では「夕日→日が沈む→暗くなる」という時間経過の概念がある動画も作れているのが凄い。
- リポジトリはGitHub – THUDM/CogVideo: Text-to-video generation.

より効率的なDataset Condensation

Dataset Condensation via Efficient Synthetic-Data Parameterization [40.6]
大量のデータを持つ機械学習は、膨大な計算コストと、トレーニングとチューニングのためのストレージの価格が伴う。データセットの凝縮に関する最近の研究は、コンパクトなトレーニングデータセットを合成することで、そのような大量のデータへの依存を減らそうとしている。本稿では,データ規則性を考慮した効率的なパラメータ化により,ストレージ予算に制限のある複数の合成データを生成する,新しい凝縮フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 2 Jun 2022 05:45:02 GMT)
- 凝縮したデータをさらに複数組み合わせる形で用いて、ストレージ制約のある状況下で効率的に学習が可能なデータを合成する研究。
  - Dataset condenstaionは面白い研究で（性能が上がれば）実用性もありそうな気がするが、こういうデータにもPoisoningできたりするのだろうかという素朴な疑問
- リポジトリはGitHub – snu-mllab/Efficient-Dataset-Condensation: Official PyTorch implementation of “Dataset Condensation via Efficient Synthetic-Data Parameterization” (ICML’22)

CoNT: Contrastive Neural Text Generation

CoNT: Contrastive Neural Text Generation [83.1]
対照的なニューラルテキスト生成フレームワークであるCoNTが紹介される。 CoNTは、コントラスト学習が生成タスクで広く採用されるのを防ぐボトルネックに対処する。我々は,機械翻訳,要約,コードコメント生成,データ-テキスト生成,コモンセンス生成を含む10のベンチマークを用いて,CoNTを5つの生成タスクで検証する。CoNTは、機械翻訳における1.50 BLEUと要約における1.77 ROUGE-1という、テキスト生成における最も競争力のあるコントラスト学習手法をそれぞれ上回っている。
論文参考訳（メタデータ） (Sun, 29 May 2022 15:18:37 GMT)
- テキスト生成系タスクのためビームサーチの結果を利用したContrastive Lerningの提案。翻訳や要約など多種のタスクで性能を改善（T5やPEGASUSをさらに改善）。ただし学習は2-4倍遅くなるとのこと。
- リポジトリはGitHub – Shark-NLP/CoNT: Code and datasets for our paper: “CoNT: Contrastive Neural Text Generation”

月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30