2022年4月 – ページ 2 – arXiv最新論文の紹介

GRAPHELSUMS(summaries with graphical elements): グラフィカルな要約データセット

Summarization with Graphical Elements [55.6]
本稿では,グラフィカル要素による要約という新しい課題を提案する。タスクの研究を支援するために,高品質なラベル付きデータセットを収集する。
論文参考訳（メタデータ） (Fri, 15 Apr 2022 17:16:41 GMT)
- ナレッジグラフのような形で要約する新しい要約タスクの提案とデータセット、ベースモデルの提示。提案されたデータセットでは関係として「L = {who, what, what happens, what happened, what will happen, where, when, why}」が与えられており、このような関係で結ばれた小さな要約で構成されていると確かに読みやすい。
- リポジトリはhttps://github.com/maartjeth/summarization_with_graphical_elementsとのことだが現時点では404

法的判断予測のサーベイ

A Survey on Legal Judgment Prediction: Datasets, Metrics, Models and Challenges [73.3]
法定判断予測(LJP)は,事実記述に基づく判断結果の自動予測に自然言語処理(NLP)技術を適用している。 6言語で31のLJPデータセットを分析し、その構築過程を示し、LJPの分類方法を定義する。異なる訴訟の8つの代表的データセットに対する最先端の結果を示し、オープンな課題について議論する。
論文参考訳（メタデータ） (Mon, 11 Apr 2022 04:06:28 GMT)
- 法的な判断への自然言語処理技術適用のサーベイ。近年トップカンファレスでの発表が増えている事、多種多様なアプローチがあることも分かる。解釈可能性の重視などクリティカルな領域への自然言語処理技術適用の話としても興味深い。

ViViD++: Vision for Visibility Dataset

ViViD++: Vision for Visibility Dataset [14.8]
様々な輝度条件をターゲットとした多様な視覚データフォーマットを抽出したデータセットを提案する。代替センサーの可能性にもかかわらず、代替視覚センサーを備えたデータセットは依然として少ない。これらの測定結果と慣性センサーと接地構造を併用して,照明不良下でのロバストな視力SLAMを開発する。
論文参考訳（メタデータ） (Thu, 14 Apr 2022 00:38:12 GMT)
- 様々な種類のセンサーを含むデータセット。ただし「Please note that only education domains (.edu, *.ac. etc.) are allowed for download.」とのこと
- プロジェクトサイトはViViD++ · Vision for Visibility Dataset

NTED(Neural Texture Extraction and Distribution): 制御可能な人物画像生成

Neural Texture Extraction and Distribution for Controllable Person Image Synthesis [46.6]
身体のポーズや外観を明示的に制御した参照画像から人間を再レンダリングすることを目的とした、制御可能な人物画像合成タスクに対処する。人物画像が高度に構造化されていることを観察し、参照画像のセマンティックエンティティを抽出し、分散することにより、所望の画像を生成することを提案する。
論文参考訳（メタデータ）参考訳（全文） (Wed, 13 Apr 2022 03:51:07 GMT)
- 参照画像をもとに一定の制御（ポーズの変更など）を加えた人物画像を生成する研究。非常にクオリティが高い。
- リポジトリはGitHub – RenYurui/Neural-Texture-Extraction-Distribution

CsaNMT: Continuous Semantic Augmentationを用いたニューラル機械翻訳

Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation [50.5]
CsaNMT(Continuous Semantic Augmentation)と呼ばれる新しいデータ拡張パラダイムを提案する。 CsaNMTは各トレーニングインスタンスを、同じ意味の下で適切なリテラル式をカバーできる隣接領域で拡張する。
論文参考訳（メタデータ） (Thu, 14 Apr 2022 08:16:28 GMT)
- データ拡張によって優れた性能を発揮する手法の提案。BackTranslationを大きく上回っている（がモノリンガルデータは導入していない？）。データ拡張系手法の中でSoTAを主張。
- GitHub – pemywei/csanmt: This is a code repository for the ACL 2022 paper “Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation”

FactGraph: 要約における事実性の評価

FactGraph: Evaluating Factuality in Summarization with Semantic Graph Representations [114.9]
文書と要約を構造化された意味表現(MR)に分解するFactGraphを提案する。 MRは、コアセマンティックの概念とその関係を記述し、文書と要約の両方の主要な内容を標準形式で集約し、データの疎結合を減少させる。事実性を評価するための異なるベンチマークの実験では、FactGraphは以前のアプローチよりも最大15%優れていた。
論文参考訳（メタデータ） (Wed, 13 Apr 2022 16:45:33 GMT)
- 文書と要約で意味的整合性が取れないことがあるが、その評価を行う研究。グラフベースのアプローチを用いることでQAベースの手法よりも優れた結果であったとのこと。
- コードはhttps://github.com/amazon-research/fact-graphで公開予定

GPT-NeoX-20B: オープンソースの巨大言語モデル

GPT-NeoX-20B: An Open-Source Autoregressive Language Model [16.3]
GPT-NeoX-20Bは、Pileで訓練された200億のパラメータの自動回帰言語モデルである。ウェイトは寛容なライセンスで、自由に公開することができる。
論文参考訳（メタデータ） (Thu, 14 Apr 2022 04:00:27 GMT)
- Apache-2とオープンなライセンスの大規模言語モデル。tokenizerなどの工夫でGPT-3などと比べモデル規模の割に性能が高いとのこと。推論であっても2つのGPU（45GB以上のVRAM）が必要。
- 「we hope to train and open source a 175B parameter GPT-3 replication along the way.」というのにも期待大。
- リポジトリはGitHub – EleutherAI/gpt-neox: An implementation of model parallel autoregressive transformers on GPUs, based on the DeepSpeed library.

WikiDiverse: マルチモーダルなエンティティ・リンキングデータセット

WikiDiverse: A Multimodal Entity Linking Dataset with Diversified Contextual Topics and Entity Types [25.6]
MEL(Multimodal Entity Linking)は、知識ベース(例えばWikipedia)からの参照エンティティへの参照をマルチモーダルコンテキストにリンクすることを目的としている。 WikiDiverseは、Wikinewsのコンテキストトピックやエンティティタイプを多用した、高品質な人間アノテーション付きMELデータセットである。 WikiDiverseに基づいて、モダリティ内およびモダリティ間注目を伴うよく設計されたMELモデルのシーケンスを実装した。
論文参考訳（メタデータ） (Wed, 13 Apr 2022 12:52:40 GMT)
- 画像を併用したエンティティリンキングのデータセット。人の手が入っておりクオリティが高いとのこと。ベースラインモデルでもマルチモーダルなデータ活用は有効そう。データ数は8Kキャプション、ライセンスはCC BY-SA 4.0。
- リポジトリはGitHub – wangxw5/wikiDiverse

NumGLUE: 数学的推論のデータセット

NumGLUE: A Suite of Fundamental yet Challenging Mathematical Reasoning Tasks [37.7]
8つのタスクでAIシステムの性能を評価するベンチマークであるNumGLUEを提案する。このベンチマークは、最先端の大規模言語モデルを含むニューラルモデルで解決されるには程遠い。我々はNumGLUEが言語内で堅牢で一般的な算術推論を行うシステムを促進することを願っている。
論文参考訳（メタデータ） (Tue, 12 Apr 2022 09:36:10 GMT)
- 以下8タスクからなる数学的推論タスクのデータセット。ベースラインも用意されているがかなり困難なタスクに見える。
  - TASK 1 Commonsense + Arithmetic
  - TASK 2 Domain specific + Arithmetic
  - TASK 3 Commonsense + Quantitative
  - TASK 4 Fill-in-the-blanks
  - TASK 5 RC + Explicit Numerical Reasoning
  - TASK 6 RC + Implicit Numerical Reasoning
  - TASK 7 Quantitative NLI
  - TASK 8 Arithmetic word problems
プロジェクトサイトはNumGLUE Dataset — Allen Institute for AI (allenai.org)

引用と再現性の関係

Does the Market of Citations Reward Reproducible Work? [36.8]
医学や機械学習(ML)などの特定の研究分野は、再現性のある作品とより多くの引用を関連付けていることを示す。コードを利用可能にし、事前作業を徹底的に参照することは、引用の増加と肯定的に相関しているように見える。
論文参考訳（メタデータ） (Fri, 8 Apr 2022 04:03:17 GMT)
- 引用と再現性に関する研究。「再現不可能な論文がより多くの引用を得る」ようなことはなく引用と再現性は正の相関または独立。機械学習分野では徹底的な引用、コードの共有といった望ましい行動（desirable behaviors）と正の相関があるとのこと。
- 分析コード等はGitHub – EdwardRaff/ReproducibleCitationsで公開されている。

2022年4月
月	火	水	木	金	土	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30