GEMv2: Multilingual NLG Benchmarking in a Single Line of Code [161.2] Generation, Evaluation, and Metrics Benchmarkは、データセット、モデル、メトリック開発者のためのモジュラーインフラストラクチャを提供する。 GEMv2は51言語で40のドキュメントデータセットをサポートする。 すべてのデータセットのモデルはオンラインで評価でき、インタラクティブなデータカード作成とレンダリングツールによって、生きたベンチマークに新しいデータセットを簡単に追加できます。 論文参考訳(メタデータ)参考訳(全文) (Thu, 23 Jun 2022 14:38:38 GMT)
A Numerical Reasoning Question Answering System with Fine-grained Retriever and the Ensemble of Multiple Generators for FinQA [53.6] 本稿では,財務テキストと表データソース間の数値推論質問に答える数値推論質問応答システムを提案する。 検索モジュールにおいて、生成モジュールの入力に無関係で類似のセルを同じ行に持ってくるのを避けるため、金のセルを検索するセルレトリバーを革新的に設計する。 アンサンブルモジュールでは,システム出力として最適なプログラムを選択するために複数のプログラムを統合する。 論文参考訳(メタデータ) (Fri, 17 Jun 2022 01:55:29 GMT)
Scalable Neural Data Server: A Data Recommender for Transfer Learning [70.1] 転送学習は、下流のパフォーマンスを改善するために追加データを活用する一般的な戦略である。 Nerve Data Server (NDS)は、特定の下流タスクに関連するデータを推奨する検索エンジンで、この問題に対処するためにこれまで提案されていた。 NDSは、データソースでトレーニングされた専門家の混合物を使用して、各ソースと下流タスクの類似性を推定する。 SNDSは、中間データセットに近接して、データソースと下流タスクの両方を表現します。 論文参考訳(メタデータ) (Sun, 19 Jun 2022 12:07:32 GMT)
A Unified Evaluation of Textual Backdoor Learning: Frameworks and Benchmarks [72.7] 我々は,テキストバックドア学習の実装と評価を促進するオープンソースツールキットOpenBackdoorを開発した。 また,単純なクラスタリングに基づく防御ベースラインであるCUBEを提案する。 論文参考訳(メタデータ) (Fri, 17 Jun 2022 02:29:23 GMT)
バックドア攻撃(データセット、事前学習モデル、ファインチューニング後のモデル)を整理、ツールキットを開発し、防御手法CUBE(ClUstering-based poisoned sample filtering for Backdoor-freE trainingを)提案。
Square One Bias in NLP: Towards a Multi-Dimensional Exploration of the Research Manifold [88.8] 我々は、最近のNLP研究論文のマニュアル分類を通して、これが事実であることを示す。 NLP研究は正方形ではなく、精度だけでなく、公平性や解釈可能性にも焦点をあてる。 論文参考訳(メタデータ)参考訳(全文) (Mon, 20 Jun 2022 13:04:23 GMT)
NLPの研究の多くが精度、多言語性、公平性・解釈可能性の1軸に焦点を当てており、このような形式をSQUARE ONEと呼びそこから生まれるバイアスをSQUARE ONE BIASと呼んでいる。論文中のACL2021の分析結果も興味深いが、感覚的にも2軸以上を扱う論文はレアだと思う。
Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks [39.1] Unified-IOは、古典的なコンピュータビジョンタスクにまたがるさまざまなAIタスクを実行するモデルである。 我々は、サポート対象の入力と出力を個別の語彙トークン列に均質化することで、この統一を実現する。 Unified-IOはGRITベンチマークで7つのタスクすべてを実行することができる最初のモデルである。 論文参考訳(メタデータ)参考訳(全文) (Fri, 17 Jun 2022 17:53:47 GMT)
非常に多様なデータ、タスクを扱えるモデルの提案。
META LMでも感じたが、汎用に使えるAI(しかも事前学習済み)は夢物語ではなくなりつつあると感じる。そしてマルチモーダルをつなぐのは言語なのだろうか。
「we have decided not to release our Parti models, code, or data for public use without further safeguards in place.」とのこと。クローズドな方針は議論を呼びそう。(とはいえ、公開されたからといって計算リソース的に再現は容易ではないが…)
A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and Future Directions [49.0] クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。 ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。 深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。 論文参考訳(メタデータ) (Wed, 15 Jun 2022 15:05:13 GMT)
A Survey of Automated Data Augmentation Algorithms for Deep Learning-based Image Classication Tasks [21.6] データ駆動技術であるディープモデルは、大量の正確なラベル付きトレーニングデータを必要とします。 Data Augmentation (DA)は、オリジナルのサンプルから新しいイメージを人工的に生成することができる。 データ拡張戦略はデータセットによって異なり、さまざまなデータ型がモデルのトレーニングを容易にするために異なる拡張を必要とする可能性がある。 AutoDAモデルの目的は、モデルの性能向上を最大化できる最適なDAポリシーを見つけることである。 論文参考訳(メタデータ) (Tue, 14 Jun 2022 01:40:09 GMT)
データ拡張に関するサーベイ。
AutoMLのようなAutomated Data Augmentationという研究分野があるらしく参考になる。