staka – ページ 211 – arXiv最新論文の紹介

GPT-NeoX-20B: オープンソースの巨大言語モデル

GPT-NeoX-20B: An Open-Source Autoregressive Language Model [16.3]
GPT-NeoX-20Bは、Pileで訓練された200億のパラメータの自動回帰言語モデルである。ウェイトは寛容なライセンスで、自由に公開することができる。
論文参考訳（メタデータ） (Thu, 14 Apr 2022 04:00:27 GMT)
- Apache-2とオープンなライセンスの大規模言語モデル。tokenizerなどの工夫でGPT-3などと比べモデル規模の割に性能が高いとのこと。推論であっても2つのGPU（45GB以上のVRAM）が必要。
- 「we hope to train and open source a 175B parameter GPT-3 replication along the way.」というのにも期待大。
- リポジトリはGitHub – EleutherAI/gpt-neox: An implementation of model parallel autoregressive transformers on GPUs, based on the DeepSpeed library.

WikiDiverse: マルチモーダルなエンティティ・リンキングデータセット

WikiDiverse: A Multimodal Entity Linking Dataset with Diversified Contextual Topics and Entity Types [25.6]
MEL(Multimodal Entity Linking)は、知識ベース(例えばWikipedia)からの参照エンティティへの参照をマルチモーダルコンテキストにリンクすることを目的としている。 WikiDiverseは、Wikinewsのコンテキストトピックやエンティティタイプを多用した、高品質な人間アノテーション付きMELデータセットである。 WikiDiverseに基づいて、モダリティ内およびモダリティ間注目を伴うよく設計されたMELモデルのシーケンスを実装した。
論文参考訳（メタデータ） (Wed, 13 Apr 2022 12:52:40 GMT)
- 画像を併用したエンティティリンキングのデータセット。人の手が入っておりクオリティが高いとのこと。ベースラインモデルでもマルチモーダルなデータ活用は有効そう。データ数は8Kキャプション、ライセンスはCC BY-SA 4.0。
- リポジトリはGitHub – wangxw5/wikiDiverse

NumGLUE: 数学的推論のデータセット

NumGLUE: A Suite of Fundamental yet Challenging Mathematical Reasoning Tasks [37.7]
8つのタスクでAIシステムの性能を評価するベンチマークであるNumGLUEを提案する。このベンチマークは、最先端の大規模言語モデルを含むニューラルモデルで解決されるには程遠い。我々はNumGLUEが言語内で堅牢で一般的な算術推論を行うシステムを促進することを願っている。
論文参考訳（メタデータ） (Tue, 12 Apr 2022 09:36:10 GMT)
- 以下8タスクからなる数学的推論タスクのデータセット。ベースラインも用意されているがかなり困難なタスクに見える。
  - TASK 1 Commonsense + Arithmetic
  - TASK 2 Domain specific + Arithmetic
  - TASK 3 Commonsense + Quantitative
  - TASK 4 Fill-in-the-blanks
  - TASK 5 RC + Explicit Numerical Reasoning
  - TASK 6 RC + Implicit Numerical Reasoning
  - TASK 7 Quantitative NLI
  - TASK 8 Arithmetic word problems
プロジェクトサイトはNumGLUE Dataset — Allen Institute for AI (allenai.org)

引用と再現性の関係

Does the Market of Citations Reward Reproducible Work? [36.8]
医学や機械学習(ML)などの特定の研究分野は、再現性のある作品とより多くの引用を関連付けていることを示す。コードを利用可能にし、事前作業を徹底的に参照することは、引用の増加と肯定的に相関しているように見える。
論文参考訳（メタデータ） (Fri, 8 Apr 2022 04:03:17 GMT)
- 引用と再現性に関する研究。「再現不可能な論文がより多くの引用を得る」ようなことはなく引用と再現性は正の相関または独立。機械学習分野では徹底的な引用、コードの共有といった望ましい行動（desirable behaviors）と正の相関があるとのこと。
- 分析コード等はGitHub – EdwardRaff/ReproducibleCitationsで公開されている。

Dynatask: ベンチマーク作成用フレームワーク

Dynatask: A Framework for Creating Dynamic AI Benchmark Tasks [31.5]
Dynataskは、カスタムNLPタスクを設定するためのオープンソースのシステムである。 AIのベンチマークを再考する研究プラットフォームであるDynabenchと統合されている。
論文参考訳（メタデータ）参考訳（全文） (Tue, 5 Apr 2022 00:32:04 GMT)
- ベンチマークを作成するためのフレームワーク。
- Dynabench
- リポジトリはGitHub – facebookresearch/dynabench: Dynamic Adversarial Benchmarking platform

Web Phishing Detection回避とその対策

Towards Web Phishing Detection Limitations and Mitigation [21.7]
フィッシングサイトが機械学習に基づく検出をバイパスする方法を示す。 100Kフィッシング・ベナンサイトを用いた実験では、有望な精度(98.8%)を示した。本稿では,ロジスティック回帰に基づくよりレジリエントなモデルであるAnti-SubtlePhishを提案する。
論文参考訳（メタデータ） (Sun, 3 Apr 2022 04:26:04 GMT)
- フィッシングサイトがMLベースの検出をバイパスしている方法の調査とその対策の提案。13,000のフィッシングページにわたる詳細なケーススタディを行っているとのことで面白い内容。
- 提案されているAnti-SubtlePhishは主として特徴量の強化を行っている。最終的なレンダリング結果を使うことが重要そう。

ロボットへの自然言語によるフィードバック

Correcting Robot Plans with Natural Language Feedback [88.9]
既存の補正方法(例えばジョイスティックの使用やエンドエフェクターの直接操作など)は完全な遠隔操作やリアルタイム操作を必要とする。本稿では,ロボット訂正のための表現的かつ柔軟なツールとして自然言語を探索する。これらの変換により、ユーザは目標を正し、ロボットの動きを更新し、計画上のエラーから回復できる。本手法により,シミュレーション環境や実環境において,複数の制約を合成し,未知のシーン,オブジェクト,文に一般化することが可能となる。
論文参考訳（メタデータ）参考訳（全文） (Mon, 11 Apr 2022 15:22:43 GMT)
- 自然言語でロボットにフィードバックするという未来を感じる研究。

CoCoSoDa: Code search with multimodal Contrastive learning and Soft Data augmentation

Enhancing Semantic Code Search with Multimodal Contrastive Learning and Soft Data Augmentation [50.1]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文参考訳（メタデータ） (Fri, 8 Apr 2022 03:03:48 GMT)
- コードスニペットの検索タスクにおいて優れた性能を達成、とのことだがマルチモーダルの意味は自然言語とソースコードということなのだろうか。。

マルチリンガルな検索におけるベストプラクティスに向けて

Towards Best Practices for Training Multilingual Dense Retrieval Models [54.9]
我々は,このような設計を用いて,多種多様言語における単言語検索の課題に焦点をあてる。本研究は多言語高密度検索モデルのトレーニングのための「ベストプラクティス」ガイドとして組織されている。
論文参考訳（メタデータ） (Tue, 5 Apr 2022 17:12:53 GMT)
- (1) マルチリンガルな事前学習モデルはあるがデータはない、(2) マルチリンガルな事前学習モデルとデータの両方がある（データの言語でいくつかのバリエーションが存在）、(3)　データはあるが事前学習モデルがない、のパターンでどのような対応がありえるかまとめた論文。
- 結果は参考にはなるのだが、機械翻訳を挟むアプローチが検討されていないのはなぜなんだろう・・・？

PERFECT: Prompt-free and Efficient paRadigm for FEw-shot Cloze-based fine-Tuning

PERFECT: Prompt-free and Efficient Few-shot Learning with Language Models [67.4]
PERFECTは、手工芸に頼らずに数発のPLMを微調整するためのシンプルで効率的な方法である。そこで本研究では,手作業によるタスクプロンプトを,サンプル効率の良い微調整が可能なタスク固有アダプタに置き換えることができることを示す。幅広い数発のNLPタスクの実験では、PERFECTはシンプルで効率的でありながら、既存の最先端の数発の学習方法よりも優れていることが示されている。
論文参考訳（メタデータ）参考訳（全文） (Sun, 3 Apr 2022 22:31:25 GMT)
- 手作業のプロンプト作成を排除するため、タスクを表すAdaptor層をチューニング可能なアーキテクチャ。手作業無しで優れた性能を達成とのこと。
- リポジトリはGitHub – rabeehk/perfect

2025年7月
月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31