コンテンツへスキップ
- Detecting Anomalies within Time Series using Local Neural Transformations [30.7]
局所ニューラルトランスフォーメーション(Local Neural Transformations, LNT)は、データから時系列の局所変換を学ぶ方法である。 LNTは各タイムステップ毎に異常スコアを生成し、したがって時系列内の異常を検出するために使用できる。 我々の実験は,LNTがLibriSpeechデータセットから音声セグメントの異常を見つけ,サイバー物理システムへの割り込みを従来よりもより正確に検出できることを実証した。
論文 参考訳(メタデータ) (Tue, 8 Feb 2022 15:51:31 GMT)
- Locating and Editing Factual Knowledge in GPT [32.3]
我々は,モデルの事実予測を変更可能なニューロン活性化を同定するための因果的介入を開発する。 大きなGPTスタイルのモデルでは、我々が仮定する2つの異なるニューロンの集合(抽象的な事実を知る、具体的な言葉を言う)と一致している。 この洞察は、モデル重みに格納された事実を編集する新しい方法であるROMEの開発を刺激する。
論文 参考訳(メタデータ) (Thu, 10 Feb 2022 18:59:54 GMT)
- Topic Discovery via Latent Space Clustering of Pretrained Language Model Representations [35.7]
本研究では, PLM 埋め込みを基盤とした空間学習とクラスタリングの連携フレームワークを提案する。 提案モデルでは,トピック発見のためにPLMがもたらす強力な表現力と言語的特徴を効果的に活用する。
論文 参考訳(メタデータ) (Wed, 9 Feb 2022 17:26:08 GMT)
- Generating Training Data with Language Models: Towards Zero-Shot Language Understanding [35.9]
事前訓練された言語モデル(PLM)は、様々な自然言語処理タスクにおいて顕著な性能を示した。 NLUタスクのゼロショット学習に両タイプのPLMを用いる簡単な手法を提案する。 提案手法は,GLUEベンチマークの7つの分類タスクに対して高い性能を示す。
論文 参考訳(メタデータ) (Wed, 9 Feb 2022 16:02:18 GMT)
- Mental Stress Detection using Data from Wearable and Non-wearable Sensors: A Review [11.1]
ヒトのストレス反応を測定する方法は、ウェアラブルと非ウェアラブルセンサーのデータを用いて観察された主観的アンケートと客観的マーカーを含むことができる。 各種情報源からの関連データを利用して, ストレス検出手法が人工知能の恩恵を受ける方法について検討する。
論文 参考訳(メタデータ) (Mon, 7 Feb 2022 09:48:46 GMT)- ウェアラブル(脳波や筋電、心拍など)、非ウェアラブル(瞳孔、音声、熱など)センサーからストレス反応を検出できるかのサーベイ。本文だけで67ページと広範な内容。
- NEWSKVQA: Knowledge-Aware News Video Question Answering [5.7]
我々は,ニュースビデオの文脈において,知識に基づく質問に答えることという,ビデオ質問応答の新しいフロンティアを探求する。 我々は156時間にまたがる12Kのニュースビデオの新しいデータセットを、8263のユニークなエンティティをカバーする100万の質問回答ペアでキュレートする。 本稿では,テキストによる複数選択質問やビデオ,その書き起こしや知識ベースに対するマルチモーダル推論を行う新しい手法NEWSKVQAを提案する。
論文 参考訳(メタデータ) (Tue, 8 Feb 2022 17:31:31 GMT)- ニュースビデオに対するVQA。12Kビデオクリップ、1M QAと非常に大規模なデータ。
- 論文中にデータセットへのリンク(Google Driveへのリンク)が存在
- JaQuAD: Japanese Question Answering Dataset for Machine Reading Comprehension [0.0]
本稿では,日本語質問応答データセットJaQuADについて述べる。 JaQuADは日本語ウィキペディアの記事に39,696の質問対を抽出する。 F1スコアが78.92%、テストセットが63.38%となるベースラインモデルを微調整した。
論文 参考訳(メタデータ) 参考訳(全文) (Thu, 3 Feb 2022 18:40:25 GMT)
- DALL-Eval: Probing the Reasoning Skills and Social Biases of Text-to-Image Generative Transformers [83.1]
マルチモーダル変換言語モデルであるDALL-Eとその変種は高品質なテキスト・画像生成機能を示している。 興味深い画像生成結果にもかかわらず、そのようなモデルの評価方法に関する詳細な分析は行われていない。 本研究では,このようなテキスト対画像生成トランスフォーマの推論能力と社会的バイアスについて詳細に検討する。 近年のテキスト・ツー・イメージモデルでは,色認識や空間的関係の理解よりもオブジェクトの認識とカウントが優れていることを示す。
論文 参考訳(メタデータ) (Tue, 8 Feb 2022 18:36:52 GMT)
- The Met Dataset: Instance-level Recognition for Artworks [19.4]
この研究は、アートワークの領域における大規模インスタンスレベルの認識のためのデータセットを導入している。 私たちは、約224kクラスの大規模なトレーニングセットを形成するために、The Met博物館のオープンアクセスコレクションに依存しています。
論文 参考訳(メタデータ) (Thu, 3 Feb 2022 18:13:30 GMT)
- A Survey on Retrieval-Augmented Text Generation [53.0]
Retrieval-augmented text generationは顕著な利点があり、多くのNLPタスクで最先端のパフォーマンスを実現している。 まず、検索拡張生成の一般的なパラダイムを強調し、異なるタスクに応じて注目すべきアプローチをレビューする。
論文 参考訳(メタデータ) 参考訳(全文) (Wed, 2 Feb 2022 16:18:41 GMT)- 検索を併用するテキスト生成に関するサーベイ
- サーベイとしては短め(がゆえに)簡潔にまとまっていて参考になる