Retrieval-augmented text generationのサーベイ

  • A Survey on Retrieval-Augmented Text Generation [53.0]
    Retrieval-augmented text generationは顕著な利点があり、多くのNLPタスクで最先端のパフォーマンスを実現している。 まず、検索拡張生成の一般的なパラダイムを強調し、異なるタスクに応じて注目すべきアプローチをレビューする。
    論文  参考訳(メタデータ)  参考訳(全文)  (Wed, 2 Feb 2022 16:18:41 GMT)
    • 検索を併用するテキスト生成に関するサーベイ
    • サーベイとしては短め(がゆえに)簡潔にまとまっていて参考になる

DrugOOD: AI支援創薬のためのベンチマーク

  • DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for AI-aided Drug Discovery — A Focus on Affinity Prediction Problems with Noise Annotations [90.3]
    我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるDrugOOD を提案する。 DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。 我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
    論文  参考訳(メタデータ)   (Mon, 24 Jan 2022 12:32:48 GMT)

Table Pretraining: 表形式を扱うフレームワークのサーベイ

  • Table Pretraining: A Survey on Model Architectures, Pretraining Objectives, and Downstream Tasks [37.4]
    テキストや画像の成功を受けて、テーブル事前学習フレームワークの急激な普及が提案されている。 表の事前訓練は通常、表とテキストの合同の事前訓練の形式を取る。 この調査は、異なるモデル設計の包括的なレビュー、事前学習の目的、およびテーブル事前学習のための下流タスクを提供することを目的としている。
    論文  参考訳(メタデータ)   (Mon, 24 Jan 2022 15:22:24 GMT)
    • 表やテキスト構造へのDeep Learning適用のサーベイ。table question answeringやtable type recognitionといった表を含むドメインの問題やテーブルデータへのDeep Learning適用(TabTransformerやSAINT)が対象になっている。
    • この分野を概観するには良いが詳細を知るには挙げられた論文を読む必要がありそう。

Video Transformerのサーベイ

  • Video Transformers: A Survey [42.3]
    ビデオデータのモデル化にトランスフォーマーを適用するための貢献とトレンドについて検討する。 具体的には、ビデオの埋め込みとトークン化の方法を掘り下げて、大きなCNNバックボーンの非常にウィドスプレッドな使用法を見つけます。 また,ビデオトランスフォーマーの訓練に使用される自己監督的損失の分析を行った。
    論文  参考訳(メタデータ)   (Sun, 16 Jan 2022 07:31:55 GMT)
    • 動画処理にもTransformerが使われていることがよくわかるサーベイ

転送可能性に関するサーベイ

  • Transferability in Deep Learning: A Survey [80.7]
    知識を習得し再利用する能力は、ディープラーニングにおける伝達可能性として知られている。 本研究は,深層学習における異なる孤立領域と伝達可能性との関係を関連付けるための調査である。 我々はベンチマークとオープンソースライブラリを実装し、転送可能性の観点からディープラーニング手法の公平な評価を可能にする。
    論文  参考訳(メタデータ)   (Sat, 15 Jan 2022 15:03:17 GMT)

機械学習を用いたアンチマネーロンダリングのサーベイ

  • Fighting Money Laundering with Statistics and Machine Learning: An Introduction and Review [95.4]
    マネーロンダリングは深刻なグローバルな問題です。 このトピックに関する統計学と機械学習の研究はほとんどない。 大きな課題の1つは、公開データセットの欠如である。
    論文  参考訳(メタデータ)   (Thu, 13 Jan 2022 13:54:31 GMT)
    • AI利用のアンチマネーロンダリングのサーベイ。想像がつくことではあるが公開されているデータがほぼないことが大きな課題。これに加えて不均衡データであることも課題として挙げられている。
    • 様々な取り組みを振り返るには良い内容。

事前学習モデルを活用した文書生成のサーベイ

  • A Survey of Pretrained Language Models Based Text Generation [97.6]
    テキスト生成は、入力データから人間の言語で可読で読みやすいテキストを生成することを目的としている。 ディープラーニングは、ニューラルジェネレーションモデル、特に事前学習言語モデル(PLM)のパラダイムにより、この分野を大幅に進歩させた。 PLM上でのテキスト生成は、学術と産業の両方において有望な方向と見なされている。
    論文  参考訳(メタデータ)   (Fri, 14 Jan 2022 01:44:58 GMT)

空中監視タスクのサーベイ

  • The State of Aerial Surveillance: A Survey [62.2]
    本稿では、コンピュータビジョンとパターン認識の観点から、空中監視タスクの概要を概観する。 主な対象は人間であり、単体または複数の被験者が検出され、特定され、追跡され、再同定され、その振る舞いが分析される。
    論文  参考訳(メタデータ)   (Sun, 9 Jan 2022 20:13:27 GMT)
    • ドローン等を用いて空中から人を監視するタスクのサーベイ。対象のタスクはdetection, tracking, identification, action recognition。データセットの概要やモデル、難しさ(課題)など非常に参考になる。
      • 未解決の課題は画像処理分野一般に言えることだと思うが、撮像時の解像度の低さや環境ノイズの多さのカバーやOnboard computingの重要性などはこの分野で特徴的なのかなと思った。

「Related Work」の自動生成に関するサーベイ

  • Automatic Related Work Generation: A Meta Study [5.0]
    自然言語処理では、通常「関連作業」という節で文献レビューが行われる。 自動作業生成の課題は, 「関連作業」 セクションを自動生成することである。 本稿では,問題定式化,データセット収集,方法論的アプローチ,性能評価,今後の展望の観点から,関連作業生成に関する既存の文献をメタスタディで比較する。
    論文  参考訳(メタデータ)   (Thu, 6 Jan 2022 01:16:38 GMT)
    • 論文にだいたいある「Related works」を自動生成することを目的とした研究のサーベイ。有用そう&今であれば出来そうな気もしつつ難しそうな気もするタスクであるが、サーベイからは発展途上との印象をうける。

(DeepLearningな)手話生成に関するサーベイ

  • All You Need In Sign Language Production [50.4]
    手話の認識と生成のためには、いくつかの重要な課題に対処する必要があります。本稿ではSLP( Sign Language Production)のバックボーンアーキテクチャや手法を簡潔に紹介し、SLPの分類について提案する。 最後に、SLPと性能評価のための一般的なフレームワーク、およびSLPの最近の発展、利点、限界に関する議論について、今後の研究の行程についてコメントする。
    論文  参考訳(メタデータ)   (Thu, 6 Jan 2022 18:10:58 GMT)
    • 深層学習を中心とした手話に関するサーベイ。その中でもSign Language Productionに焦点を当てており、題名の通り包括的なサーベイの印象。Sign Language Recognition (SLR)とSign Language Production (SLP)の問題の違いなどが参考になった。