オノマトペデータセットと検出・認識・リンク

  • COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary or Truncated Texts [47.5]
    日本語漫画におけるオノマトペのテキストからなる新しい漫画オノマトペデータセット(COO)を提供する。 COOは、非常に湾曲した、部分的に縮小したテキスト、任意に配置されたテキストなど、多くの任意のテキストを持っている。 我々は,オノマトペ領域を検出し,その意図した意味を捉えるために,テキスト検出,テキスト認識,リンク予測という3つのタスクを実行する。
    論文  参考訳(メタデータ)  参考訳(全文)  (Mon, 11 Jul 2022 07:39:35 GMT)

BigBIO

  • BigBIO: A Framework for Data-Centric Biomedical Natural Language Processing [13.3]
    バイオメディカルNLPデータセット126以上のコミュニティライブラリであるBigBIOを紹介する。 BigBIOは、データセットとそのメタデータへのプログラムアクセスを通じて、再現可能なメタデータキュレーションを容易にする。 本稿では,タスクスキーマ,データ監査,コントリビューションガイドライン,および2つの実証的ユースケースの概要について論じる。
    論文  参考訳(メタデータ)   (Thu, 30 Jun 2022 07:15:45 GMT)
    • バイオ・医療分野のデータセット。126のデータセットがありタスクカテゴリは以下の12とのこと。
      • Knowledge Base (KB)
        • Named entity recognition (NER)
        • Named entity disambiguation/normalization/linking (NED)
        • Event extraction (EE)
        • Relation extraction (RE)
        • Coreference resolution (COREF)
      • Question Answering (QA)
        • Question answering (QA)
      • Textual Entailment (TE)
        • Textual entailment (TE)
      • Text Pairs (PAIRS)
        • Semantic Similarity (STS)
      • Text to Text (T2T)
        • Paraphasing (PARA)
        • Translation (TRANSL)
        • Summarization (SUM)
      • Text (TEXT)
        • Text classification (TXTCLASS)

Quantum Neural Network Compression

  • Quantum Neural Network Compression [23.2]
    量子ニューラルネットワークと古典ニューラルネットワークの圧縮には相違点があることが示されている。 我々は、量子ニューラルネットワークを圧縮する最初の体系的フレームワーク、CompVQCを提案する。
    論文  参考訳(メタデータ)   (Tue, 5 Jul 2022 15:19:43 GMT)
    • Quantum Neural Networks (QNNs)の性質を利用したモデル圧縮。量子ニューラルネットワークが流行るかは分からないが、通常のモデルとの違いが面白い。

Traveling Salesperson Problem + 深層強化学習

Visual Context Augmented Dialogue Systemのサーベイ

  • Enabling Harmonious Human-Machine Interaction with Visual-Context Augmented Dialogue System: A Review [40.5]
    Visual Context Augmented Dialogue System (VAD) は、マルチモーダル情報を知覚し理解することで人間とコミュニケーションする能力を持つ。 VADは、エンゲージメントとコンテキスト対応の応答を生成する可能性を秘めている。
    論文  参考訳(メタデータ)   (Sat, 2 Jul 2022 09:31:37 GMT)
    • マルチモーダルな情報を利用する対話システムのサーベイ。

テーブルデータに対するTransfer Learning

  • Transfer Learning with Deep Tabular Models [66.7]
    正確性はさておき、ニューラルモデルの大きな利点は、再利用可能な機能を学び、新しいドメインで簡単に微調整できることだ。上流データにより、ニューラルネットワークはGBDTモデルよりも決定的な優位性を示す。 そこで本研究では,表在化学習のための現実的な診断ベンチマークを提案する。 上流と下流の特徴セットが異なる場合の擬似特徴法を提案する。
    論文  参考訳(メタデータ)  参考訳(全文)  (Thu, 30 Jun 2022 14:24:32 GMT)

事前学習モデルのTransferability のスクリーング

  • Not All Models Are Equal: Predicting Model Transferability in a Self-challenging Fisher Space [51.6]
    本稿では、トレーニング済みのディープニューラルネットワークのランク付けと、下流タスクにおける最も転送可能なニューラルネットワークのスクリーニングの問題に対処する。 Self-challenging Fisher Discriminant Analysis (SFDA)と呼ばれる新しい転送可能性指標を提案する。
    論文  参考訳(メタデータ)   (Thu, 7 Jul 2022 01:33:25 GMT)
    • 事前学習モデルがどの程度下流タスクにフィットしているかを確かめる方法の提案
    • リポジトリはTencentARC/SFDA · GitHub (今はempty)

Causal Machine Learning

  • Causal Machine Learning: A Survey and Open Problems [33.8]
    Causal Machine Learning (CausalML)は、データ生成過程を構造因果モデル(Structure causal model, SCM)として定式化する機械学習手法の略称である。 1) 因果関係の学習, (2) 因果関係の生成モデル, (3) 因果関係の説明, (4) 因果関係の公正性,(5) 因果関係の強化学習。
    論文  参考訳(メタデータ)   (Thu, 30 Jun 2022 17:59:15 GMT)
    • CausalMLのサーベイ。非常に詳しくサーベイというより教科書的な内容。
    • このレベルのものがCC BYで読めてしまうのはすごいと思う。

Transfer Learningとバイアス

  • When does Bias Transfer in Transfer Learning? [89.2]
    トランスファーラーニングを使用して、トレーニング済みの”ソースモデル”を下流の”ターゲットタスク”に適応させることで、ダウンサイドのないように見えるパフォーマンスを劇的に向上させることができる。 結局のところ、バイアス伝達や、モデルがターゲットクラスに適応した後でも、ソースモデルのバイアスが持続する傾向というマイナス面が存在することを実証する。
    論文  参考訳(メタデータ)   (Wed, 6 Jul 2022 17:58:07 GMT)
    • バイアスがかかった事前学習モデルをTransfer Learningで利用した場合、データセットにバイアスが無くても、最終的なモデルにバイアスが発生するとの報告。危険性を認識しておく必要がある。
    • リポジトリはGitHub – MadryLab/bias-transfer

長文要約のサーベイ

  • An Empirical Survey on Long Document Summarization: Datasets, Models and Metrics [33.7]
    本稿では,長い文書要約研究の概要について概説する。 我々は、現在の研究の進展に対する視点を広げるために、実証分析を行う。
    論文  参考訳(メタデータ)   (Sun, 3 Jul 2022 02:57:22 GMT)