ClidSum(Cross-LIngual Dialogue SUMmarization): クロスリンガルな対話要約データセットとmDialBARTモデル

  • ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization [41.7]
    本稿では,対話文書を用いた言語間要約システム構築のためのベンチマークデータセットClidSumを提案する。 それは、2つのサブセット(SAMSumとMediaSum)から67k以上の対話文書と、異なるターゲット言語における112k以上の注釈付き要約からなる。
    論文  参考訳(メタデータ)   (Fri, 11 Feb 2022 13:32:14 GMT)
    • クロスリンガルな対話要約データセットとモデルの提案。データセットの規模は大きく有用そう。モデルはmBART-50ベースで翻訳を併用する手法を上回る性能とのこと。
      • 8ページのSummarize-then-translate、Translate-then-summarizeを含む結果も非常に興味深い
    • リポジトリはGitHub – krystalan/ClidSum: ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization、現状ではコード等はアップロードされておらず今月中にリリース予定とのこと。

CLIPasso(CLIP-guided Semantically-Aware Object Sketching): 抽象度の異なるスケッチ生成

  • CLIPasso: Semantically-Aware Object Sketching [34.5]
    本稿では,幾何学的および意味的単純化によって導かれる抽象レベルが異なるオブジェクトスケッチ手法を提案する。 スケッチをB’ezier曲線の集合として定義し、CLIPに基づく知覚的損失に対して曲線のパラメータを直接最適化するために微分器を使用する。
    論文  参考訳(メタデータ)   (Fri, 11 Feb 2022 18:35:25 GMT)
    • 抽象度(≒ストローク数)の異なるスケッチを自動生成する手法の提案。スケッチデータ(画像/スケッチのペアデータ)を必要とせずCLIPを活用しているのが特徴。プロジェクトサイトにある画像が面白い。
      • CLIPassoって略称があっていない気もするが・・・
    • プロジェクトサイトはCLIPasso: Semantically-Aware Object Sketching

MBCT(Multiple Boosting Calibration Trees): 確率キャリブレーションのためのbinning framework

  • MBCT: Tree-Based Feature-Aware Binning for Individual Uncertainty Calibration [29.8]
    ほとんどの機械学習分類器は分類精度のみを気にするが、特定の応用(医学診断、気象予測、計算広告など)では、校正推定と呼ばれる真の確率を予測するためにモデルを必要とする。 従来の研究では、予測器の出力を処理後、ビンニングやスケーリング法などの校正値を得るためのいくつかの校正法を開発した。我々はMultiple Boosting Trees (MBCT)と呼ばれる特徴認識型バイナリフレームワークを提案する。 本手法はキャリブレーション誤差と順序精度の両方で競合するモデルよりも優れていることがわかった。
    論文  参考訳(メタデータ)   (Wed, 9 Feb 2022 08:59:16 GMT)

LNT(Local Neural Transformations) : 時系列データからの異常検知