- ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization [41.7]
本稿では,対話文書を用いた言語間要約システム構築のためのベンチマークデータセットClidSumを提案する。 それは、2つのサブセット(SAMSumとMediaSum)から67k以上の対話文書と、異なるターゲット言語における112k以上の注釈付き要約からなる。
論文 参考訳(メタデータ) (Fri, 11 Feb 2022 13:32:14 GMT)- クロスリンガルな対話要約データセットとモデルの提案。データセットの規模は大きく有用そう。モデルはmBART-50ベースで翻訳を併用する手法を上回る性能とのこと。
- 8ページのSummarize-then-translate、Translate-then-summarizeを含む結果も非常に興味深い
- リポジトリはGitHub – krystalan/ClidSum: ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization、現状ではコード等はアップロードされておらず今月中にリリース予定とのこと。
- クロスリンガルな対話要約データセットとモデルの提案。データセットの規模は大きく有用そう。モデルはmBART-50ベースで翻訳を併用する手法を上回る性能とのこと。
日: 2022年2月15日
CLIPasso(CLIP-guided Semantically-Aware Object Sketching): 抽象度の異なるスケッチ生成
- CLIPasso: Semantically-Aware Object Sketching [34.5]
本稿では,幾何学的および意味的単純化によって導かれる抽象レベルが異なるオブジェクトスケッチ手法を提案する。 スケッチをB’ezier曲線の集合として定義し、CLIPに基づく知覚的損失に対して曲線のパラメータを直接最適化するために微分器を使用する。
論文 参考訳(メタデータ) (Fri, 11 Feb 2022 18:35:25 GMT)- 抽象度(≒ストローク数)の異なるスケッチを自動生成する手法の提案。スケッチデータ(画像/スケッチのペアデータ)を必要とせずCLIPを活用しているのが特徴。プロジェクトサイトにある画像が面白い。
- CLIPassoって略称があっていない気もするが・・・
- プロジェクトサイトはCLIPasso: Semantically-Aware Object Sketching
- 抽象度(≒ストローク数)の異なるスケッチを自動生成する手法の提案。スケッチデータ(画像/スケッチのペアデータ)を必要とせずCLIPを活用しているのが特徴。プロジェクトサイトにある画像が面白い。
MBCT(Multiple Boosting Calibration Trees): 確率キャリブレーションのためのbinning framework
- MBCT: Tree-Based Feature-Aware Binning for Individual Uncertainty Calibration [29.8]
ほとんどの機械学習分類器は分類精度のみを気にするが、特定の応用(医学診断、気象予測、計算広告など)では、校正推定と呼ばれる真の確率を予測するためにモデルを必要とする。 従来の研究では、予測器の出力を処理後、ビンニングやスケーリング法などの校正値を得るためのいくつかの校正法を開発した。我々はMultiple Boosting Trees (MBCT)と呼ばれる特徴認識型バイナリフレームワークを提案する。 本手法はキャリブレーション誤差と順序精度の両方で競合するモデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (Wed, 9 Feb 2022 08:59:16 GMT)- ビニングの方法(ビニング先)を学習するモデルを使うことでProbability calibrationをうまくやれるとの報告。(分野によっては)非常に重要な結果。
- リポジトリはGitHub – huangsg1/Tree-Based-Feature-Aware-Binning-for-Individual-Uncertainty-Calibration
LNT(Local Neural Transformations) : 時系列データからの異常検知
- Detecting Anomalies within Time Series using Local Neural Transformations [30.7]
局所ニューラルトランスフォーメーション(Local Neural Transformations, LNT)は、データから時系列の局所変換を学ぶ方法である。 LNTは各タイムステップ毎に異常スコアを生成し、したがって時系列内の異常を検出するために使用できる。 我々の実験は,LNTがLibriSpeechデータセットから音声セグメントの異常を見つけ,サイバー物理システムへの割り込みを従来よりもより正確に検出できることを実証した。
論文 参考訳(メタデータ) (Tue, 8 Feb 2022 15:51:31 GMT)- self-supervised を活用して一定期間ごとの表現を学習、時系列での異常検知に活用、優れた性能を達成。
- リポジトリはGitHub – boschresearch/local_neural_transformations: Companion code for the self-supervised anomaly detection algorithm proposed in the paper “Detecting Anomalies within Time Series using Local Neural Transformations” by Tim Schneider et al.