欠損を補間すべきかしないべきか

  • To Impute or not to Impute? — Missing Data in Treatment Effect Estimation [84.8]
    我々は,MCM(Mixed Con founded missingness)と呼ばれる新しい欠損機構を同定し,ある欠損度が治療選択を判断し,他の欠損度が治療選択によって決定されることを示した。 本研究は,全てのデータを因果的に入力すると,不偏推定を行うために必要な情報を効果的に除去するので,処理効果のモデルが貧弱になることを示す。 私たちのソリューションは選択的計算であり、CMMからの洞察を使って、どの変数を補間すべきで、どの変数を補間すべきでないかを正確に知らせる。
    論文  参考訳(メタデータ)   (Fri, 4 Feb 2022 12:08:31 GMT)
    • 欠損には補間すべきものとそうではないものがある。介入効果の推定においてそれらをどう取り扱うかを扱った論文
    • 欠損の扱いは様々な場所で議論になり、参考になる

TIML(Task-Informed Meta-Learning ): 農業におけるメタラーニング

  • TIML: Task-Informed Meta-Learning for Agriculture [20.6]
    我々は、データ分散領域における農業文脈におけるメタラーニングの利用を探求する以前の研究に基づいて構築した。 本稿では,タスク固有のメタデータを活用するモデルに依存しないメタラーニングの強化であるタスクインフォームドメタラーニング(TIML)を紹介する。
    論文  参考訳(メタデータ)   (Fri, 4 Feb 2022 13:27:55 GMT)

コード生成のおけるXAI

  • Investigating Explainability of Generative AI for Code through Scenario-based Design [44.4]
    生成AI(GenAI)技術は成熟し、ソフトウェア工学のようなアプリケーションドメインに適用されています。 私たちは43人のソフトウェアエンジニアと9つのワークショップを開催しました。そこでは、最先端のジェネレーティブAIモデルの実例を使って、ユーザの説明可能性のニーズを導き出しました。 我々の研究は、GenAIのコードに対する説明可能性の必要性を探求し、新しいドメインにおけるXAIの技術開発を人間中心のアプローチがいかに促進するかを実証する。
    論文  参考訳(メタデータ)  参考訳(全文)  (Thu, 10 Feb 2022 08:52:39 GMT)
    • 最近流行りつつあるコード生成を対象としたXAIの整理。ワークショップを行い11のカテゴリを特定とのこと。通常のXAIでは見られない(具体化されていない?)項目もあって興味深い。
      • Input、Output、How(global) 、Perfomance、How to 、Control、Why / Why not、Data、System Requirement & Impact、Limitation、What if

AIOpsと解釈性

  • Towards a consistent interpretation of AIOps models [24.2]
    内部整合性,外部整合性,時間整合性という,AIOpsモデルの解釈の整合性について検討する。 学習者からのランダム性、ハイパーパラメータチューニング、データサンプリングは、一貫した解釈を生成するために制御されるべきである。 我々の研究は、実践者が一貫したAIOpsモデルの解釈を引き出すための貴重なガイドラインを提供する。
    論文  参考訳(メタデータ)   (Fri, 4 Feb 2022 18:33:14 GMT)
    • AI Opsと解釈性に関する論文、興味深いサーベイ

ClidSum(Cross-LIngual Dialogue SUMmarization): クロスリンガルな対話要約データセットとmDialBARTモデル

  • ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization [41.7]
    本稿では,対話文書を用いた言語間要約システム構築のためのベンチマークデータセットClidSumを提案する。 それは、2つのサブセット(SAMSumとMediaSum)から67k以上の対話文書と、異なるターゲット言語における112k以上の注釈付き要約からなる。
    論文  参考訳(メタデータ)   (Fri, 11 Feb 2022 13:32:14 GMT)
    • クロスリンガルな対話要約データセットとモデルの提案。データセットの規模は大きく有用そう。モデルはmBART-50ベースで翻訳を併用する手法を上回る性能とのこと。
      • 8ページのSummarize-then-translate、Translate-then-summarizeを含む結果も非常に興味深い
    • リポジトリはGitHub – krystalan/ClidSum: ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization、現状ではコード等はアップロードされておらず今月中にリリース予定とのこと。

CLIPasso(CLIP-guided Semantically-Aware Object Sketching): 抽象度の異なるスケッチ生成

  • CLIPasso: Semantically-Aware Object Sketching [34.5]
    本稿では,幾何学的および意味的単純化によって導かれる抽象レベルが異なるオブジェクトスケッチ手法を提案する。 スケッチをB’ezier曲線の集合として定義し、CLIPに基づく知覚的損失に対して曲線のパラメータを直接最適化するために微分器を使用する。
    論文  参考訳(メタデータ)   (Fri, 11 Feb 2022 18:35:25 GMT)
    • 抽象度(≒ストローク数)の異なるスケッチを自動生成する手法の提案。スケッチデータ(画像/スケッチのペアデータ)を必要とせずCLIPを活用しているのが特徴。プロジェクトサイトにある画像が面白い。
      • CLIPassoって略称があっていない気もするが・・・
    • プロジェクトサイトはCLIPasso: Semantically-Aware Object Sketching

MBCT(Multiple Boosting Calibration Trees): 確率キャリブレーションのためのbinning framework

  • MBCT: Tree-Based Feature-Aware Binning for Individual Uncertainty Calibration [29.8]
    ほとんどの機械学習分類器は分類精度のみを気にするが、特定の応用(医学診断、気象予測、計算広告など)では、校正推定と呼ばれる真の確率を予測するためにモデルを必要とする。 従来の研究では、予測器の出力を処理後、ビンニングやスケーリング法などの校正値を得るためのいくつかの校正法を開発した。我々はMultiple Boosting Trees (MBCT)と呼ばれる特徴認識型バイナリフレームワークを提案する。 本手法はキャリブレーション誤差と順序精度の両方で競合するモデルよりも優れていることがわかった。
    論文  参考訳(メタデータ)   (Wed, 9 Feb 2022 08:59:16 GMT)

LNT(Local Neural Transformations) : 時系列データからの異常検知

GPTスタイルのモデルに対するニューロンタイプの同定とROME(Rank-One Model Editing)による編集

  • Locating and Editing Factual Knowledge in GPT [32.3]
    我々は,モデルの事実予測を変更可能なニューロン活性化を同定するための因果的介入を開発する。 大きなGPTスタイルのモデルでは、我々が仮定する2つの異なるニューロンの集合(抽象的な事実を知る、具体的な言葉を言う)と一致している。 この洞察は、モデル重みに格納された事実を編集する新しい方法であるROMEの開発を刺激する。
    論文  参考訳(メタデータ)   (Thu, 10 Feb 2022 18:59:54 GMT)

TopClus: PLMを用いたトピッククラスタリング