arXiv – ページ 199 – arXiv最新論文の紹介

コード生成のおけるXAI

Investigating Explainability of Generative AI for Code through Scenario-based Design [44.4]
生成AI(GenAI)技術は成熟し、ソフトウェア工学のようなアプリケーションドメインに適用されています。私たちは43人のソフトウェアエンジニアと9つのワークショップを開催しました。そこでは、最先端のジェネレーティブAIモデルの実例を使って、ユーザの説明可能性のニーズを導き出しました。我々の研究は、GenAIのコードに対する説明可能性の必要性を探求し、新しいドメインにおけるXAIの技術開発を人間中心のアプローチがいかに促進するかを実証する。
論文参考訳（メタデータ）参考訳（全文） (Thu, 10 Feb 2022 08:52:39 GMT)
- 最近流行りつつあるコード生成を対象としたXAIの整理。ワークショップを行い11のカテゴリを特定とのこと。通常のXAIでは見られない（具体化されていない？）項目もあって興味深い。
  - Input、Output、How(global) 、Perfomance、How to 、Control、Why / Why not、Data、System Requirement & Impact、Limitation、What if

AIOpsと解釈性

Towards a consistent interpretation of AIOps models [24.2]
内部整合性,外部整合性,時間整合性という,AIOpsモデルの解釈の整合性について検討する。学習者からのランダム性、ハイパーパラメータチューニング、データサンプリングは、一貫した解釈を生成するために制御されるべきである。我々の研究は、実践者が一貫したAIOpsモデルの解釈を引き出すための貴重なガイドラインを提供する。
論文参考訳（メタデータ） (Fri, 4 Feb 2022 18:33:14 GMT)
- AI Opsと解釈性に関する論文、興味深いサーベイ

ClidSum(Cross-LIngual Dialogue SUMmarization): クロスリンガルな対話要約データセットとmDialBARTモデル

ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization [41.7]
本稿では,対話文書を用いた言語間要約システム構築のためのベンチマークデータセットClidSumを提案する。それは、2つのサブセット(SAMSumとMediaSum)から67k以上の対話文書と、異なるターゲット言語における112k以上の注釈付き要約からなる。
論文参考訳（メタデータ） (Fri, 11 Feb 2022 13:32:14 GMT)
- クロスリンガルな対話要約データセットとモデルの提案。データセットの規模は大きく有用そう。モデルはmBART-50ベースで翻訳を併用する手法を上回る性能とのこと。
  - 8ページのSummarize-then-translate、Translate-then-summarizeを含む結果も非常に興味深い
- リポジトリはGitHub – krystalan/ClidSum: ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization、現状ではコード等はアップロードされておらず今月中にリリース予定とのこと。

CLIPasso(CLIP-guided Semantically-Aware Object Sketching): 抽象度の異なるスケッチ生成

CLIPasso: Semantically-Aware Object Sketching [34.5]
本稿では,幾何学的および意味的単純化によって導かれる抽象レベルが異なるオブジェクトスケッチ手法を提案する。スケッチをB’ezier曲線の集合として定義し、CLIPに基づく知覚的損失に対して曲線のパラメータを直接最適化するために微分器を使用する。
論文参考訳（メタデータ） (Fri, 11 Feb 2022 18:35:25 GMT)
- 抽象度（≒ストローク数）の異なるスケッチを自動生成する手法の提案。スケッチデータ（画像/スケッチのペアデータ）を必要とせずCLIPを活用しているのが特徴。プロジェクトサイトにある画像が面白い。
  - CLIPassoって略称があっていない気もするが・・・
- プロジェクトサイトはCLIPasso: Semantically-Aware Object Sketching

MBCT(Multiple Boosting Calibration Trees): 確率キャリブレーションのためのbinning framework

MBCT: Tree-Based Feature-Aware Binning for Individual Uncertainty Calibration [29.8]
ほとんどの機械学習分類器は分類精度のみを気にするが、特定の応用(医学診断、気象予測、計算広告など)では、校正推定と呼ばれる真の確率を予測するためにモデルを必要とする。従来の研究では、予測器の出力を処理後、ビンニングやスケーリング法などの校正値を得るためのいくつかの校正法を開発した。我々はMultiple Boosting Trees (MBCT)と呼ばれる特徴認識型バイナリフレームワークを提案する。本手法はキャリブレーション誤差と順序精度の両方で競合するモデルよりも優れていることがわかった。
論文参考訳（メタデータ） (Wed, 9 Feb 2022 08:59:16 GMT)
- ビニングの方法（ビニング先）を学習するモデルを使うことでProbability calibrationをうまくやれるとの報告。（分野によっては）非常に重要な結果。
- リポジトリはGitHub – huangsg1/Tree-Based-Feature-Aware-Binning-for-Individual-Uncertainty-Calibration

LNT(Local Neural Transformations) : 時系列データからの異常検知

Detecting Anomalies within Time Series using Local Neural Transformations [30.7]
局所ニューラルトランスフォーメーション(Local Neural Transformations, LNT)は、データから時系列の局所変換を学ぶ方法である。 LNTは各タイムステップ毎に異常スコアを生成し、したがって時系列内の異常を検出するために使用できる。我々の実験は,LNTがLibriSpeechデータセットから音声セグメントの異常を見つけ,サイバー物理システムへの割り込みを従来よりもより正確に検出できることを実証した。
論文参考訳（メタデータ） (Tue, 8 Feb 2022 15:51:31 GMT)
- self-supervised を活用して一定期間ごとの表現を学習、時系列での異常検知に活用、優れた性能を達成。
- リポジトリはGitHub – boschresearch/local_neural_transformations: Companion code for the self-supervised anomaly detection algorithm proposed in the paper “Detecting Anomalies within Time Series using Local Neural Transformations” by Tim Schneider et al.

GPTスタイルのモデルに対するニューロンタイプの同定とROME(Rank-One Model Editing)による編集

Locating and Editing Factual Knowledge in GPT [32.3]
我々は,モデルの事実予測を変更可能なニューロン活性化を同定するための因果的介入を開発する。大きなGPTスタイルのモデルでは、我々が仮定する2つの異なるニューロンの集合（抽象的な事実を知る、具体的な言葉を言う）と一致している。この洞察は、モデル重みに格納された事実を編集する新しい方法であるROMEの開発を刺激する。
論文参考訳（メタデータ） (Thu, 10 Feb 2022 18:59:54 GMT)
- GPT系モデルのうち「何かを知っている」部分と「何かを言う」部分を識別し、かつ、前者を編集する方法を提案。Fugu-MT 論文翻訳(概要): Fast Model Editing at Scale (fugumt.com)よりも優れているとのこと。XAIの文脈でも実用的な編集の文脈でも興味深い結果。
- プロジェクトサイトはRome (baulab.info)

TopClus: PLMを用いたトピッククラスタリング

Topic Discovery via Latent Space Clustering of Pretrained Language Model Representations [35.7]
本研究では, PLM 埋め込みを基盤とした空間学習とクラスタリングの連携フレームワークを提案する。提案モデルでは,トピック発見のためにPLMがもたらす強力な表現力と言語的特徴を効果的に活用する。
論文参考訳（メタデータ） (Wed, 9 Feb 2022 17:26:08 GMT)
- 事前学習モデルを用いて教師無しでトピック発見を行う手法の提案。LDA、ETMやBERTopicを上回る性能とのこと。
- リポジトリはGitHub – yumeng5/TopClus: [WWW 2022] Topic Discovery via Latent Space Clustering of Pretrained Language Model Representations

SuperGen: 言語モデルからのデータ生成

Generating Training Data with Language Models: Towards Zero-Shot Language Understanding [35.9]
事前訓練された言語モデル(PLM)は、様々な自然言語処理タスクにおいて顕著な性能を示した。 NLUタスクのゼロショット学習に両タイプのPLMを用いる簡単な手法を提案する。提案手法は,GLUEベンチマークの7つの分類タスクに対して高い性能を示す。
論文参考訳（メタデータ） (Wed, 9 Feb 2022 16:02:18 GMT)
- GPT系のPLMをデータ生成に用い、双方向なBERT系PLMをfine tuningすることで優れた性能（Few(32)-shotを上回る性能）を達成とのこと。データ生成時の確率を使用したフィルタリング、ラベルスムージング・アンサンブル等が高精度な結果に寄与しているとのこと。
  - アプローチとしてはGPT-3を用いた教師無しのニューラル機械翻訳 – arXiv最新論文の紹介 (devneko.jp)に近いが、生成モデルの情報をより活用している印象
- リポジトリはGitHub – yumeng5/SuperGen: Generating Training Data with Language Models: Towards Zero-Shot Language Understanding

センサーデータからのメンタルストレス検出のサーベイ

Mental Stress Detection using Data from Wearable and Non-wearable Sensors: A Review [11.1]
ヒトのストレス反応を測定する方法は、ウェアラブルと非ウェアラブルセンサーのデータを用いて観察された主観的アンケートと客観的マーカーを含むことができる。各種情報源からの関連データを利用して, ストレス検出手法が人工知能の恩恵を受ける方法について検討する。
論文参考訳（メタデータ） (Mon, 7 Feb 2022 09:48:46 GMT)
- ウェアラブル（脳波や筋電、心拍など）、非ウェアラブル（瞳孔、音声、熱など）センサーからストレス反応を検出できるかのサーベイ。本文だけで67ページと広範な内容。

2025年4月
月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30