Survey – ページ 36 – arXiv最新論文の紹介

長文要約のサーベイ

An Empirical Survey on Long Document Summarization: Datasets, Models and Metrics [33.7]
本稿では,長い文書要約研究の概要について概説する。我々は、現在の研究の進展に対する視点を広げるために、実証分析を行う。
論文参考訳（メタデータ） (Sun, 3 Jul 2022 02:57:22 GMT)
- 長文要約に関するサーベイ論文。様々なアプローチがまとめられており、評価結果もあるのが参考になる。
- リポジトリはGitHub – huankoh/long-doc-summarization: Long Document Summarization Papers、非常にありがたい整理。

医療分野の機械学習における公平性のサーベイ

Fair Machine Learning in Healthcare: A Review [53.9]
医療のための機械学習において公平性の問題が特定されており、特定のグループに対して限られた医療資源を不公平に割り当てたり、過剰な健康リスクを負ったりしている。公平な問題を露呈し、バイアスを要約し、緩和方法を整理し、将来の機会とともに課題を指摘することで橋を架けます。
論文参考訳（メタデータ）参考訳（全文） (Wed, 29 Jun 2022 04:32:10 GMT)
- ヘルスケア分野でAI活用が進んでいるが、そのなかに含まれかねないバイアスの特定と公正性に関するサーベイ。

機械学習とAutomated test generation

The Integration of Machine Learning into Automated Test Generation: A Systematic Literature Review [15.0]
機械学習(ML)は効果的な自動テスト生成を可能にする。新たな研究、テストプラクティスの検証、研究者の目標、適用されたMLテクニック、評価、課題を特徴付ける。
論文参考訳（メタデータ） (Thu, 23 Jun 2022 13:42:02 GMT)
- 自動テスト生成に対して機械学習を用いる研究のサーベイ。
- 教師有り学習、教師無し、半教師有り、強化学習など様々なアプローチがあるよう

アノテーションエラー検出手法の検証

Annotation Error Detection: Analyzing the Past and Present for a More Coherent Future [64.0]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文参考訳（メタデータ） (Sun, 5 Jun 2022 22:31:45 GMT)
- AED(Annotation Error Detection)のサーベイ。対象は自然言語。
- 実用上重要な技術でとても参考になるサーベイ
- リポジトリはGitHub – UKPLab/nessie: Automatically detect errors in annotated corpora.

医療画像分野のTransformer利用サーベイ

Transforming medical imaging with Transformers? A comparative review of key properties, current progresses, and future perspectives [18.0]
ディープラーニングの最新技術進歩であるTransformerは、自然言語処理やコンピュータビジョンで普及している。我々は、医療画像に対する最先端のTransformerベースのアプローチを包括的にレビューする。
論文参考訳（メタデータ） (Thu, 2 Jun 2022 16:38:31 GMT)
- 医療分野の画像処理でTransformerがどのように使われているかのサーベイ。
- 医療分野とあるが一般的な画像処理でも重要な考え方が多く参考になる。当然ながらMedical image reconstructionなどドメイン依存のタスクも興味深い。

スポーツの映像行動認識のサーベイ

A Survey on Video Action Recognition in Sports: Datasets, Methods and Applications [60.3]
本稿では,スポーツ分析のための映像行動認識に関する調査を行う。サッカー、バスケットボール、バレーボール、ホッケー、フィギュアスケート、体操、卓球、ダイビング、バドミントンなど10種以上のスポーツを紹介します。本研究では,サッカー,バスケットボール,卓球,フィギュアスケート動作認識をサポートするPaddlePaddleを用いたツールボックスを開発した。
論文参考訳（メタデータ） (Thu, 2 Jun 2022 13:19:36 GMT)
- スポーツへのAI応用の面からも興味深いサーベイ。

Open Information Extractionのサーベイ

A Survey on Neural Open Information Extraction: Current Status and Future Directions [87.3]
Open Information extract (OpenIE) は、大規模コーパスからの関係事実のドメインに依存しない発見を容易にする。我々は、最先端のニューラルなOpenIEモデル、その設計決定、強み、弱点について概観する。
論文参考訳（メタデータ） (Tue, 24 May 2022 02:24:55 GMT)
- 非構造化テキストからファクトを抽出するOpenIEに関するサーベイ。タギングを行う手法と生成モデルを使う手法の両方を調査対象にしている。8ページとコンパクトなサーベイ。

信頼されるGraph Neural Networksのサーベイ

Trustworthy Graph Neural Networks: Aspects, Methods and Trends [108.0]
グラフニューラルネットワーク(GNN)は,さまざまな実世界のシナリオに対して,有能なグラフ学習手法として登場した。パフォーマンス指向のGNNは、敵の攻撃に対する脆弱性のような潜在的な副作用を示す。こうした意図しない害を避けるためには、信頼度に特徴付けられる有能なGNNを構築する必要がある。
論文参考訳（メタデータ） (Mon, 16 May 2022 02:21:09 GMT)
- グラフニューラルネットワークについて robustness, explainability, privacy, fairness, accountability, environmental well-beingの6つの観点を整理したサーベイ。
- グラフデータという特殊なデータであるが故の対応など非常に勉強になる。

AIのSustainabilityに関するサーベイ

A Survey on AI Sustainability: Emerging Trends on Learning Algorithms and Research Challenges [35.3]
我々は、AIの持続可能性問題に対処できる機械学習アプローチの大きなトレンドについてレビューする。我々は、既存の研究の大きな限界を強調し、次世代の持続可能なAI技術を開発するための潜在的研究課題と方向性を提案する。
論文参考訳（メタデータ） (Sun, 8 May 2022 09:38:35 GMT)
- 環境を軸とした持続可能性（Computitaion-Efficient, Data-Efficient）、社会を軸とした持続可能性（Responsible, Rationalizable & Resilient）という2つの側面からAIの持続可能性を整理したサーベイ。興味深い整理軸。

音声キャプショニングのサーベイ

Automated Audio Captioning: an Overview of Recent Progress and New Challenges [57.0]
自動音声キャプションは、与えられた音声クリップの自然言語記述を生成することを目的とした、モーダル横断翻訳タスクである。本稿では、既存の様々なアプローチから評価指標やデータセットまで、自動音声キャプションにおけるコントリビューションの総合的なレビューを行う。
論文参考訳（メタデータ） (Thu, 12 May 2022 08:36:35 GMT)
- Audio Captioningのサーベイ。とても大事なタスクである一方でimage captioningやvideo captioningに比べて歴史が浅い（2017～）というのに驚いた。