PAEG(Phrase-level Adversarial Example Generation) を用いた機械翻訳モデルの頑健性向上

  • Phrase-level Adversarial Example Generation for Neural Machine Translation [75.0]
     エンドツーエンドのニューラルネットワーク翻訳(NMT)は目覚ましい進歩を遂げているが、ノイズの多い入力は通常、モデルが脆弱で不安定になる。拡張データとして逆例を生成することはこの問題を軽減するのに有用であることが証明された。 本稿では,モデルの堅牢性を高めるために,句レベル逆例生成(PAEG)手法を提案する。
    論文  参考訳(メタデータ)   (Thu, 6 Jan 2022 11:00:49 GMT)
    • フェーズレベルの置き換えを用いたAdversarial Exampleを作成、その活用でモデルの頑健性向上を確認とのこと。生成にはBERTを活用。

Artの定量化、AI(言語モデル)の利用

  • Formal Analysis of Art: Proxy Learning of Visual Concepts from Style Through Language Models [10.9]
    本稿では,美術の視覚的要素と原理を用いて絵画を定量化する機械学習システムを提案する。 本稿では,絵画の視覚概念を学習する手法として,プロキシ学習(プロキシラーニング)を提案する。
    論文  参考訳(メタデータ)   (Wed, 5 Jan 2022 21:03:29 GMT)
    • 言語モデル(BERT, glove)を用いた芸術の視覚的要素の定量化に関する研究。アノテーションの少なさを補うために言語モデルを活用、芸術用のBERTを学習しなおしているなど手法も興味深い。

(DeepLearningな)手話生成に関するサーベイ

  • All You Need In Sign Language Production [50.4]
    手話の認識と生成のためには、いくつかの重要な課題に対処する必要があります。本稿ではSLP( Sign Language Production)のバックボーンアーキテクチャや手法を簡潔に紹介し、SLPの分類について提案する。 最後に、SLPと性能評価のための一般的なフレームワーク、およびSLPの最近の発展、利点、限界に関する議論について、今後の研究の行程についてコメントする。
    論文  参考訳(メタデータ)   (Thu, 6 Jan 2022 18:10:58 GMT)
    • 深層学習を中心とした手話に関するサーベイ。その中でもSign Language Productionに焦点を当てており、題名の通り包括的なサーベイの印象。Sign Language Recognition (SLR)とSign Language Production (SLP)の問題の違いなどが参考になった。

TableParser: PDFや画像からの表構造解析

EKG(Event Knowledge Graph)に関するサーベイ

  • What is Event Knowledge Graph: A Survey [46.6]
    本稿では、歴史、オントロジー、例、アプリケーションビューからイベントナレッジグラフ(EKG)を包括的に調査する。 EKGは、インテリジェント検索、質問回答、レコメンデーション、テキスト生成など、多くの機械学習および人工知能アプリケーションにおいて、ますます重要な役割を担っている。
    論文  参考訳(メタデータ)   (Fri, 31 Dec 2021 03:42:55 GMT)
    • イベントの概念を追加されたナレッジグラフに関するサーベイ。「イベント」ノードの追加、「イベント-イベント」と「イベント-エンティティ」の関係(エッジ)の追加がされ表現力が強化、検索等で重要な概念になることがサーベイされている。色々な取り組みがあってとても参考になる。

SimTSC(Similarity-Aware Time-Series Classification): GNN利用の時系列分類

  • Towards Similarity-Aware Time-Series Classification [51.2]
    時系列データマイニングの基本課題である時系列分類(TSC)について検討する。 グラフニューラルネットワーク(GNN)を用いて類似情報をモデル化するフレームワークであるSimTSCを提案する。
    論文  参考訳(メタデータ)   (Wed, 5 Jan 2022 02:14:57 GMT)

Speech-to-SQL: 音声からSQLクエリの作成

  • Speech-to-SQL: Towards Speech-driven SQL Query Generation From Natural Language Question [18.4]
    音声による入力は、スマートフォンやタブレットの人気により、大きな勢いを増している。 本稿では,構造化データデータベースを問合せするための,より効率的な音声インタフェースの設計について検討する。 我々は,人間の音声を直接クエリーに変換するために,SpeechNetという新しいエンドツーエンドニューラルアーキテクチャを提案する。
    論文  参考訳(メタデータ)   (Tue, 4 Jan 2022 15:38:36 GMT)
    • 音声からSQLクエリを作成するという研究。音声認識を経ないので有用な点はあるのかもしれない。(がSQL作成が有効かは謎ではある)

Automated Graph Machine Learningのサーベイ

FS2K: 顔のスケッチ合成(FSS)問題のデータセットとベースライン

  • Deep Facial Synthesis: A New Challenge [76.0]
    まず,FS2Kという,2,104のイメージスケッチペアからなる高品質なFSSデータセットを提案する。 第2に, 古典的手法139点を調査し, 最大規模のFSSについて検討した。 第3に、FSGANという単純なFSSのベースラインを提示する。
    論文  参考訳(メタデータ)  参考訳(全文)  (Fri, 31 Dec 2021 13:19:21 GMT)
    • 2100以上のデータからなる顔のスケッチデータセット(性別等の属性付き)の紹介と広範囲な調査、ベースラインの提示。顔合成に関するサーベイとしても興味深い内容。

AI/機械学習の実用に関する調査

  • Machine Learning Application Development: Practitioners’ Insights [18.1]
    MLアプリケーション開発の課題とベストプラクティスを理解することを目的とした調査について報告する。 80人の実践者から得られた結果を17の発見にまとめ、MLアプリケーション開発の課題とベストプラクティスを概説する。 報告された課題が、MLベースのアプリケーションのエンジニアリングプロセスと品質を改善するために調査すべきトピックについて、研究コミュニティに知らせてくれることを期待しています。
    論文  参考訳(メタデータ)   (Fri, 31 Dec 2021 03:38:37 GMT)
    • AI/機械学習の実用を行っている人へのアンケート結果の報告。周りの人がどのようなことをやっているのかを知るために参考になる。
    • Findingsも(全部同意というわけではないが)納得のいく内容が多い。Finding 12の「roughly one-third of the practitioners write code from scratch for model implementation」はやや驚き。どこからがscratchなんだろう?「Practitioners also mentioned using their own custom auto-ML system for ML model training.」も納得感があって、私もGitHub – s-taka/fugumlを作っている。報告ではクラスバランスが重視されている印象があるが、個人的には不均衡データの取り扱いはドメインに強く依存するなーと思う。