InstructPix2Pix

  • InstructPix2Pix: Learning to Follow Image Editing Instructions [103.8]
    人間の指示から画像を編集する手法を提案する。 入力画像とモデルに何をすべきかを指示する命令が与えられたら、我々のモデルはこれらの命令に従って画像を編集します。 入力画像と書き起こしの多様なコレクションに対して、魅力的な編集結果を示す。
    論文  参考訳(メタデータ)   (Thu, 17 Nov 2022 18:58:43 GMT)
  • 指示によって画像を編集するモデルの提案。今までも様々な手法が提案されてきたが実用的なレベルになってきていると感じる
  • プロジェクトサイトはInstructPix2Pix (timothybrooks.com)、作例が凄い

Execution-based Evaluation for Data Science Code Generation Models

  • Execution-based Evaluation for Data Science Code Generation Models [98.0]
    データサイエンスコード生成タスクの実行評価のための評価データセットであるExeDSを紹介する。 ExeDSにはJupyter Notebooksの534の問題が含まれており、それぞれがコードコンテキスト、タスク記述、参照プログラム、望ましい実行出力で構成されている。 表面形状評価スコアを高い精度で達成した5つの最先端コード生成モデルの実行性能を評価する。
    論文  参考訳(メタデータ)   (Thu, 17 Nov 2022 07:04:11 GMT)
  • データサイエンスの問題を解くためのコード生成ベンチマークの提案。より実用的なタスク(&評価)で面白い。
  • 生成されたコードの近さとアウトプットの近さには距離があるのは直感通りとして、Codeexがコード的には遠いがアウトプットではまずまずの結果を出している点が興味深い。意味まで理解しているっぽい動き。
  • https://github.com/Jun-jie-Huang/ExeDSがリポジトリとのことだが、現時点では404

Token Turing Machines

  • Token Turing Machines [53.2]
    Token Turing Machines (TTM) はシーケンシャルな自己回帰型トランスフォーマーモデルである。 我々のモデルは、セミナルなニューラルチューリングマシンにインスパイアされ、以前の履歴を要約するトークンの集合からなる外部メモリを持つ。
    論文  参考訳(メタデータ)   (Wed, 16 Nov 2022 18:59:18 GMT)
  • Neural Turing Machineのように外部メモリを持つモデルの提案。
  • NTMは非常に話題になった割にはあまり使われていない印象だが本技術がどうなるかとても気になる。ベンチマーク結果からは有望な印象。

The Technological Emergence of AutoML: A Survey of Performant Software and Applications in the Context of Industry

  • The Technological Emergence of AutoML: A Survey of Performant Software and Applications in the Context of Industry [72.1]
    Automated/Autonomous Machine Learning (AutoML/AutonoML)は比較的若い分野である。 このレビューは、このトピックに関する知識に2つの主要な貢献をしている。 オープンソースと商用両方の既存のAutoMLツールについて、最新かつ包括的な調査を提供する。
    論文  参考訳(メタデータ)   (Tue, 8 Nov 2022 10:42:08 GMT)
  • AutoMLのサーベイ、細部まで包括的で122ページ、引用数583と大規模

DiaASQ

  • DiaASQ: A Benchmark of Conversational Aspect-based Sentiment Quadruple Analysis [84.8]
    そこで本稿では,対話におけるターゲット・アスペクト・オピニオン・センタティメントの感情四重項を検出するために,対話的側面に基づく感情四重項分析,すなわちDiaASQを導入する。 大規模で高品質な中国語データセットを手動で構築し、手動翻訳による英語版データセットも取得する。 エンドツーエンドの四重項予測を効果的に実行し、より優れた発話四重項抽出のために、リッチな対話特化特徴表現と談話特徴表現を組み込むことに成功している。
    論文  参考訳(メタデータ)   (Thu, 10 Nov 2022 17:18:20 GMT)
  • 対話の「target-aspect-opinion-sentiment」を判別するためのデータセット。規模は1000対話、7452発話。中国語のデータで構築されたうえで、手動で英語に翻訳されたデータが存在するとのことで様々な問題設定で使用できそう。
  • プロジェクトサイトはhttps://github.com/unikcc/DiaASQとのことだが、現時点では404

Unsupervised Machine Learning for Explainable Medicare Fraud Detection

  • Unsupervised Machine Learning for Explainable Medicare Fraud Detection [16.3]
    我々は、医療を超過するプロバイダを特定するための、新しい機械学習ツールを開発した。 大規模なメディケアの請求データを用いて、詐欺や過度な監視と整合したパターンを識別する。 提案手法は、ラベル付きトレーニングデータに頼らず、完全に教師なしである。
    論文  参考訳(メタデータ)   (Sat, 5 Nov 2022 15:37:51 GMT)
  • Medicare データを用いた不正検出。

AnimeRun

  • AnimeRun: 2D Animation Visual Correspondence from Open Source 3D Movies [98.7]
    既存の2次元漫画のデータセットは、単純なフレーム構成と単調な動きに悩まされている。 我々は,オープンソースの3D映画を2Dスタイルのフルシーンに変換することによって,新しい2Dアニメーション視覚対応データセットAnimeRunを提案する。 分析の結果,提案したデータセットは画像合成において実際のアニメに似るだけでなく,既存のデータセットと比較してよりリッチで複雑な動きパターンを持つことがわかった。
    論文  参考訳(メタデータ)   (Thu, 10 Nov 2022 17:26:21 GMT)
    • オープンソースの3D映画から生成されたアニメ映像のデータセット
    • データセットはCC-BY-NC 4.0 License、コードは MIT Licenseとオープンソース
    • プロジェクトサイトはAnimeRun Project Page (lisiyao21.github.io)

Are AlphaZero-like Agents Robust to Adversarial Perturbations?

  • Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.1]
    AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。 私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。 我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
    論文  参考訳(メタデータ)   (Mon, 7 Nov 2022 18:43:25 GMT)
  • 強力な囲碁AIを誤らせるような敵対的攻撃が可能か検証した論文。現状最強と思われる(人間よりも強い)囲碁AIに対しても攻撃は可能とのこと。
  • リポジトリはlan-lc/adversarial_example_of_Go (github.com)

FormLM

  • FormLM: Recommending Creation Ideas for Online Forms by Modelling Semantic and Structural Information [33.7]
    オンラインフォームをモデル化し、フォーム作成のアイデアを推奨するためにFormLMを提示します。 モデルトレーニングと評価のために、62Kのオンラインフォームを持つ最初の公開オンラインフォームデータセットを収集する。 実験の結果,FormLMはすべてのタスクにおいて汎用言語モデルよりも優れていた。
    論文  参考訳(メタデータ)   (Thu, 10 Nov 2022 01:32:55 GMT)
  • オンラインアンケートなどのフォーム生成を支援するためのモデルの提案、データセットから構築している。「Form Creation Ideasは過去には体系的に研究されていない」というのはその通りだと思う…実用的なタスクとPLMを用いた問題解決の方針が参考になる。
  • プロジェクトサイトはhttps://github.com/microsoft/FormLMとのことだが、現時点では404。

Discord Questions

  • Discord Questions: A Computational Approach To Diversity Analysis in News Coverage [84.6]
    本稿では,情報源の違いを識別し,ニュース報道の多様性を理解する上で,読者を支援する新しい枠組みを提案する。 このフレームワークはDiscord Questionsの生成に基づいている。
    論文  参考訳(メタデータ)   (Wed, 9 Nov 2022 16:37:55 GMT)
  • ソースの違いを明確にする枠組みの提案。質問の生成→QAモデルによる回答収集→回答の統合というパイプラインを用いている。(記者の視点等が入るため)ニュースソースごとに質問応答(抽出されるデータ)は異なるはずで直感的にも効果的なアプローチのように思う。
  • リポジトリはsalesforce/discord_questions (github.com)