コンテンツへスキップ
- All You Need is RAW: Defending Against Adversarial Attacks with Camera Image Pipelines [31.0]
画像と画像のマッピングのためのモデルに依存しない対角防御法を提案する。 この方法は、入力されたRGB画像をRAW空間にマッピングし、学習したカメラ画像信号処理パイプラインを用いて出力RGBにマッピングする。 その結果、余分な再トレーニングを伴わずに未確認タスクに一般化する。
論文 参考訳(メタデータ) 参考訳(全文) (Thu, 16 Dec 2021 21:54:26 GMT)- RAWイメージを介することでAdversarial Attackからの防御を行う手法の提案。自然なやり方に思える。
- Explain, Edit, and Understand: Rethinking User Study Design for Evaluating Model Explanations [97.9]
我々はクラウドソーシング研究を行い、真偽のホテルレビューと偽のホテルレビューを区別するために訓練された詐欺検出モデルと対話する。 単語の線形バッグモデルでは、トレーニング中に特徴係数にアクセスした参加者は、非説明制御と比較して、テストフェーズにおいてモデルの信頼性が大幅に低下する可能性があることを観察する。
論文 参考訳(メタデータ) (Fri, 17 Dec 2021 18:29:56 GMT)- 偽のホテルレビューか否かを判定するモデルに対し説明手法を適用、そのモデルを騙す(ラベルを変化させる)事に資するかをもって説明手法を評価する研究。BERTに対する説明ではLIMEなど局所説明は役に立たず、BERTを模倣するよう構築された線形モデル(学生モデル)が効果的だったとのこと。
- コード等は公開予定とのことだが、現状では404
- 3D Question Answering [22.2]
VQA(Visual Question Answering)を3Dドメインに拡張する最初の試みを示す。 本稿では,新しい3DQAフレームワーク 3DQA-TR を提案する。 提案する3DQAフレームワークの有効性を検証するため,最初の3DQAデータセットScanQAを開発した。
論文 参考訳(メタデータ) (Wed, 15 Dec 2021 18:59:59 GMT)
- Solving the Data Sparsity Problem in Predicting the Success of the Startups with Machine Learning Methods [2.9]
Crunchbaseからの大きなデータセットを用いた機械学習アルゴリズムについて検討する。 その結果、LightGBMとXGBoostは53.03%、52.96%のスコアを獲得している。 これらの発見は、機械学習手法がスタートアップ企業や投資家にどのように役立つかに大きく影響している。
論文 参考訳(メタデータ) (Wed, 15 Dec 2021 09:21:32 GMT)- 分析過程や結果、結論には疑問も多いが、やっている事やVCのポートフォリオなどのデータが興味深かった。この手の分析は公開されていない事例が多数あるんだろうなと思う。
- Measure and Improve Robustness in NLP Models: A Survey [23.5]
堅牢性は視覚やNLPなどのアプリケーションで別々に研究されており、様々な定義、評価、緩和戦略が研究の複数のラインで行われている。 まず、ロバスト性の定義を複数結合し、その後、ロバスト性障害を特定し、モデルのロバスト性を評価する様々な作業ラインを統一します。 我々は、NLPモデルの堅牢性を効果的に改善する方法をより体系的な視点で、データ駆動型、モデル駆動型、インダクティブプライオリベースである緩和戦略を提案する。
論文 参考訳(メタデータ) 参考訳(全文) (Wed, 15 Dec 2021 18:02:04 GMT)- 社会実装で重要な自然言語処理モデル頑健性について評価方法や、改善方法をまとめたサーベイ。本文は8ページと短めだが簡潔にまとまっておりベンチマークなども参考になる。
- Textless Speech-to-Speech Translation on Real Data [49.1]
本研究では、ある言語から別の言語への翻訳が可能なテキストなし音声音声翻訳システム(S2ST)を提案する。 マルチ話者ターゲット音声をモデル化し、実世界のS2STデータを用いてシステムを訓練する際の課題に対処する。
論文 参考訳(メタデータ) (Wed, 15 Dec 2021 18:56:35 GMT)- FacebookAIがMetaAIになっていた。はおいておいて、S2ST(Speech-to-Speech Translation )を使った論文。話者間で共通の語彙となるような音声正規化手法(self-supervised unit-based speech normalization process)を提案、テキストレスで機械翻訳を実現。思ったよりBLEUも高くて驚いた。
- コード等も公開予定とのこと。
- Role of Human-AI Interaction in Selective Prediction [20.1]
我々は、AIシステムの遅延決定について、異なる種類の情報を人間に伝達する影響について研究する。 我々は,AIの予測は明らかにせず,遅延する決定を人間に伝えることで,人間のパフォーマンスを大幅に向上させることが可能であることを示す。
論文 参考訳(メタデータ) 参考訳(全文) (Mon, 13 Dec 2021 16:03:13 GMT)- 人間とAIがかかわりを持つとき、AIの予測結果を人間に伝えてしまうとそれがバイアスとなってしまい人間の判断を間違えさせる(全体の性能が低くなる)可能性がある。人間にAIの予測結果を伝えるのを遅らせる方が全体としての性能が良いという結果。
- UniLog: Deploy One Model and Specialize it for All Log Analysis Tasks [11.4]
本研究では,マルチタスク学習手法としてログ解析を定式化し,様々なログ分析タスクを実行できる単一モデルを訓練することを提案する。この統合ログ分析手法をUniLogと呼ぶ。4つのログ分析タスクに関する7つのデータセットにわたる大規模な実験は、UniLogが顕著なパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) 参考訳(全文) (Mon, 6 Dec 2021 16:49:33 GMT)- ログ分析タスク(anomaly detection, failure prediction, log compression, log summarization)を統一的に扱える手法を提案、7つのデータセットでSoTAまたはそれに近い結果を達成とのこと。
- Towards a Unified Foundation Model: Jointly Pre-Training Transformers on Unpaired Images and Text [93.1]
我々は、モダリティ固有のトークン化器、共有トランスフォーマーエンコーダ、タスク固有の出力ヘッドからなる統一型トランスフォーマーを設計する。 我々は、個別に訓練されたBERTモデルとViTモデルを教師として採用し、知識蒸留を適用して、より正確な監視信号を提供する。 実験の結果、統合基盤変換器は視覚のみのタスクとテキストのみのタスクの両方で驚くほどうまく機能することがわかった。
論文 参考訳(メタデータ) (Tue, 14 Dec 2021 00:20:55 GMT)- 画像・言語の両方を取り扱える事前学習モデル構築手法の提案。トークン化と出力部分は個別だが主要な部分は共通という構造。学習に用いる画像とテキストは対となるデータではない。画像のみのタスクCIFAR-10/100・ImageNet、自然言語のみのタスクGLUE双方で優れた結果。
- A Framework for Fairness: A Systematic Review of Existing Fair AI Solutions [4.6]
公正性の研究の大部分は、機械学習の実践者がアルゴリズムを設計しながらバイアスを監査するために使用できるツールの開発に費やされている。 実際には、これらの公平性ソリューションの応用例が欠如している。 このレビューでは、定義されたアルゴリズムバイアス問題と提案された公平問題解決方法の詳細な概要について述べる。
論文 参考訳(メタデータ) (Fri, 10 Dec 2021 17:51:20 GMT)- アルゴリズムバイアスとFairness awareなAIを構築するためのソリューションのサーベイ。