コンテンツへスキップ
- Fighting Money Laundering with Statistics and Machine Learning: An Introduction and Review [95.4]
マネーロンダリングは深刻なグローバルな問題です。 このトピックに関する統計学と機械学習の研究はほとんどない。 大きな課題の1つは、公開データセットの欠如である。
論文 参考訳(メタデータ) (Thu, 13 Jan 2022 13:54:31 GMT)- AI利用のアンチマネーロンダリングのサーベイ。想像がつくことではあるが公開されているデータがほぼないことが大きな課題。これに加えて不均衡データであることも課題として挙げられている。
- 様々な取り組みを振り返るには良い内容。
- A Survey of Pretrained Language Models Based Text Generation [97.6]
テキスト生成は、入力データから人間の言語で可読で読みやすいテキストを生成することを目的としている。 ディープラーニングは、ニューラルジェネレーションモデル、特に事前学習言語モデル(PLM)のパラダイムにより、この分野を大幅に進歩させた。 PLM上でのテキスト生成は、学術と産業の両方において有望な方向と見なされている。
論文 参考訳(メタデータ) (Fri, 14 Jan 2022 01:44:58 GMT)
- Grow-and-Clip: Informative-yet-Concise Evidence Distillation for Answer Explanation [22.2]
我々は、QAモデルの解釈可能性を高めるために、解答の証拠が重要であると論じる。 我々は、証拠の概念を、情報的で簡潔で読みやすい文脈における支援事実として明確に定義する最初の人物である。 本稿では, トレードオフ情報性, 簡潔性, 可読性からエビデンスを抽出するGCEDアルゴリズムを提案する。
論文 参考訳(メタデータ) 参考訳(全文) (Thu, 13 Jan 2022 17:18:17 GMT)- 下記5つのモジュールを用いたGrow-and-Clip Evidence Distillationアルゴリズムによる証拠の提案、人による検証結果も良好とのこと。構文解析を含むがっつりとしたパイプライン構成でE2Eでできるのはまだ先なのかなという感想。
- Answer-oriented Sentences Extractor: 回答を得るための最小の文セットを選択
- Question-relevant Words Selector: 上記分から質問と強く関連する単語を抽出
- Weighted Syntactic Parsing Tree Constructor: 上記文の構文ツリーを作成
- Evidence Forest Constructor: 質問に関連する単語、ツリー構造を用いてエビデンスとなりうる複数のツリーと回答となるツリーを構成
- Optimal Evidence Distiller: エビデンスツリーの選択
- CommonsenseQA 2.0: Exposing the Limits of AI through Gamification [126.9]
現代自然言語理解モデルの能力をテストするベンチマークを構築した。 本研究では,データ構築の枠組みとしてゲーミフィケーションを提案する。
論文 参考訳(メタデータ) (Fri, 14 Jan 2022 06:49:15 GMT)
- Towards the Next 1000 Languages in Multilingual Machine Translation: Exploring the Synergy Between Supervised and Self-Supervised Learning [48.2]
数百の言語をカバーする多言語機械翻訳モデルを構築するための実践的なアプローチを提案する。 私たちは、異なる言語ペアのデータ可用性に応じて、教師付きと自己監督型の目的の混合を使用します。 この2つのトレーニングパラダイム間の相乗効果により、ゼロリソース設定で高品質な翻訳を生成できることを実証する。
論文 参考訳(メタデータ) (Thu, 13 Jan 2022 18:09:08 GMT)- 多言語機械翻訳モデルの実現に向けた様々な実験結果が参考になる。モデルが対応する言語数の増減、linguistic similarityを考慮した増減、パラ / モノリンガルデータ数が与える影響、ドメイン相違の影響、pretraining / finetuning / co-training / iterative back translationなど学習方法の影響など様々な観点があり興味深い。
- Dynamic Price of Parking Service based on Deep Learning [68.8]
都市部における空気質の向上は、公共団体の主な関心事の一つである。 この懸念は、大気の質と公衆衛生の間の証拠から生じる。 規制された駐車場サービスにおける動的価格の提案について述べる。
論文 参考訳(メタデータ) 参考訳(全文) (Tue, 11 Jan 2022 20:31:35 GMT)- ダイナミックプライシングにDeep Learningを活用。CNN, LSTM, U-Timeを比較している。手法選択はともかくとして、大気汚染防止のためという目的が興味深い。
- Language-Agnostic Website Embedding and Classification [12.9]
92言語で100万以上のWebサイトを持つデータセットをリリースし、Curlieから相対ラベルを収集しました。 ホームページに基づいてWebサイトを分類・埋め込みするマシン学習モデルであるHomepage2Vecを紹介する。 Homepage2Vecは、マクロ平均F1スコア0.90のWebサイトを正しく分類し、低および高ソース言語で安定したパフォーマンスを示す。
論文 参考訳(メタデータ) (Mon, 10 Jan 2022 22:31:48 GMT)
- SCROLLS: Standardized CompaRison Over Long Language Sequences [62.6]
SCROLLSは長いテキストに対する推論を必要とするタスクのスイートである。 SCROLLSには要約、質問応答、自然言語推論タスクが含まれる。 すべてのデータセットを統一されたテキスト・ツー・テキスト形式で利用可能にし、モデルアーキテクチャと事前学習方法の研究を容易にするために、ライブのリーダーボードをホストします。
論文 参考訳(メタデータ) (Mon, 10 Jan 2022 18:47:15 GMT)
- A Survey on Using Gaze Behaviour for Natural Language Processing [35.8]
本稿では,自然言語処理(NLP)における異なるタスクをテスト時に記録することなく,目視行動を用いて解く方法について論じる。我々は複数の言語で異なる視線追跡コーパスについて言及し、これは現在利用可能であり、自然言語処理で使用することができる。 本稿は、ドメイン — 教育 — における応用と、複雑な単語識別と自動エッセイグレーディングの課題を解決する上で、視線行動の学習がいかに役立つかを議論することによって、論文を締めくくる。
論文 参考訳(メタデータ) 参考訳(全文) (Mon, 3 Jan 2022 12:58:53 GMT)- 短いサーベイだが視線情報を併用可能なNLPデータセットとアプリケーションの情報がまとまっているのはありがたい。ラベル以外で人から取れる情報を併用することは有益だと思う。
- The State of Aerial Surveillance: A Survey [62.2]
本稿では、コンピュータビジョンとパターン認識の観点から、空中監視タスクの概要を概観する。 主な対象は人間であり、単体または複数の被験者が検出され、特定され、追跡され、再同定され、その振る舞いが分析される。
論文 参考訳(メタデータ) (Sun, 9 Jan 2022 20:13:27 GMT)- ドローン等を用いて空中から人を監視するタスクのサーベイ。対象のタスクはdetection, tracking, identification, action recognition。データセットの概要やモデル、難しさ(課題)など非常に参考になる。
- 未解決の課題は画像処理分野一般に言えることだと思うが、撮像時の解像度の低さや環境ノイズの多さのカバーやOnboard computingの重要性などはこの分野で特徴的なのかなと思った。