Man versus Machine: AutoML and Human Experts’ Role in Phishing Detection [4.1] 本稿では,10種類のフィッシングデータセット上での6つの最先端AutoMLフレームワークのパフォーマンスを比較した。 以上の結果から,AutoMLベースのモデルでは,複雑な分類タスクにおいて,手作業で開発した機械学習モデルよりも優れていることが示唆された。 論文参考訳(メタデータ) (Fri, 27 Aug 2021 09:26:20 GMT)
A Guide to Reproducible Research in Signal Processing and Machine Learning [9.7] 2016年にNature誌が行った調査によると、研究者の50%が自身の実験を再現できなかった。 我々は,再現可能な計算実験を生成する上での障害の多くを軽減するための,実用的なツールと戦略のセットを,信号処理研究者に提供することを目的とする。 論文参考訳(メタデータ) (Fri, 27 Aug 2021 16:42:32 GMT)
AVATAR: A Parallel Corpus for Java-Python Program Translation [37.0] 我々は8,475のプログラミング問題とその解決策をJavaとPythonという2つの人気のある言語で記述したコーパスを提示する。 我々は、スクラッチからトレーニングされたモデルや大規模なソースコードコレクションで事前訓練されたモデルを含む、いくつかのベースラインを提示する。 論文参考訳(メタデータ) (Thu, 26 Aug 2021 05:44:20 GMT)
LayoutReader: Pre-training of Text and Layout for Reading Order Detection [46.8] ReadingBankは50万のドキュメントイメージの読み込み順序、テキスト、レイアウト情報を含むベンチマークデータセットである。 この最初の大規模なデータセットは、読み取り順序検出のためのディープニューラルネットワークのパワーを解放する。 論文参考訳(メタデータ) (Thu, 26 Aug 2021 05:52:32 GMT)
A Survey on Automated Fact-Checking [18.3] 本稿では,自然言語処理によるファクトチェックの自動化について検討し,関連する課題や規律との関係について考察する。 既存のデータセットとモデルを概観し、与えられた様々な定義を統一し、共通の概念を識別することを目的としている。 論文参考訳(メタデータ) (Thu, 26 Aug 2021 16:34:51 GMT)
Bag of Tricks for Training Deeper Graph Neural Networks: A Comprehensive Benchmark Study [100.3] ディープグラフニューラルネットワーク(GNN)のトレーニングは、非常に難しい。 我々は、深層GNNの「トリック」を評価するための最初の公正かつ再現可能なベンチマークを示す。 論文参考訳(メタデータ) (Tue, 24 Aug 2021 05:00:37 GMT)
deep graph neural networksのトレーニングは難しく、skip connections、graph normalization、random droppingなど様々なテクニックが用いられている。それらを込みで評価するベンチマークを提案。
Detection of Illicit Drug Trafficking Events on Instagram: A Deep Multimodal Multilabel Learning Approach [18.2] Instagram上では、違法薬物密売事件(IDTE)の詳細な検出に関する最初の系統的研究を行っている。 具体的には,本モデルでは,テキストと画像データを入力とし,マルチモーダル情報を組み合わせて複数の違法薬物のラベルを予測する。 我々は,不正薬物の詳細な検出を支援するために,手動で注釈付き複数の薬物ラベルを付加した大規模データセットMM-IDTEを構築した。 論文参考訳(メタデータ) (Mon, 23 Aug 2021 02:13:56 GMT)