コンテンツへスキップ
- A Survey of Deep Learning Models for Structural Code Understanding [21.7]
本稿では,コードデータから形成される構造について概観する。 近年のコード理解モデルは,シーケンスベースモデルとグラフベースモデルという2つのグループに分類されている。 メトリクスやデータセット、下流タスクも導入しています。
論文 参考訳(メタデータ) (Tue, 3 May 2022 03:56:17 GMT)- ソースコード分析へのDeepLearning活用についての幅広いサーベイ。
- Synthetic Data — what, why and how? [30.4]
本資料は, 合成データ技術の現状を概観することを目的としている。 この記事は技術的でない聴衆を対象としているが、専門家に明確性を提供するための正式な定義がいくつか与えられている。
論文 参考訳(メタデータ) (Fri, 6 May 2022 14:27:45 GMT)- 合成データに関するサーベイ、主な観点としてprivate data release 、data de-biasing and fairness、data augmentation for robustnessを挙げ、関連領域(攻撃や防御など)についても記載がある。
- Embedding Knowledge for Document Summarization: A Survey [66.8]
従来の研究は、知識を組み込んだ文書要約器が優れた消化力、特に情報性、一貫性、事実整合性を生み出すのに優れていたことを証明した。 本稿では,知識を文書要約に組み込む最先端方法論について,初めて体系的な調査を行う。 特に,文書要約の視点で知識と知識の埋め込みを再結合する新しい分類法を提案する。 さらに、文書要約モデルの学習アーキテクチャ、特にディープラーニングモデルにおいて、埋め込みがどのように生成されるかを考察する
論文 参考訳(メタデータ) 参考訳(全文) (Sun, 24 Apr 2022 04:36:07 GMT)- 要約文中の事実を正しく扱うために用いる知識埋め込みに関するサーベイ。実質6ぺージと短いがどのようなアプローチがあるか知る上ではとても有用。
- Sequential Point Clouds: A Survey [33.2]
本稿では,シーケンシャルポイントクラウド研究のための深層学習に基づく手法について概説する。 これには、動的フロー推定、オブジェクトの検出とトラッキング、ポイントクラウドセグメンテーション、ポイントクラウド予測が含まれる。
論文 参考訳(メタデータ) (Thu, 21 Apr 2022 02:10:05 GMT)- 3Dスキャナ等で得られるポイントクラウド情報に時間的な推移を足したsequential point cloudに関するサーベイ。Deep Learningで取り扱う際のアプローチが参考になる。
- Empirical Evaluation and Theoretical Analysis for Representation Learning: A Survey [25.6]
表現学習により、データセットからジェネリックな特徴表現を自動的に抽出して、別の機械学習タスクを解決することができます。 近年,表現学習アルゴリズムと単純な予測器によって抽出された特徴表現は,複数の機械学習タスクにおいて最先端の性能を示す。
論文 参考訳(メタデータ) (Mon, 18 Apr 2022 09:18:47 GMT)- Representation Learningの現状がわかるありがたいサーベイ。
- A Survey on Legal Judgment Prediction: Datasets, Metrics, Models and Challenges [73.3]
法定判断予測(LJP)は,事実記述に基づく判断結果の自動予測に自然言語処理(NLP)技術を適用している。 6言語で31のLJPデータセットを分析し、その構築過程を示し、LJPの分類方法を定義する。 異なる訴訟の8つの代表的データセットに対する最先端の結果を示し、オープンな課題について議論する。
論文 参考訳(メタデータ) (Mon, 11 Apr 2022 04:06:28 GMT)- 法的な判断への自然言語処理技術適用のサーベイ。近年トップカンファレスでの発表が増えている事、多種多様なアプローチがあることも分かる。解釈可能性の重視などクリティカルな領域への自然言語処理技術適用の話としても興味深い。
- Towards Web Phishing Detection Limitations and Mitigation [21.7]
フィッシングサイトが機械学習に基づく検出をバイパスする方法を示す。 100Kフィッシング・ベナンサイトを用いた実験では、有望な精度(98.8%)を示した。 本稿では,ロジスティック回帰に基づくよりレジリエントなモデルであるAnti-SubtlePhishを提案する。
論文 参考訳(メタデータ) (Sun, 3 Apr 2022 04:26:04 GMT)- フィッシングサイトがMLベースの検出をバイパスしている方法の調査とその対策の提案。13,000のフィッシングページにわたる詳細なケーススタディを行っているとのことで面白い内容。
- 提案されているAnti-SubtlePhishは主として特徴量の強化を行っている。最終的なレンダリング結果を使うことが重要そう。
- Towards Best Practices for Training Multilingual Dense Retrieval Models [54.9]
我々は,このような設計を用いて,多種多様言語における単言語検索の課題に焦点をあてる。 本研究は多言語高密度検索モデルのトレーニングのための「ベストプラクティス」ガイドとして組織されている。
論文 参考訳(メタデータ) (Tue, 5 Apr 2022 17:12:53 GMT)- (1) マルチリンガルな事前学習モデルはあるがデータはない、(2) マルチリンガルな事前学習モデルとデータの両方がある(データの言語でいくつかのバリエーションが存在)、(3) データはあるが事前学習モデルがない、のパターンでどのような対応がありえるかまとめた論文。
- 結果は参考にはなるのだが、機械翻訳を挟むアプローチが検討されていないのはなぜなんだろう・・・?
- A Comparative Survey of Deep Active Learning [76.0]
Active Learning (AL)は、ラベル付けのための大きなラベル付けされていないデータプールからデータサンプルを順次選択することで、ラベル付けコストを削減するための一連のテクニックである。 ディープラーニング(DL)はデータハングリーであり、DLモデルのパフォーマンスは、より多くのトレーニングデータとともに単調にスケールする。 近年、Deep Active Learning (DAL) は、高価なラベリングコストを最小化しつつ、モデル性能を最大化するための実現可能なソリューションとして上昇している。
論文 参考訳(メタデータ) (Fri, 25 Mar 2022 05:17:24 GMT)
- Explainability in Graph Neural Networks: An Experimental Survey [12.4]
グラフ表現学習のためのグラフニューラルネットワーク(GNN)が広く開発されている。 GNNは、その基盤となるメカニズムを理解できないため、ブラックボックスの問題に悩まされる。 GNNによる意思決定を説明するために、いくつかのGNN説明可能性法が提案されている。
論文 参考訳(メタデータ) 参考訳(全文) (Thu, 17 Mar 2022 11:25:41 GMT)- Graph Neural Networkを対象にしたXAIのサーベイ。