- FDB: Fraud Dataset Benchmark [17.5]
フラッドデータセットベンチマーク(Fraud dataset benchmark、FDB)は、不正検出に特化した公開データセットの集大成である。 FDBは、不正なカード非表示トランザクションの識別、ボット攻撃の検出、悪意のあるURLの分類、コンテンツモデレーションへのローンのリスクの予測など、さまざまな不正関連タスクで構成されている。 FDBのPythonベースのライブラリは、標準化されたトレーニングとテストの分割を伴うデータローディングのための一貫性のあるAPIを提供する。
論文 参考訳(メタデータ) (Wed, 31 Aug 2022 22:20:42 GMT)- 不正検出用のデータセット。AutoML(AutoGluon、H20、Auto-sklearn、Amazon Fraud Detector(AFD))で評価した結果がついていること、フレームワークの違い(特にIPアドレスのような汎用的とは言い難い型に対応しているかなど)が分かるのが面白い。
- プロジェクトサイトはamazon-research/fraud-dataset-benchmark: Repository for Fraud Dataset Benchmark (github.com)