Experimenting with an Evaluation Framework for Imbalanced Data Learning
Experimenting with an Evaluation Framework for Imbalanced Data Learning (EFIDL) [9.0] データ不均衡は,ラベルの少ないビッグデータ分析において重要な問題のひとつだ。 機械学習アルゴリズムの性能を改善するために、多くのデータバランス法が導入された。 我々は不均衡なデータ学習のための新しい評価フレームワークを提案する。 論文参考訳(メタデータ) (Thu, 26 Jan 2023 01:16:02 GMT)
不均衡データセットに対応する手法への評価フレームワークの提案。様々な手法が試されており、その部分も参考になる。(評価手法を間違えているので)不均衡データへの対応手法が非常に効果的と誤った結論を出しがちというのはとっても同意。この論文の結論の一つは「data augmentation does not help improve ML prediction performance」
参考にはなるのだが「Instead, we used the default parameters provided by the scikit-learn library.」というのは…