- Data Smells in Public Datasets [7.1]
我々は、機械学習システムにおける問題の早期兆候を示すために使用できる、新しいデータ臭いのカタログを紹介する。 データセットにおけるデータ品質の問題の頻度を理解するために、25の公開データセットを分析し、14のデータ臭いを特定します。
論文 参考訳(メタデータ) (Tue, 15 Mar 2022 15:44:20 GMT)- Code smellのデータ版。ローデータ(前処理前)と考えると納得しかねる指摘もあるが、面白い研究であり重要であるとも思う。