- TransTab: Learning Transferable Tabular Transformers Across Tables [42.9]
タブラルデータ(またはテーブル)は機械学習(ML)で最も広く使われているデータ形式である 異なる列の異なるテーブルを マージするには 重いデータクリーニングが必要です TransTabは各サンプル(テーブル内の行)を一般化可能な埋め込みベクトルに変換する。
論文 参考訳(メタデータ) 参考訳(全文) (Thu, 19 May 2022 05:34:46 GMT)- テーブルデータを埋め込み表現にすることで列が異なるテーブルにも対応可能という論文。
- 列名を含めて扱えばできそうという感覚と、やっぱり簡単ではないのではという感覚があってやや疑念がある。XGBoostがLogistic Regressionに完全に負けているのもやや違和感。コードが公開されているのでそのうち試してみたい。
- リポジトリはGitHub – RyanWangZf/transtab: TransTab: A flexible tabular prediction model
- テーブルデータを埋め込み表現にすることで列が異なるテーブルにも対応可能という論文。