- TransTab: Learning Transferable Tabular Transformers Across Tables [42.9]
タブラルデータ(またはテーブル)は機械学習(ML)で最も広く使われているデータ形式である 異なる列の異なるテーブルを マージするには 重いデータクリーニングが必要です TransTabは各サンプル(テーブル内の行)を一般化可能な埋め込みベクトルに変換する。
論文 参考訳(メタデータ) 参考訳(全文) (Thu, 19 May 2022 05:34:46 GMT)- テーブルデータを埋め込み表現にすることで列が異なるテーブルにも対応可能という論文。
- 列名を含めて扱えばできそうという感覚と、やっぱり簡単ではないのではという感覚があってやや疑念がある。XGBoostがLogistic Regressionに完全に負けているのもやや違和感。コードが公開されているのでそのうち試してみたい。
- リポジトリはGitHub – RyanWangZf/transtab: TransTab: A flexible tabular prediction model
- テーブルデータを埋め込み表現にすることで列が異なるテーブルにも対応可能という論文。
日: 2022年5月24日
FactPEGASUS: 事実性を考慮した抽象型要約
- FactPEGASUS: Factuality-Aware Pre-training and Fine-tuning for Abstractive Summarization [91.5]
本稿では,FactPEGASUSについて述べる。FactPEGASUSは,事前学習と微調整における現実性の問題に対処する抽象的な要約モデルである。 分析の結果,FactPEGASUSはゼロショットやスプリショットの設定において,本来の事前学習目標よりも現実的であることが示唆された。
論文 参考訳(メタデータ) (Mon, 16 May 2022 17:39:14 GMT)- 事前学習目標として事実性を考慮したfactGSGを用い、XSum、WikiHow、Gigawordデータセットでfactualityを改善。
- リポジトリはGitHub – meetdavidwan/factpegasus: PyTorch code for “FactPEGASUS: Factuality-Aware Pre-training and Fine-tuning for Abstractive Summarization” (NAACL 2022)