Dataset Pruning

  • Dataset Pruning: Reducing Training Data by Examining Generalization Influence [30.3]
    すべてのトレーニングデータは、モデルのパフォーマンスに寄与しますか? モデルのパフォーマンスを著しく犠牲にすることなく、プロキシトレーニングセットとして、トレーニングデータ全体から最小限のサブセットを構築するには、どうすればよいのか?
    論文  参考訳(メタデータ)   (Thu, 19 May 2022 05:36:35 GMT)
    • 学習データ(のサブセットの削除)がネットワークパラメータに与える影響を理論的に検討、サンプル選択手順を制約付き離散最適化問題としてモデル化。実際のデータでその削減が与える影響と同じであることを検証したとのこと。

CREATER(CtR-drivEn Advertising TExt geneRation): 広告テキストの自動作成

  • CREATER: CTR-driven Advertising Text Generation with Controlled Pre-Training and Contrastive Fine-Tuning [14.9]
    本稿では,CTRによる広告テキスト生成手法であるCREATERを提案し,高品質なユーザレビューに基づいて広告テキストを生成する。 CTRの目的を取り入れるために、我々のモデルはコントラスト学習を伴うオンラインA/Bテストデータから学習し、より高いCTRを得る広告テキストを生成することを奨励する。 産業データセットの実験は、CREATERが現在のアプローチよりも大幅に優れていることを示している。
    論文  参考訳(メタデータ)  参考訳(全文)  (Wed, 18 May 2022 14:17:04 GMT)
    • ユーザレビューデータを用いて事前学習後、A/Bテストを利用してContrastive Fine-Tuningし click-through rateの向上を実現とのこと。

質問のタイプを用いた質問生成

  • “What makes a question inquisitive?” A Study on Type-Controlled Inquisitive Question Generation [35.9]
    質問生成のためのタイプ制御フレームワークを提案する。 私たちは、ソーステキストから描画しながら、特定のタイプに固執する様々な質問を生成します。 また、生成した集合から1つの質問を選択する戦略についても検討する。
    論文  参考訳(メタデータ)   (Thu, 19 May 2022 12:33:35 GMT)