2022年12月27日 – arXiv最新論文の紹介

Understanding Translationese in Cross-Lingual Summarization [45.0]
言語間要約(MS)は、異なる対象言語で簡潔な要約を生成することを目的としている。大規模なCRSサンプルを集めるために、既存のデータセットは通常、それらの生成に翻訳を伴います。本研究では,翻訳文がCLSモデルの評価と性能にどのような影響を及ぼすかを検討する。
論文参考訳（メタデータ） (Wed, 14 Dec 2022 13:41:49 GMT)
翻訳を介する要約生成における翻訳処理の影響をまとめた論文
影響があるのは直感的にも間違いなく、少なくともテストでは機械翻訳の採用を避ける、学習時には機械翻訳を一部使う場合は品質差があることを前提とする・semi-supervisedの採用を検討するなど良い示唆がある。

Language Models as Inductive Reasoners [141.3]
本稿では,自然言語の事実から自然言語規則を誘導するタスクを提案する。自然言語を論理言語ではなく知識の表現として使用し、事前学習した言語モデルを「推論者」として使用します。我々は、事前訓練された言語モデルが自然言語の事実から自然言語規則をいかに誘導できるかを、初めてかつ包括的な分析を行う。
論文参考訳（メタデータ） (Wed, 21 Dec 2022 11:12:14 GMT)
言語モデルにより帰納法を実現できるかの研究。モデル構築も評価も難しい問題。
本件のために12K規模のデータセットを作成、chain-of-language-models (CoLM)というフレームワークを提案、ベースラインを超えたと主張。
（ただし性能は高くなさそう…）
コードなどは公開予定とのこと