NumGPT: 数値の特性を明示的に扱う事前学習モデル

NumGPT: Improving Numeracy Ability of Generative Pre-trained Models [59.9]
テキスト中の数値特性を明示的にモデル化する生成事前学習モデルであるNumGPTを提案する。具体的には、プロトタイプベースの数字埋め込みを利用して、数字の仮数をエンコードし、個別の埋め込み方法によって数字の指数をエンコードする。数値認識損失関数は、NumGPTの事前学習目的に数値を統合するように設計されている。
論文参考訳（メタデータ） (Tue, 7 Sep 2021 15:06:12 GMT)
- テキストの中の数値を通常の文字とは異なる扱いとする事前学習モデルの提案。数値関連のデータについて性能が向上したとのこと。
- 機械翻訳でも数値の取り扱いに苦労することが多い。機械的に対訳ペアを生成したデータセットの多くが数値関連の問題を抱えていることからも、数値を別扱いするというのは良い方法のように思える。
  - ニューラル機械翻訳モデルと対訳データの品質で示したように、対訳コーパス（WikiMatrixなど）によっては数値対応が取れていないデータをルールベースで削除することが精度向上につながることもある。

コメントを残す

コメントを残す コメントをキャンセル