2024年1月23日 – arXiv最新論文の紹介

Question Translation Training for Better Multilingual Reasoning

Question Translation Training for Better Multilingual Reasoning [113.5]
大規模言語モデルは推論タスクにおいて魅力的なパフォーマンスを示すが、英語以外の言語ではより悪いパフォーマンスを示す傾向がある。典型的な解決策は、命令データを興味のあるすべての言語に翻訳し、結果の多言語データをトレーニングすることである。質問のアライメントは、翻訳学習アプローチよりも一貫した改善をもたらすことを示す。
論文参考訳（メタデータ） (Mon, 15 Jan 2024 16:39:10 GMT)
多言語環境でLLMのパフォーマンスを上げるため単純に翻訳データを使うのではなく、Stage I: Question Alignment（質問を英語に翻訳するタスク）、Stage II: Response Alignment（英語または混合の質問回答ペアでのチューニング）の２ステージ構成を提案。「Question alignment stage enables LLM’s proficiency in English to be transferred to nonEnglish tasks.」とあって面白い。
リポジトリはNJUNLP/QAlign (github.com)

ANIM-400K: A Large-Scale Dataset for Automated End-To-End Dubbing of Video [3.3]
Anim-400Kは、日本語と英語で425Kを超えるアニメーションビデオセグメントのデータセットである。自動ダビング、同時翻訳、ガイド付きビデオ要約、ジャンル/スタイル分類など、様々なビデオ関連タスクをサポートする。
論文参考訳（メタデータ） (Wed, 10 Jan 2024 18:32:38 GMT)
アニメーションビデオのデータセット、日本語と英語のデータでautomated dubbingでの活用を想定
リポジトリはDavidMChan/Anim400K: Anim400K: A dataset designed from the ground up for automated dubbing of video (github.com)

RWKV-TS: Beyond Traditional Recurrent Neural Network for Time Series Tasks [42.3]
伝統的なリカレントニューラルネットワーク(RNN)アーキテクチャは、伝統的に時系列タスクにおいて顕著な地位を占めてきた。近年の時系列予測の進歩は、RNNからTransformersやCNNといったタスクに移行している。我々は,RWKV-TSという,時系列タスクのための効率的なRNNモデルの設計を行った。
論文参考訳（メタデータ） (Wed, 17 Jan 2024 09:56:10 GMT)
時系列予測へのRNN系モデルの改善、高速高性能とのこと
リポジトリはhoward-hou/RWKV-TS: RWKV-TS: Beyond Traditional Recurrent Neural Network for Time Series Tasks (github.com)