DRAMA: Joint Risk Localization and Captioning in Driving [23.1] 本稿では,運転場面における共同リスクローカライゼーションの新たな研究方向と,その自然言語記述としてのリスク説明を提案する。 標準ベンチマークの欠如により、我々は大規模データセットDRAMA (Driving Risk Assessment Mechanism with A Casting Module) を収集した。 我々のデータセットは、視覚的キャプションの目標を達成するために、関連する重要なオブジェクトによるリスクの駆動に関するビデオおよびオブジェクトレベルの質問に適合する。 論文参考訳(メタデータ) (Thu, 22 Sep 2022 03:53:56 GMT)
運転中のビデオとその説明、QAを含むデータセット。17,785シナリオと規模も大きい。「We make this data available to the community for further research.」とあるものの、データ利用にはプロジェクトサイトからメールで問い合わせが必要そう。
TempoWiC: An Evaluation Benchmark for Detecting Meaning Shift in Social Media [17.8] 我々は、ソーシャルメディアベースの意味変化の研究を加速するための新しいベンチマークであるTempoWiCを紹介する。 この結果から,ソーシャルメディアに特化した最近リリースされた言語モデルであっても,TempoWiCは難しいベンチマークであることがわかった。 論文参考訳(メタデータ) (Fri, 16 Sep 2022 16:54:46 GMT)
Prompting for a conversation: How to control a dialog model? [9.3] ダイアログモデルは大量のテキストでトレーニングされるが、その応答はダイアログエージェントの望ましいスコープとスタイルに制限される必要がある。 前者を達成するために使用されるデータセットには後者と互換性のない言語が含まれているため、事前訓練されたダイアログモデルは、より小さなキュレートされたデータセットで微調整される。 本稿では,上記のトレードオフを緩和できるかどうかを検討する。 論文参考訳(メタデータ) (Thu, 22 Sep 2022 14:59:55 GMT)
Generate rather than Retrieve: Large Language Models are Strong Context Generators [74.9] 本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。 我々は,提案手法をgenRead と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。 論文参考訳(メタデータ) (Wed, 21 Sep 2022 01:30:59 GMT)