- JaQuAD: Japanese Question Answering Dataset for Machine Reading Comprehension [0.0]
本稿では,日本語質問応答データセットJaQuADについて述べる。 JaQuADは日本語ウィキペディアの記事に39,696の質問対を抽出する。 F1スコアが78.92%、テストセットが63.38%となるベースラインモデルを微調整した。
論文 参考訳(メタデータ) 参考訳(全文) (Thu, 3 Feb 2022 18:40:25 GMT)- 珍しい日本語のSQuADデータ、wikipediaデータがもとになっているよう。ライセンスはCC BY-SAと使いやすい。ぱっと見では高品質なデータのよう。
- リポジトリはGitHub – SkelterLabsInc/JaQuAD: JaQuAD: Japanese Question Answering Dataset for Machine Reading Comprehension (2022, Skelter Labs)