BigBIO: A Framework for Data-Centric Biomedical Natural Language Processing [13.3] バイオメディカルNLPデータセット126以上のコミュニティライブラリであるBigBIOを紹介する。 BigBIOは、データセットとそのメタデータへのプログラムアクセスを通じて、再現可能なメタデータキュレーションを容易にする。 本稿では,タスクスキーマ,データ監査,コントリビューションガイドライン,および2つの実証的ユースケースの概要について論じる。 論文参考訳(メタデータ) (Thu, 30 Jun 2022 07:15:45 GMT)
バイオ・医療分野のデータセット。126のデータセットがありタスクカテゴリは以下の12とのこと。
Knowledge Base (KB)
Named entity recognition (NER)
Named entity disambiguation/normalization/linking (NED)