Datasets: Hugging faceのデータセット

  • Datasets: A Community Library for Natural Language Processing [55.5]
    データセットは、現代のNLPのためのコミュニティライブラリである。 このライブラリには650以上のユニークなデータセットが含まれており、250以上のコントリビュータを抱えており、さまざまな新しいクロスデータセット研究プロジェクトを支援している。
    論文  参考訳(メタデータ)   (Tue, 7 Sep 2021 03:59:22 GMT)
    • みんな大好き(?)Huggingfaceとコミュニティが整備したデータセットライブラリ。幅広いデータセットが使いやすく整備されている。
    • リポジトリはhttps://github.com/huggingface/datasets、「pip install datasets」はすごいコマンドだなとも。