- GOAL: A Challenging Knowledge-grounded Video Captioning Benchmark for Real-time Soccer Commentary Generation [42.0]
我々は,KGVC(Knowledge-grounded Video Captioning)として,サッカービデオクリップ8.9k,文22k,知識3分の3以上のベンチマークを提示する。 我々は,既存の手法を実験的に適用し,この課題の解決の難しさと可能性を示す。
論文 参考訳(メタデータ) (Sun, 26 Mar 2023 08:43:36 GMT) - かなり無理やり感のある略称のベンチマークデータセット。規模が大きく面白いものではあるが、略称が(以下略)
- KGVC: knowledgegrounded video captioningタスクとしてかなり難しいデータであるとのこと(そもそもこのタスクは相当困難な気はする)
- Our dataset will be publicly available after reviewらしい
日: 2023年4月14日
Data-centric AIに関するサーベイ
同じ研究グループによる(と思われる)Data中心AIに関するサーベイが出ていた。コンパクトな概要とFullのサーベイという印象。両方とも(著者らによる)GitHub – daochenzha/data-centric-AI: A curated, but incomplete, list of data-centric AI resources.を参照している
ChatGPTに関する言及もあり、人間による高品質なデータの重要性を主張している
- Data-centric AI: Perspectives and Challenges [51.7]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。 データ開発、推論データ開発、データメンテナンスの3つの一般的なミッションをまとめます。
論文 参考訳(メタデータ) (Sun, 2 Apr 2023 05:18:56 GMT) - 5ページとコンパクトな概要
- Data-centric Artificial Intelligence: A Survey [47.2]
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。 本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。 これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
論文 参考訳(メタデータ) (Sun, 2 Apr 2023 04:43:32 GMT) - 39ページ、引用数300近くとフルのサーベイ