コンテンツへスキップ
- TL;DW? Summarizing Instructional Videos with Task Relevance & Cross-Modal Saliency [133.8]
- 我々は,ビデオ要約の未探索領域である指導ビデオの要約に焦点をあてる。 既存のビデオ要約データセットは、手動のフレームレベルのアノテーションに依存している。 本稿では,文脈対応の時間的ビデオエンコーダとセグメントスコアリング変換器を組み合わせた指導ビデオ要約ネットワークを提案する。
- 論文 参考訳(メタデータ) (Sun, 14 Aug 2022 04:07:40 GMT)
- Neural Embeddings for Text [14.1]
本稿では,意味的意味を深く表現する自然言語テキストの埋め込みについて提案する。 この方法では、言語モデルにテキストから学習させ、文字通りその脳を選択して、モデルのニューロンの実際の重みを取り、ベクトルを生成する。 ニューラルネットワークの埋め込みとGPT文の埋め込みを比較した。
論文 参考訳(メタデータ) (Wed, 17 Aug 2022 16:26:13 GMT)