コンテンツへスキップ
- Inner Monologue: Embodied Reasoning through Planning with Language Models [81.1]
大規模言語モデル(LLM)は自然言語処理以外の領域に適用できる。 具体化された環境でのLLMの計画には、何をすべきかだけでなく、どのように、いつ行うべきかを考える必要がある。 環境フィードバックを活用することで、LLMはロボット制御シナリオにおいてよりリッチな処理と計画を行うことができる内部モノローグを形成することができる。
論文 参考訳(メタデータ) (Tue, 12 Jul 2022 15:20:48 GMT)
- OmniTab: Pretraining with Natural and Synthetic Data for Few-shot Table-based Question Answering [106.7]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。 本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文 参考訳(メタデータ) (Fri, 8 Jul 2022 01:23:45 GMT)
- Revealing Unfair Models by Mining Interpretable Evidence [50.5]
機械学習の人気は、不公平なモデルがハイリスクなアプリケーションにデプロイされるリスクを高めている。 本稿では,解釈可能な証拠をマイニングすることで不公平なモデルを明らかにする新しい課題に取り組む。 本手法は,訓練されたモデルの不公平性を効果的に明らかにするために,極めて解釈可能な確固たる証拠を見出す。
論文 参考訳(メタデータ) (Tue, 12 Jul 2022 20:03:08 GMT)- 不公平さをエビデンス付きで明らかにするタスク・手法の提案
- 社会実装のために重要な技術であると思う
- Embedding Recycling for Language Models [38.1]
我々は, 埋込みリサイクル(ER)によるそのような環境下での計算コストの削減について検討する。 我々は、事前訓練されたモデルから中間層の出力をキャッシュし、残りのレイヤを微調整して新しいタスクを行う方法を提案する。 本研究では,本手法が学習中の100%の高速化,55~86%の推論速度向上を実現し,学術領域におけるテキスト分類とエンティティ認識タスクの精度への影響を無視できることを示した。
論文 参考訳(メタデータ) 参考訳(全文) (Mon, 11 Jul 2022 16:36:14 GMT)
- Video Graph Transformer for Video Question Answering [182.1]
本稿では,ビデオクエリアンサー(VideoQA)のためのビデオグラフ変換器(VGT)モデルを提案する。 事前学習のないシナリオでは,VGTは先行技術よりも動的関係推論に挑戦するビデオQAタスクにおいて,はるかに優れたパフォーマンスが得られることを示す。
論文 参考訳(メタデータ) (Tue, 12 Jul 2022 06:51:32 GMT)
- More ConvNets in the 2020s: Scaling up Kernels Beyond 51×51 using Sparsity [103.6]
最近、いくつかの先進的な畳み込みモデルが、局所的だが大きな注意機構によって動機付けられた大きなカーネルで後退している。 本稿では,51×51カーネルを備えた純粋なCNNアーキテクチャであるSparse Large Kernel Network (SLaK)を提案する。
論文 参考訳(メタデータ) (Thu, 7 Jul 2022 23:55:52 GMT)
- DavarOCR: A Toolbox for OCR and Multi-Modal Document Understanding [27.0]
DavarOCRは、OCRとドキュメント理解タスクのためのオープンソースのツールボックスである。 DavarOCRは19の高度なアルゴリズムを実装し、9つのタスク形式をカバーする。
論文 参考訳(メタデータ) (Thu, 14 Jul 2022 06:54:47 GMT)
- DocCoder: Generating Code by Retrieving and Reading Docs [87.9]
コードマニュアルとドキュメントを明示的に活用するアプローチであるDocCoderを紹介します。 我々のアプローチは一般的に、どんなプログラミング言語にも適用でき、基礎となるニューラルモデルとは無関係です。
論文 参考訳(メタデータ) (Wed, 13 Jul 2022 06:47:51 GMT)
- COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary or Truncated Texts [47.5]
日本語漫画におけるオノマトペのテキストからなる新しい漫画オノマトペデータセット(COO)を提供する。 COOは、非常に湾曲した、部分的に縮小したテキスト、任意に配置されたテキストなど、多くの任意のテキストを持っている。 我々は,オノマトペ領域を検出し,その意図した意味を捉えるために,テキスト検出,テキスト認識,リンク予測という3つのタスクを実行する。
論文 参考訳(メタデータ) 参考訳(全文) (Mon, 11 Jul 2022 07:39:35 GMT)
- BigBIO: A Framework for Data-Centric Biomedical Natural Language Processing [13.3]
バイオメディカルNLPデータセット126以上のコミュニティライブラリであるBigBIOを紹介する。 BigBIOは、データセットとそのメタデータへのプログラムアクセスを通じて、再現可能なメタデータキュレーションを容易にする。 本稿では,タスクスキーマ,データ監査,コントリビューションガイドライン,および2つの実証的ユースケースの概要について論じる。
論文 参考訳(メタデータ) (Thu, 30 Jun 2022 07:15:45 GMT)- バイオ・医療分野のデータセット。126のデータセットがありタスクカテゴリは以下の12とのこと。
- Knowledge Base (KB)
- Named entity recognition (NER)
- Named entity disambiguation/normalization/linking (NED)
- Event extraction (EE)
- Relation extraction (RE)
- Coreference resolution (COREF)
- Question Answering (QA)
- Textual Entailment (TE)
- Text Pairs (PAIRS)
- Semantic Similarity (STS)
- Text to Text (T2T)
- Paraphasing (PARA)
- Translation (TRANSL)
- Summarization (SUM)
- Text (TEXT)
- Text classification (TXTCLASS)