- EEG2Vec: Learning Affective EEG Representations via Variational Autoencoders [27.3]
我々は、感情的な刺激に反応して、潜在ベクトル空間におけるニューラルデータを表現することが、両方の感情状態を予測するのに役立つかどうかを考察する。 脳波データから生成的識別的表現を学習するための条件付き変分オートエンコーダベースのフレームワークであるEEG2Vecを提案する。
論文 参考訳(メタデータ) (Sat, 16 Jul 2022 19:25:29 GMT)- 2vec系、脳波版
タグ: 2vec
Trial2Vec
- Trial2Vec: Zero-Shot Clinical Trial Document Similarity Search using Self-Supervision [42.9]
同様の臨床試験に注釈を付けずに自己監督を通じて学習するTrial2Vecを提案する。 臨床試験文書(タイトル、資格基準、対象疾患など)のメタ構造と臨床知識を活用して、コントラスト的なサンプルを自動生成する。 本手法は, 可視化により医療的に解釈可能な埋め込みを実現し, 試行錯誤における最良基準値に対して平均15%の精度向上が得られることを示す。
論文 参考訳(メタデータ) 参考訳(全文) (Wed, 29 Jun 2022 15:37:11 GMT)- 臨床試験文書のベクトル化、to vecシリーズでもかなり特殊な例
SNP2Vec: Single Nucleotide Polymorphisms 2 Vec
- SNP2Vec: Scalable Self-Supervised Pre-Training for Genome-Wide Association Study [48.8]
SNP2Vecは、SNPを理解するためのスケーラブルな自己教師付き事前学習手法である。 本研究では,SNP2Vecを用いて時系列ゲノミクスモデリングを行う。 中国コホートにおけるアルツハイマー病のリスク予測におけるアプローチの有効性について検討した。
論文 参考訳(メタデータ) 参考訳(全文) (Thu, 14 Apr 2022 01:53:58 GMT)- このような分野にも2vecシリーズが・・・
Data2vec: speech、vision、textで動作する自己教師有り学習
2vecの最終系かと思うData2vecが出ていた。Transformerをベースにタスク特有のエンコーディングを実施、objectiveは共通化されている状況でViT-B、wav2vec2/HuBERT、RoBERTaと競争的な性能とのこと。
論文はData2vec: A General Framework for Self-supervised Learning in Speech, Vision and Language (facebook.com)、リポジトリはfairseq/examples/data2vec at main · pytorch/fairseq · GitHub
Homepage2Vec
- Language-Agnostic Website Embedding and Classification [12.9]
92言語で100万以上のWebサイトを持つデータセットをリリースし、Curlieから相対ラベルを収集しました。 ホームページに基づいてWebサイトを分類・埋め込みするマシン学習モデルであるHomepage2Vecを紹介する。 Homepage2Vecは、マクロ平均F1スコア0.90のWebサイトを正しく分類し、低および高ソース言語で安定したパフォーマンスを示す。
論文 参考訳(メタデータ) (Mon, 10 Jan 2022 22:31:48 GMT)- ウェブサイトを分散表現にするHomepage2Vec。多言語(92言語)に対応、日本語も対応しているよう。WEBサイトを扱う場合の前処理に使えるかもしれない。
- リポジトリはGitHub – epfl-dlab/homepage2vec: Language-Agnostic Website Embedding and Classification
Table2Vec: 顧客データに対する表現学習
- Table2Vec: Automated Universal Representation Learning to Encode All-round Data DNA for Benchmarkable and Explainable Enterprise Data Science [34.2]
本稿では,顧客などのエンティティの自動普遍的表現学習のためのニューラルエンコーダTable2Vecを紹介する。 学習された普遍的な表現は、代表的でベンチマーク可能なエンタープライズデータゲノムとして機能する。 Table2Vecは、エンタープライズ分析で一般的に使用される、浅く、強化され、深層学習の手法を大幅に上回っている。
論文 参考訳(メタデータ) (Fri, 3 Dec 2021 10:39:25 GMT)- テーブルデータに対する2vec、様々な形態のデータを分散表現にできるとのことで、直感的に様々なところで使えそうな一方でleak対策がどうなっているかが気にかかる。