Trial2Vec

  • Trial2Vec: Zero-Shot Clinical Trial Document Similarity Search using Self-Supervision [42.9]
    同様の臨床試験に注釈を付けずに自己監督を通じて学習するTrial2Vecを提案する。 臨床試験文書(タイトル、資格基準、対象疾患など)のメタ構造と臨床知識を活用して、コントラスト的なサンプルを自動生成する。 本手法は, 可視化により医療的に解釈可能な埋め込みを実現し, 試行錯誤における最良基準値に対して平均15%の精度向上が得られることを示す。
    論文  参考訳(メタデータ)  参考訳(全文)  (Wed, 29 Jun 2022 15:37:11 GMT)
    • 臨床試験文書のベクトル化、to vecシリーズでもかなり特殊な例

SNP2Vec: Single Nucleotide Polymorphisms 2 Vec

  • SNP2Vec: Scalable Self-Supervised Pre-Training for Genome-Wide Association Study [48.8]
    SNP2Vecは、SNPを理解するためのスケーラブルな自己教師付き事前学習手法である。 本研究では,SNP2Vecを用いて時系列ゲノミクスモデリングを行う。 中国コホートにおけるアルツハイマー病のリスク予測におけるアプローチの有効性について検討した。
    論文  参考訳(メタデータ)  参考訳(全文)  (Thu, 14 Apr 2022 01:53:58 GMT)
    • このような分野にも2vecシリーズが・・・

Data2vec: speech、vision、textで動作する自己教師有り学習

2vecの最終系かと思うData2vecが出ていた。Transformerをベースにタスク特有のエンコーディングを実施、objectiveは共通化されている状況でViT-B、wav2vec2/HuBERT、RoBERTaと競争的な性能とのこと。

論文はData2vec: A General Framework for Self-supervised Learning in Speech, Vision and Language (facebook.com)、リポジトリはfairseq/examples/data2vec at main · pytorch/fairseq · GitHub

Homepage2Vec

  • Language-Agnostic Website Embedding and Classification [12.9]
    92言語で100万以上のWebサイトを持つデータセットをリリースし、Curlieから相対ラベルを収集しました。 ホームページに基づいてWebサイトを分類・埋め込みするマシン学習モデルであるHomepage2Vecを紹介する。 Homepage2Vecは、マクロ平均F1スコア0.90のWebサイトを正しく分類し、低および高ソース言語で安定したパフォーマンスを示す。
    論文  参考訳(メタデータ)   (Mon, 10 Jan 2022 22:31:48 GMT)

Table2Vec: 顧客データに対する表現学習

  • Table2Vec: Automated Universal Representation Learning to Encode All-round Data DNA for Benchmarkable and Explainable Enterprise Data Science [34.2]
    本稿では,顧客などのエンティティの自動普遍的表現学習のためのニューラルエンコーダTable2Vecを紹介する。 学習された普遍的な表現は、代表的でベンチマーク可能なエンタープライズデータゲノムとして機能する。 Table2Vecは、エンタープライズ分析で一般的に使用される、浅く、強化され、深層学習の手法を大幅に上回っている。
    論文  参考訳(メタデータ)   (Fri, 3 Dec 2021 10:39:25 GMT)
    • テーブルデータに対する2vec、様々な形態のデータを分散表現にできるとのことで、直感的に様々なところで使えそうな一方でleak対策がどうなっているかが気にかかる。