Semantic-aware Texture-Structure Feature Collaboration for Underwater Image Enhancement

  • Semantic-aware Texture-Structure Feature Collaboration for Underwater Image Enhancement [58.1]
    水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。 我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。 また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
    論文  参考訳(メタデータ)   (Sat, 19 Nov 2022 07:50:34 GMT)
  • 水中画像の画像処理
  • リポジトリはwdhudiekou/STSC: Semantic-aware Texture-Structure Feature Collaboration for Underwater Image Enhancement (github.com)

Long-Document Cross-Lingual Summarization

  • Long-Document Cross-Lingual Summarization [15.8]
    言語間の要約は、ある言語で与えられた文書に対して、ある言語で要約を生成することを目的としている。 長文書における CLS 研究を促進するため,最初の長文書 CLS データセットである Perseus を構築した。 ペルセウスの文書の平均の長さは2,000以上のトークンである。
    論文  参考訳(メタデータ)   (Thu, 1 Dec 2022 15:24:16 GMT)
  • 長文をクロスリンガルで要約するためのデータセット作成と様々な手法の比較。中国語を対象とした成果だが、このような問題は日本語でも重要
  • mBART+LEDを用いたEnd-to-Endモデルが最も高性能との結果で驚いた。日本語版を作りたくなってくる…

ChatGPTとtext-davinci-003

  • ChatGPT: Optimizing Language Models for Dialogue (openai.com)
  • 極めて強力な対話用の言語モデル。Google検索か!?というレベルで回答をしてくれる。(間違っている場合も多いが…)
  • Reinforcement Learning from Human Feedback (RLHF)を用いており、GPT-3.5をfine tuningしているとのこと。
  • 11/29に出たtext-davinci-003もGPT-3.5シリーズのモデルでInstructGPT(code-davinci-002)ベースのtext-davinci-002を改善したものとのことで、こちらも性能が高い。NLPを変える可能性を感じている。
  • Model index for researchers – OpenAI API

GPT-3を使った対話による学習プロセス改善、要約

  • GPT-3-driven pedagogical agents for training children’s curious question-asking skills [24.7]
    学生が好奇心をそそる質問をする能力は、学習プロセスを改善する重要なスキルである。 これまでの研究では、学習中の子供の好奇心を促進するために特定の手がかりを提案する会話エージェントが用いられてきた。 本研究は,大規模言語モデル(GPT-3)を用いて,好奇心を刺激する手がかりの自動生成を行う。
    論文  参考訳(メタデータ)   (Tue, 29 Nov 2022 15:27:35 GMT)
  • Zero-Shot Opinion Summarization with GPT-3 [116.0]
    GPT-3モデルは人間の評価において非常に高い性能を示すことを示す。 我々は,標準評価指標がこれを反映していないことを論じ,忠実性,事実性,汎用性を重視したいくつかの新しい尺度に対して評価を行った。
    論文  参考訳(メタデータ)   (Tue, 29 Nov 2022 04:06:21 GMT)

GPT-3を使った応用的な研究。fugumt.comでも論文検索に一部利用しており、不明点が多い分野の論文を探す場合に外部知識(GPT-3.5の知識)を利用するには良いもののように思っている。

Deepfake Detectionのサーベイ

  • Deepfake Detection: A Comprehensive Study from the Reliability Perspective [46.2]
    Deepfake合成材料はインターネット上で流通し、社会に深刻な影響を与えている。 本稿では,Deepfake検出の3つの側面,すなわち伝達可能性,解釈可能性,信頼性について検討する。
    論文  参考訳(メタデータ)   (Sun, 20 Nov 2022 06:31:23 GMT)
  • Deepfake検出に関するサーベイ
  • 生成にも検出にも近い技術が使われており、いたちごっこ感が凄い……

自然言語処理へのバックドアアタックと防御のサーベイ

  • A Survey on Backdoor Attack and Defense in Natural Language Processing [18.3]
    NLP分野におけるバックドア攻撃と防御の総合的な検討を行う。 ベンチマークデータセットを要約し、バックドア攻撃を防ぐために信頼できるシステムを設計するためのオープンな問題を指摘した。
    論文  参考訳(メタデータ)   (Tue, 22 Nov 2022 02:35:12 GMT)
  • NLPにおける攻撃と防御のサーベイ
  • 短めでざっくりと状況を知るのに良いサーベイ。自然言語一般かもしれないが、良いメトリクスが無いというのはつらいなーと思う(スコアリングモデル自体が攻撃対象になっているとめっちゃ大変そう)

Human or Machine? Turing Tests for Vision and Language 

  • Human or Machine? Turing Tests for Vision and Language [22.1]
    我々は、現在のAIを人間を模倣する能力で体系的にベンチマークする。 実験では、769人の人的エージェント、24人の最先端AIエージェント、896人の人的裁判官、8人のAI裁判官がテストされた。 その結果、現在のAIは、性別、年齢、教育レベルによって人間の裁判官を偽装できるわけではないことが判明した。
    論文  参考訳(メタデータ)   (Wed, 23 Nov 2022 16:16:52 GMT)
  • 大規模なチューリングテスト。AIがチューリングテストを受けるだけでなく、ジャッジもしているのが面白い。
  • チューリングテストには批判も多いが大規模実験の結果は面白い。長い対話はともかくとしてAIか人間かの判断は難しいように思えるし、その判断ですらAIの性能は高いよう。
  • データ等はhttps://tinyurl.com/8x8nha7pで公開されているとのこと

The Lean Data Scientist

  • The Lean Data Scientist: Recent Advances towards Overcoming the Data Bottleneck [16.2]
    機械学習(ML)は、ほとんどすべての科学と産業に影響を及ぼし、世界を変えつつある。 最近のアルゴリズムはますますデータに飢えており、トレーニングには大規模なデータセットが必要である。 しかし、そのような規模の高品質なデータセットを取得することは難しい課題である。
    論文  参考訳(メタデータ)   (Tue, 15 Nov 2022 07:44:56 GMT)
  • データが少ない問題に対応する手法を整理した論文
  • それほど長くもなく頭の整理には良いなと思う。

PIDray: A Large-scale X-ray Benchmark for Real-World Prohibited Item Detection

  • PIDray: A Large-scale X-ray Benchmark for Real-World Prohibited Item Detection [21.1]
    PIDrayという名前の大規模データセットを提示し、実世界の様々なケースを対象とし、アイテム検出を禁止している。 具体的には、PIDrayは禁止アイテムの12のカテゴリに対して124,486枚のX線画像を収集する。 そこで本研究では,PIDrayに基づくベースラインアルゴリズムを開発するために,汎用的な分割・コンカレントパイプラインを提案する。
    論文  参考訳(メタデータ)   (Sat, 19 Nov 2022 18:31:34 GMT)
  • セキュリティ検査などにおける禁止物のX線画像データセット。Easy / Hard / Hiddenと難易度が設定されているのが面白い。
  • リポジトリはlutao2021/PIDray (github.com)