- GPT as Knowledge Worker: A Zero-Shot Evaluation of (AI)CPA Capabilities [0.0]
サンプルレギュレーション(REG)試験において,OpenAI のtext-davinci-003 と GPT の前バージョンを実験的に評価した。 サンプル試験では,text-davinci-003が14.4%の正解率を達成し,ゼロショットプロンプトの定量的推論において,人間の能力より著しく低いことが判明した。 最良のプロンプトとパラメータについて、モデルでは57.6%の質問が正しく答えられ、25%の推測率よりもかなり良い。
論文 参考訳(メタデータ) (Wed, 11 Jan 2023 11:30:42 GMT) - CPA試験を対象としたGPT-3(3.5)の検証。量的推論や算術のようにGPT-3が苦手としている部分はまだまだという結果だが、そうでない部分は性能が大幅に向上しているように見える。量的な部分は別モデルで改善が続いているわけで、色々と可能性を感じる結果
- リポジトリはGitHub – mjbommar/gpt-as-knowledge-worker: GPT as Knowledger Worker (or if you really want, GPT Sorta’ Takes the CPA Exam)
月: 2023年1月
Active Learning for Abstractive Text Summarization
- Active Learning for Abstractive Text Summarization [50.8]
本稿では,抽象テキスト要約におけるアクティブラーニングのための最初の効果的なクエリ戦略を提案する。 ALアノテーションにおける私たちの戦略は、ROUGEと一貫性スコアの点からモデル性能を向上させるのに役立ちます。
論文 参考訳(メタデータ) (Mon, 9 Jan 2023 10:33:14 GMT) - 抽象型要約へのActive Learning手法の提案と適用、ランダムサンプリングを上回る結果
- 期待はありつつも難しい分野なのでランダムサンプリングを安定的に上回ったのはすごいなと思う。
Single-Point Scene Text Spotting
- SPTS v2: Single-Point Scene Text Spotting [147.0]
トレーニングシーンのテキストスポッティングモデルは、非常に低コストの単一点アノテーションで実現できることを示す。 既存のベンチマークデータセットの実験では、SPTS v2が以前の最先端のシングルポイントテキストスポッターより優れていることが示されている。
論文 参考訳(メタデータ) (Wed, 4 Jan 2023 14:20:14 GMT) - 画像からのシーン理解(OCR)では通常バウンディングボックスを用いたアノテーションが行われるが、1点の情報(テキストスポッティング)で十分な性能が出せるとの指摘。アノテーションコストが劇的に下がる。
- リポジトリはGitHub – shannanyinxiang/SPTS: Official implementation of SPTS: Single-Point Text Spotting
Text2Poster
- Text2Poster: Laying out Stylized Texts on Retrieved Images [32.5]
ポスター生成は広範囲のアプリケーションにとって重要なタスクであり、しばしば時間がかかり、手作業による編集や芸術的な経験を必要とする。 我々は,テキスト情報から視覚効果のあるポスターを自動的に生成する,Text2Posterという新しいデータ駆動フレームワークを提案する。
論文 参考訳(メタデータ) (Fri, 6 Jan 2023 04:06:23 GMT) - テキストからのポスター生成、やっていることは図を見るのがわかりやすいが、入力されたテキストから画像を選びテキストスタイルやレイアウト情報を作ってポスター生成につなげている
- リポジトリはGitHub – chuhaojin/Text2Poster-ICASSP-22: The souce code of the ICASSP-2022 paper “Text2Poster: Laying Out Stylized Texts on Retrieved Images”
ClimaBench
- ClimaBench: A Benchmark Dataset For Climate Change Text Understanding in English [26.0]
気候変動(CC)は、現実世界の緊急性にもかかわらず、NLPにおいて限られた注目を集めている。 モデル性能を評価するために,既存の異種データセットのベンチマークコレクションであるClimate Change Benchmark(ClimaBench)を紹介する。 我々は,公開環境情報から収集した大規模ラベル付きテキスト分類と質問応答データセットを2種類リリースする。
論文 参考訳(メタデータ) (Wed, 11 Jan 2023 00:22:56 GMT) - 気候変動に関連するベンチマークでNLP向け
- リポジトリはGitHub – climabench/climabench
GIVL: Geographical Inclusivity of Vision-Language
- GIVL: Improving Geographical Inclusivity of Vision-Language Models with Pre-Training Methods [62.1]
我々は地理包摂型視覚・言語事前学習モデルであるGIVLを提案する。 1) 類似のカテゴリにおける概念は独自の知識と視覚的特徴を持ち、2) 類似の視覚的特徴を持つ概念は、全く異なるカテゴリに該当する可能性がある。 GIVLは、同様のスケールのデータを事前訓練した類似サイズのモデルと比較して、最先端のSOTA(State-of-the-art)を達成し、ジオディバースなV&Lタスクにおけるよりバランスの取れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (Thu, 5 Jan 2023 03:43:45 GMT) - 結婚式や祭りのような地域特性のある画像をうまく取り扱えるVLモデルの提案。GD-VCR(Geo-Diverse Visual Commonsense Reasoning dataset): 地域特性を反映したVQA – arXiv最新論文の紹介 (devneko.jp)もあったがこの手の考慮は重要。
- コードなどはリリース予定とのこと。
Fruit Ripeness Classification
- Fruit Ripeness Classification: a Survey [59.1]
食品を格付けするための特徴記述子を多用する多くの自動的手法が提案されている。 機械学習とディープラーニング技術がトップパフォーマンスの手法を支配している。 ディープラーニングは生のデータで操作できるため、複雑なエンジニアリング機能を計算する必要がなくなる。
論文 参考訳(メタデータ) (Thu, 29 Dec 2022 19:32:20 GMT) - 果物の熟成度合いを判定するAIに関するサーベイ。(当たり前かもだが)この分野にもDeepLearningが浸透していることがわかる。
Large Language Models as Corporate Lobbyist、GPT Takes the Bar Exam
- Large Language Models as Corporate Lobbyists [0.0]
自己回帰的な大きな言語モデルは、提案されたアメリカ合衆国議会法案が特定の公共企業に関連するかどうかを決定する。 モデルが関連するものとみなす法案について、モデルは、提案された法律を変更するよう議会に説得するために、法案のスポンサーに手紙を起草する。
論文 参考訳(メタデータ) (Wed, 4 Jan 2023 16:55:35 GMT) - AIを使ってロビー活動ができるのかを検討した報告。やろうと思えばそれっぽいことが可能になってきていると感じる。
- (正当な目的にも使えるとはいえ)SPAMといえばSPAMのような気はするが、どう扱うかは悩ましい問題。
- GitHub – JohnNay/llm-lobbyist: Code for the paper: “Large Language Models as Corporate Lobbyists” (2023).
- GPT Takes the Bar Exam [0.0]
GPT-3.5 と呼ばれる OpenAI のtext-davinci-003 モデルの性能評価実験を行った。 最良のプロンプトとパラメータのために、GPT-3.5はNCBE MBEの試験で50.3%の見出し正解率を達成している。
論文 参考訳(メタデータ) (Thu, 29 Dec 2022 18:19:43 GMT) - GPT-3(3.5)を米国の弁護士試験に適用してみたとの報告。2つのカテゴリでは合格水準にあるとのこと。
“Real Attackers Don’t Compute Gradients”: Bridging the Gap Between Adversarial ML Research and Practice
- “Real Attackers Don’t Compute Gradients”: Bridging the Gap Between Adversarial ML Research and Practice [10.8]
研究者と実践者の間に明らかなギャップがあることから,本論文は2つの領域を橋渡しすることを目的としている。 まず実世界のケーススタディを3つのケーススタディで提示し、そのケーススタディから、未知の、あるいは無視された実用的な洞察を導き出すことができる。 次に、トップセキュリティカンファレンスで最近公開されたすべての敵対的ML論文を分析し、ポジティブなトレンドと盲点を強調します。
論文 参考訳(メタデータ) (Thu, 29 Dec 2022 14:11:07 GMT) - 機械学習を利用したシステムへの攻撃に関する非常に広範なサーベイ。研究と実務のギャップがわかる内容。セキュリティ関連一般に言えることかもだが、悪意のある攻撃からの防御にはシステム全体の考慮が必要。
- このサーベイのリソースはReal Attackers Don’t Compute Gradients (real-gradients.github.io)で公開されている。また、Welcome to the Artificial Intelligence Incident Database が参考文献に挙げられており参考になった
ConvNeXt V2
- ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders [104.1]
完全畳み込み型マスク付きオートエンコーダフレームワークと,新たなグローバル応答正規化層を提案する。 この自己教師付き学習技術とアーキテクチャ改善の共設計により、純粋なConvNetの性能を大幅に向上させるConvNeXt V2と呼ばれる新しいモデルファミリが生まれる。
論文 参考訳(メタデータ) (Mon, 2 Jan 2023 18:59:31 GMT) - ConvNeXt: ResNetの近代化 – arXiv最新論文の紹介 (devneko.jp)の次世代バージョン。 Global Response Normalization (GRN)層の追加により性能向上とのことだが、シンプルな処理(に見える)追加で性能が大きく改善しているのが驚き。
- リポジトリはGitHub – facebookresearch/ConvNeXt-V2: Code release for ConvNeXt V2 model、事前学習済みのモデルもダウンロード可能