arXiv最新論文の紹介

Myths and Legends in High-Performance Computing

Myths and Legends in High-Performance Computing [66.0]
このユーモラスで思想的な挑発的な記事では、高性能コンピューティングコミュニティのメンバーの間で伝承される神話や伝説について論じる。それらは、デナードのスケーリングやムーアの法則など、多くのスケーリング法則の終焉によって引き起こされた、現在の大規模な変革の時代における退化論者を表していると我々は信じている。いくつかの法則が終わる一方で、アルゴリズムスケーリングや新しいアーキテクチャ研究など、新しい方向性が開かれる。
論文参考訳（メタデータ） (Fri, 6 Jan 2023 09:32:19 GMT)
ハイパフォーマンスコンピューティングの12の神話、面白い記事。

Data-centric AI: Perspectives and Challenges

Data-centric AI: Perspectives and Challenges [51.7]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。データ開発、評価データ開発、データメンテナンスの3つの一般的なミッションをまとめる。今後の探索を動機付けるためのオープンな課題をリストアップする。
論文参考訳（メタデータ） (Thu, 12 Jan 2023 05:28:59 GMT)
Data-centric AIに関する解説。5ページと短いが、Training Data Development, Evaluation Data Development, Data Maintenaceに分けて概要と動向を解説している。

GPT as Knowledge Worker: A Zero-Shot Evaluation of (AI)CPA Capabilities

GPT as Knowledge Worker: A Zero-Shot Evaluation of (AI)CPA Capabilities [0.0]
サンプルレギュレーション(REG)試験において,OpenAI のtext-davinci-003 と GPT の前バージョンを実験的に評価した。サンプル試験では,text-davinci-003が14.4%の正解率を達成し,ゼロショットプロンプトの定量的推論において,人間の能力より著しく低いことが判明した。最良のプロンプトとパラメータについて、モデルでは57.6%の質問が正しく答えられ、25%の推測率よりもかなり良い。
論文参考訳（メタデータ） (Wed, 11 Jan 2023 11:30:42 GMT)
CPA試験を対象としたGPT-3(3.5)の検証。量的推論や算術のようにGPT-3が苦手としている部分はまだまだという結果だが、そうでない部分は性能が大幅に向上しているように見える。量的な部分は別モデルで改善が続いているわけで、色々と可能性を感じる結果
リポジトリはGitHub – mjbommar/gpt-as-knowledge-worker: GPT as Knowledger Worker (or if you really want, GPT Sorta’ Takes the CPA Exam)

Active Learning for Abstractive Text Summarization

Active Learning for Abstractive Text Summarization [50.8]
本稿では,抽象テキスト要約におけるアクティブラーニングのための最初の効果的なクエリ戦略を提案する。 ALアノテーションにおける私たちの戦略は、ROUGEと一貫性スコアの点からモデル性能を向上させるのに役立ちます。
論文参考訳（メタデータ） (Mon, 9 Jan 2023 10:33:14 GMT)
抽象型要約へのActive Learning手法の提案と適用、ランダムサンプリングを上回る結果
期待はありつつも難しい分野なのでランダムサンプリングを安定的に上回ったのはすごいなと思う。

Single-Point Scene Text Spotting

SPTS v2: Single-Point Scene Text Spotting [147.0]
トレーニングシーンのテキストスポッティングモデルは、非常に低コストの単一点アノテーションで実現できることを示す。既存のベンチマークデータセットの実験では、SPTS v2が以前の最先端のシングルポイントテキストスポッターより優れていることが示されている。
論文参考訳（メタデータ） (Wed, 4 Jan 2023 14:20:14 GMT)
画像からのシーン理解（OCR)では通常バウンディングボックスを用いたアノテーションが行われるが、1点の情報（テキストスポッティング）で十分な性能が出せるとの指摘。アノテーションコストが劇的に下がる。
リポジトリはGitHub – shannanyinxiang/SPTS: Official implementation of SPTS: Single-Point Text Spotting

Text2Poster

Text2Poster: Laying out Stylized Texts on Retrieved Images [32.5]
ポスター生成は広範囲のアプリケーションにとって重要なタスクであり、しばしば時間がかかり、手作業による編集や芸術的な経験を必要とする。我々は,テキスト情報から視覚効果のあるポスターを自動的に生成する,Text2Posterという新しいデータ駆動フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 6 Jan 2023 04:06:23 GMT)
テキストからのポスター生成、やっていることは図を見るのがわかりやすいが、入力されたテキストから画像を選びテキストスタイルやレイアウト情報を作ってポスター生成につなげている
リポジトリはGitHub – chuhaojin/Text2Poster-ICASSP-22: The souce code of the ICASSP-2022 paper “Text2Poster: Laying Out Stylized Texts on Retrieved Images”

ClimaBench

ClimaBench: A Benchmark Dataset For Climate Change Text Understanding in English [26.0]
気候変動(CC)は、現実世界の緊急性にもかかわらず、NLPにおいて限られた注目を集めている。モデル性能を評価するために,既存の異種データセットのベンチマークコレクションであるClimate Change Benchmark(ClimaBench)を紹介する。我々は,公開環境情報から収集した大規模ラベル付きテキスト分類と質問応答データセットを2種類リリースする。
論文参考訳（メタデータ） (Wed, 11 Jan 2023 00:22:56 GMT)
気候変動に関連するベンチマークでNLP向け
リポジトリはGitHub – climabench/climabench

GIVL: Geographical Inclusivity of Vision-Language

GIVL: Improving Geographical Inclusivity of Vision-Language Models with Pre-Training Methods [62.1]
我々は地理包摂型視覚・言語事前学習モデルであるGIVLを提案する。 1) 類似のカテゴリにおける概念は独自の知識と視覚的特徴を持ち、2) 類似の視覚的特徴を持つ概念は、全く異なるカテゴリに該当する可能性がある。 GIVLは、同様のスケールのデータを事前訓練した類似サイズのモデルと比較して、最先端のSOTA(State-of-the-art)を達成し、ジオディバースなV&Lタスクにおけるよりバランスの取れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Thu, 5 Jan 2023 03:43:45 GMT)
結婚式や祭りのような地域特性のある画像をうまく取り扱えるVLモデルの提案。GD-VCR(Geo-Diverse Visual Commonsense Reasoning dataset): 地域特性を反映したVQA – arXiv最新論文の紹介 (devneko.jp)もあったがこの手の考慮は重要。
コードなどはリリース予定とのこと。

Fruit Ripeness Classification

Fruit Ripeness Classification: a Survey [59.1]
食品を格付けするための特徴記述子を多用する多くの自動的手法が提案されている。機械学習とディープラーニング技術がトップパフォーマンスの手法を支配している。ディープラーニングは生のデータで操作できるため、複雑なエンジニアリング機能を計算する必要がなくなる。
論文参考訳（メタデータ） (Thu, 29 Dec 2022 19:32:20 GMT)
果物の熟成度合いを判定するAIに関するサーベイ。（当たり前かもだが）この分野にもDeepLearningが浸透していることがわかる。

Large Language Models as Corporate Lobbyist、GPT Takes the Bar Exam

Large Language Models as Corporate Lobbyists [0.0]
自己回帰的な大きな言語モデルは、提案されたアメリカ合衆国議会法案が特定の公共企業に関連するかどうかを決定する。モデルが関連するものとみなす法案について、モデルは、提案された法律を変更するよう議会に説得するために、法案のスポンサーに手紙を起草する。
論文参考訳（メタデータ） (Wed, 4 Jan 2023 16:55:35 GMT)
AIを使ってロビー活動ができるのかを検討した報告。やろうと思えばそれっぽいことが可能になってきていると感じる。
（正当な目的にも使えるとはいえ）SPAMといえばSPAMのような気はするが、どう扱うかは悩ましい問題。
GitHub – JohnNay/llm-lobbyist: Code for the paper: “Large Language Models as Corporate Lobbyists” (2023).

GPT Takes the Bar Exam [0.0]
GPT-3.5 と呼ばれる OpenAI のtext-davinci-003 モデルの性能評価実験を行った。最良のプロンプトとパラメータのために、GPT-3.5はNCBE MBEの試験で50.3%の見出し正解率を達成している。
論文参考訳（メタデータ） (Thu, 29 Dec 2022 18:19:43 GMT)
GPT-3(3.5)を米国の弁護士試験に適用してみたとの報告。2つのカテゴリでは合格水準にあるとのこと。

2025年7月
月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31