2023年3月24日 – arXiv最新論文の紹介

A Picture is Worth a Thousand Words: Language Models Plan from Pixels [53.9]
計画は, 実環境下で長時間の作業を行う人工エージェントの重要な機能である。本研究では,事前学習型言語モデル(PLM)を用いて,具体的視覚環境におけるテキスト命令からのプランシーケンスを推論する。
論文参考訳（メタデータ） (Thu, 16 Mar 2023 02:02:18 GMT)
Visualプロンプトによる計画作成。PLMをうまく使うためソフトプロンプトの形でデータを扱っているよう
言語モデルか？という感じの使い方もかなりうまく動く報告が多くて面白い。GPT-4ではマルチモーダル対応でもう少しうまく取り合変えそう（将来的にはTextlessNLPっぽく扱ったりするんだろうか。）

Users are the North Star for AI Transparency [111.6]
透明な人工知能システムを求める声が広まっているにもかかわらず、この用語は、厳密な政策の目的や具体的な研究ラインのオリエント化を表すために、多義的な意味に過大評価されている。このことが起こる理由の1つは、AI透明性の明確な理想が、この仕事の体で実現されないことである。透明性はユーザ中心で、ユーザ指向で、誠実です。
論文参考訳（メタデータ） (Thu, 9 Mar 2023 18:53:29 GMT)
AIの透明性（AI Transparency）について調査した論文で、様々な文脈・意図で使われていることが分かる。
何とか性とカテゴライズすると安心しがちだが、実はその解釈が異なっていることは多いので詳細を詰めていくことはとても重要。