QUEACO: E-コマースにおけるNER(Named Entity Recognition) とAVN(Attribute Value Normalization)

  • QUEACO: Borrowing Treasures from Weakly-labeled Behavior Data for Query Attribute Value Extraction [57.6]
    本稿では,QUEACOというEコマース検索におけるクエリ属性値の統一抽出システムを提案する。 NER フェーズでは、QUEACO は教師-学生ネットワークを採用し、強くラベル付けされたデータに基づいてトレーニングされた教師ネットワークが擬似ラベルを生成する。 AVN フェーズでは、弱いラベル付けされたクエリ・ツー・アトリビュート・ビヘイビア・データを利用して、クエリーから表層属性値の正規化を行い、製品から標準形式へと変換する。
    論文  参考訳(メタデータ)  参考訳(全文)  (Thu, 19 Aug 2021 03:24:23 GMT)
    • 検索クエリにおいて「mk tote for womans」を「mk:ブランド名 tote:商品タイプ for womans:検索者」と認識したうえで「mk:Michael Kors 、tote: handbagカテゴリ 、womans:women(スペルミス修正)」と標準的な検索ワードに正規化する問題に取り組んだ論文。
    • 「人がアノテーションした少数だが高品質なデータ」と「検索クエリ+その後のユーザのクリックから作成したノイジーだが大量のデータ」を組みあわせて使用し、DistilBERT(multilingualのものをDistilmBERT と表記?)ベースのモデルを用いている。