RecSys 2024 — Session 3: Bias and Fairness 2 - RecSys – RecSys
Biased User History Synthesis for Personalized Long-Tail Item Recommendation
https://dl.acm.org/doi/10.1145/3640457.3688141
- 掲出が一部のアイテムに偏る問題(long-tail item problem)に付いての検討。評価はMovieLens-1M / BookCrossing
- 提案を見る限り、それ自体が問題というより、ロングテール部分にこそユーザー固有の関心が含まれているのでそれを有効に活用しようという話に見える(結果的に掲出アイテムの偏りの緩和にもつながるはず)
- テールアイテムとのインタラクション履歴をユーザーembeddingに反映する。試されているのは三通りで、(1) アイテムehmbeddingの平均をとる (2) Attensionで重み付けして足し合わせる (3) 時系列データとして学習に反映
- みたところ比較対象に「サンプリングなしで最適化されたuser embedding」がない気がするのが気になる
The Fault in Our Recommendations: On the Perils of Optimizing the Measurable
https://dl.acm.org/doi/10.1145/3640457.3688144
- エンゲージメントがイコールでユーザーの効用を表す訳では無いよねという話。対象は推薦一般。評価は理論解析とシミュレーション
- 効用関数を仮定してエンゲージメントでそれを更新する形にすることで、エンゲージをちょくに効かせるのではなく確率的に効かせるようなイメージか?
- 結果的に探索と活用のバランスが取られるということらしい
Fair Reciprocal Recommendation in Matching Markets
https://dl.acm.org/doi/10.1145/3640457.3688130
- デーティングサービスや求人サービスなどマッチングにおける推薦の公平性の話。Cyber Agentの人の発表だ.....(日本の企業名をみるとうれしい) 実際にデーティングサービスで検証したとのことなのでたぶんタップルか
- 一部の人気ユーザーへの過度な集中を避けて公平性を高めたい。公平性はenvyの数(自分より他の人の推薦をいいなあと思う回数)によって評価する
- 提案手法では、Nash Social Welfare、つまり各ユーザーの効用の積を最大化することを目指す
- 提案手法は期待マッチ数を維持しつつ、envyの数を減らすことができたとのこと
感想
音楽とか動画とかのコンテンツだと無限にマッチングできるのだけど、デーティングとか求人とかだとマッチングできる数に上限があるわけだ(広告に関しても表示回数に上限があるのでこっちに近い)。となると、個別ユーザー単位で何がいいのか考えるのには限界があって、このマッチングはどこで使うのが正解か?を考える必要があるってことで、面白い(真面目にやると大変そう 筋の良いヒューリスティックを考えるのは割と楽しそう)