ResSys 2024 流し読みメモ(Session 4: Collaborative Filtering)

recsys.acm.org

The Role of Unknown Interactions in Implicit Matrix Factorization — A Probabilistic View

https://dl.acm.org/doi/10.1145/3640457.3688100

  • アントワープ大。implicitなデータにおける行列分解手法の提案。MovieLens-20M / Million Song Datasetで評価
  • 既存手法(iALS)では行列がスパースになる問題に対応するために、未知データをすべて負のサンプルとして扱い、かつ学習における重要度を下げる
  • 実際は正かもしれないわけなので、そのあたりをいい感じに考慮した手法を提案。全体的に性能が向上していそうなことを実験で確認
Adaptive Fusion of Multi-View for Graph Contrastive Recommendation

https://dl.acm.org/doi/10.1145/3640457.3688153

  • 浙江大。Graph Contrastive Learningを改善した手法の提案。Gowalla, Amazon-book, Tmall データセットで評価
  • Graph Neural NetworkもContrasitive Learningもほんのちょっぴりもわからないから一切とっかかりがなかった......
  • Recall@20/40, NDCG@20/40で既存手法よりもかなり改善とあった
Low Rank Field-Weighted Factorization Machines for Low Latency Item Recommendation

https://dl.acm.org/doi/10.1145/3640457.3688097

  • Yahoo Research。たとえば広告配信のような低レイテンシ高スループットが求められるシステムにおけるField-weighted FMの計算量削減の検討。Criteo, Avazu, MovieLensおよびオンライン広告配信システムの実データで検証
  • FwFMのフィールド相互作用行列RをDPLR分解を用いて近似することで計算量を下げるらしい
  • 通常のFwFMと同程度の精度を維持しながらレイテンシを改善したとのこと
Unlocking the Hidden Treasures: Enhancing Recommendations with Unlabeled Data

https://dl.acm.org/doi/10.1145/3640457.3688149

  • ハルビン工程大。対象は推薦一般。評価はMovieLens-1M, Yelp, Gowalla, Foursquare
  • 協調フィルタリングにおいて未観測の要素は負例として扱うことが多いが、あまり適切ではないので、neutralサンプルとして扱い、positive > neutral > negativeの順序関係を学習するようにする
  • 未観測データをすべてneutral扱いにするのではなく、普通にBPR lossが減るようにpositive / negativeのデータからユーザーごとの嗜好を学習して、それで得たモデルを使ってneutral or negativeを振り分けるらしい(さらにpositive / negativeの判定精度が十分ではなかった場合は、振り分けの精度を信頼しないようにする的なことをしているっぽい)
  • positive > neutral > negativeの順序関係は、それぞれに属するアイテムの重心が正しい順序で並ぶようにランキング問題を解くことで学習するらしい
  • 最新の手法に必ずしも勝てるわけではないが、シンプルなモデルに提案手法を組み合わせることで最新手法に匹敵する性能がでることを確認(ハイパパラメータに対してロバストであり、かつ効率的とのこと)
One-class Matrix Factorization: Point-Wise Regression-Based or Pair-Wise Ranking-Based?

https://dl.acm.org/doi/10.1145/3640457.3688063

  • 国立台湾大。対象は推薦一般。評価はMovieLens, Amazon Books, Netflix
  • OCMF(One-Class Matrix Factorization。負例がなくて、正例・未観測だけの状態で、未観測の一部を負例っぽく考えて学習するMFらしい)について、提案されている手法の解析と実験。新しい手法を提案しているわけではなさそう
  • Pair-wise OCMFが提案されているが、それまでのPoint-wise OCMFと実はそれほど違いがない....というようなことを説明・実験で確認
Revisiting BPR: A Replicability Study of a Common Recommender System Baseline

https://dl.acm.org/doi/10.1145/3640457.3688073

  • ロシアHSE大。対象は推薦一般。評価はMovieLens-20M, Million Song, Netflix, Yelp
  • BPR(Bayesian Personalized Ranking...て手法があるらしい)のオープンソース実装がたくさんあるけどどれももとの論文の実装とちょっと違うのでは、良さそうなやつもGPU実行がサポートされてなかったりハイパラ探索が甘かったりでかゆいところに手が届かないから徹底的にやったるぜという話

感想

みてもな~んにもわからない 学生時代にMFの勉強は一回したはずなのに本当になにもわからなくて、当時もなにもわかってなかったんだろうなってのがよくわかった みんな使ってるデータセット似てるな~~とか、検証とか実装とかそういう雰囲気の論文もあるんだ~~とか、そのくらいしかわからんかった