Latent factor models for CF
https://www.slideshare.net/sscdotopen/latent-factor-models-for-collaborative-filtering
similarity-based neighborhood method의 단점
lack of bias correction
similarity measure의 선택이 실험experimentation에 의존한다.
latent factor models
idea
rating은 item을 구성하는 factor들에 의존할 것이다. 따라서 factor를 추론해 내겠다.
approach
user와 item을 각각 latent feature space의 vector하나(latent factors, latent feature vector)로 변환한다. $$ r_{ij} \approx m_j^T u_i $$ loss는 squared error씀.
이를 위해, rating matrix를 user feature matrix와 item feature matrix로 분해한다. $$ \mathbf{R} = \mathbf{U}\mathbf{M}^T $$ \(\mathbf{U}\)의 각 행은 user를 나타내고, \(\mathbf{M}\)의 각 행은 item을 나타낸다.
rating matrix가 sparse할 뿐 아니라, undefined인 곳도 많으므로 Lanczos method나 SVD는 쓸 수가 없다.
a. 오직 알려진(known) 값만을 대상으로 loss(여기서는 squared error)를 최소화하는 user & item feature vector를 찾아야 함.
b. reconstruction error가 아니라 unseen data에 대한 예측만으로 성능을 평가해야 함.