"Latent factor models for CF"의 두 판 사이의 차이

ph
이동: 둘러보기, 검색
잔글
22번째 줄: 22번째 줄:
  
 
rating matrix가 sparse할 뿐 아니라, undefined인 곳도 많으므로 [[Lanczos method]]나 [[SVD]]는 쓸 수가 없다.
 
rating matrix가 sparse할 뿐 아니라, undefined인 곳도 많으므로 [[Lanczos method]]나 [[SVD]]는 쓸 수가 없다.
 +
:a. 오직 알려진(known) 값만을 대상으로 loss(여기서는 squared error)를 최소화하는 user & item feature vector를 찾아야 함.
 +
:b. reconstruction error가 아니라 unseen data에 대한 예측만으로 성능을 평가해야 함.
 +
SGD이용해서 푼다. (이거 풀이 예제 볼 수 있는 곳이 있나?)
  
a. 오직 알려진(known) 값만을 대상으로 loss(여기서는 squared error)를 최소화하는 user & item feature vector를 찾아야 함.
+
====incorporating biases====
 +
문제 : 데이터는 highly biased. 예:어떤 유저는 다른이보다 점수가 후하다.
  
b. reconstruction error가 아니라 unseen data에 대한 예측만으로 성능을 평가해야 함.
+
해결 : explicitly model biases
 +
 
 +
bias를 item bias, user bias모두 고려하게 만든다.$$b_{ij} = \mu + b_i + b_j $$
 +
 
 +
rating bias can be incorporated into the prediction.
 +
$$ \hat{r}_{ij} = \mu + b_i + b_j + m_j^T u_i $$

2017년 6월 23일 (금) 15:22 판

https://www.slideshare.net/sscdotopen/latent-factor-models-for-collaborative-filtering

similarity-based neighborhood method의 단점

lack of bias correction

similarity measure의 선택이 실험experimentation에 의존한다.


latent factor models

idea

rating은 item을 구성하는 factor들에 의존할 것이다. 따라서 factor를 추론해 내겠다.

approach

user와 item을 각각 latent feature space의 vector하나(latent factors, latent feature vector)로 변환한다. $$ r_{ij} \approx m_j^T u_i $$ loss는 squared error씀.

이를 위해, rating matrix를 user feature matrix와 item feature matrix로 분해한다. $$ \mathbf{R} = \mathbf{U}\mathbf{M}^T $$ \(\mathbf{U}\)의 각 행은 user를 나타내고, \(\mathbf{M}\)의 각 행은 item을 나타낸다.

rating matrix가 sparse할 뿐 아니라, undefined인 곳도 많으므로 Lanczos methodSVD는 쓸 수가 없다.

a. 오직 알려진(known) 값만을 대상으로 loss(여기서는 squared error)를 최소화하는 user & item feature vector를 찾아야 함.
b. reconstruction error가 아니라 unseen data에 대한 예측만으로 성능을 평가해야 함.

SGD이용해서 푼다. (이거 풀이 예제 볼 수 있는 곳이 있나?)

incorporating biases

문제 : 데이터는 highly biased. 예:어떤 유저는 다른이보다 점수가 후하다.

해결 : explicitly model biases

bias를 item bias, user bias모두 고려하게 만든다.$$b_{ij} = \mu + b_i + b_j $$

rating bias can be incorporated into the prediction. $$ \hat{r}_{ij} = \mu + b_i + b_j + m_j^T u_i $$