"Latent factor models for CF"의 두 판 사이의 차이

2017년 6월 23일 (금) 15:22 판

@@ 22번째 줄: / 22번째 줄: @@
 rating matrix가 sparse할 뿐 아니라, undefined인 곳도 많으므로 [[Lanczos method]]나 [[SVD]]는 쓸 수가 없다.
+:a. 오직 알려진(known) 값만을 대상으로 loss(여기서는 squared error)를 최소화하는 user & item feature vector를 찾아야 함.
+:b. reconstruction error가 아니라 unseen data에 대한 예측만으로 성능을 평가해야 함.
+SGD이용해서 푼다. (이거 풀이 예제 볼 수 있는 곳이 있나?)
-a. 오직 알려진(known) 값만을 대상으로 loss(여기서는 squared error)를 최소화하는 user & item feature vector를 찾아야 함.
+====incorporating biases====
+문제 : 데이터는 highly biased. 예:어떤 유저는 다른이보다 점수가 후하다.
-b. reconstruction error가 아니라 unseen data에 대한 예측만으로 성능을 평가해야 함.
+해결 : explicitly model biases
+bias를 item bias, user bias모두 고려하게 만든다.$$b_{ij} = \mu + b_i + b_j $$
+rating bias can be incorporated into the prediction.
+$$ \hat{r}_{ij} = \mu + b_i + b_j + m_j^T u_i $$