Latent factor models for CF

https://www.slideshare.net/sscdotopen/latent-factor-models-for-collaborative-filtering

$$ \begin{equation} f(U,M) = \left( \sum c(i,j) (p_{ij} - m_j^T u_i)^2 + \lambda(\sum \|u_i\|^2 + \sum\|m_j\|^2 \right) \end{equation}\\ \text{where} \quad p_{ij} = \begin{cases} 1 \quad & r_{ij} > 0 \\ 0 & r_{ij} = 0 \end{cases},\quad c(i,j) = 1 + \alpha r_{ij} $$ $P$는 preference matrix, $c(i, j)$는 confidence function.

(1)식에서 $\|u_i\|^2 + \|m_j\|^2$는 그냥 모델링의 방편인지, 이렇게 해야만 하는 필연적인 이유가 있는건지 궁금하다. ~~어디나 다 이렇게 하니까 걍 하기는 한다만.~~ 대강 느낌(?)상으로는 추상성을 획득하기 위해서(=overfitting을 막기 위해서) 지나치게 희한한(?) 해가 나오지 않도록 강제하는 듯 보임.

reference에 이거 있는데 시간나면.... 그러니까 결국 영원히 안읽겠지. 넷플릭스 대회 3위한 사람이 쓴건가보다.

읽었네. 왠일로.

글 세개가 연재이고 링크가 세번째^[1]다. 첫번째^[2], 두번째^[3]는 걍 잡담임.

이 글에서 자신의 알고리즘을 공개하고 있다.

(cont.)

↑ http://sifter.org/~simon/journal/20061211.html Monday, December 11, 2006
↑ http://sifter.org/~simon/journal/20061027.2.html Friday, October 27, 2006
↑ http://sifter.org/~simon/journal/20061102.1.html Thursday, November 02, 2006

blog comments powered by Disqus

[1] ttp://sifter.org/~simon/journal/20061211.html Monday, December 11, 2006

[2] ttp://sifter.org/~simon/journal/20061027.2.html Friday, October 27, 2006

[3] ttp://sifter.org/~simon/journal/20061102.1.html Thursday, November 02, 2006

[1]

[2]

[3]

둘러보기 메뉴

Latent factor models for CF

목차

similarity-based neighborhood method의 단점

latent factor models

idea

approach

incorporating biases

implicit feedback data is very different from explicit data

읽었네. 왠일로.