The Road Less Traveled By: 關於 user-based 和 item-based 算法的思考

Sunday, October 4, 2009

關於 user-based 和 item-based 算法的思考

半夜被地震閙醒，起床上網瞎晃，看到十一假期間xlvector兄仍然勤奮不輟思考 user-based 和 item-based 演算法對於輸出多様化的比較，大為佩服，特記錄于後：

(此刻鄙人凖備爬上床睡回龍覺)

前一段时间和wendong聊天，他提到userbased算法的结果多样性不如itembased算法。对此，我觉得有几个问题

1) 我们知道所谓多样性，是指推荐结果两两都不怎么相似，从而不同的相似度度量其实产生不同的多样性度量。

2)常用的相似度有两种，一种是基于content的，一种是基于collaborative filtering的，那么根据我的实验，在这两种相似度的度量下，userbased的结果多样性都好于itembased的算法

3)但我觉得还是存在一种相似度，而这个相似度对应的多样性在item-based的方法下比较好

不知道大家对这个问题怎么看，在实际系统中userbased和itembased谁能产生多样的结果？

Share and Enjoy:

Related posts:
my solutions of github contest – item based KNN
An improved item-based KNN predictor
Recommendation Systems: An Interview with Satnam Alag
到目前为止的进度