關於 user-based 和 item-based 算法的思考

半夜被地震閙醒,起床上網瞎晃,看到十一假期間xlvector兄仍然勤奮不輟思考 user-based 和 item-based 演算法對於輸出多様化的比較,大為佩服,特記錄于後:

(此刻鄙人凖備爬上床睡回龍覺)

前一段时间和wendong聊天,他提到userbased算法的结果多样性不如itembased算法。对此,我觉得有几个问题

1) 我们知道所谓多样性,是指推荐结果两两都不怎么相似,从而不同的相似度度量其实产生不同的多样性度量。

2)常用的相似度有两种,一种是基于content的,一种是基于collaborative filtering的,那么根据我的实验,在这两种相似度的度量下,userbased的结果多样性都好于itembased的算法

3)但我觉得还是存在一种相似度,而这个相似度对应的多样性在item-based的方法下比较好

不知道大家对这个问题怎么看,在实际系统中userbased和itembased谁能产生多样的结果?

via xlvector.cn

後記:
請參閱鄭昀今日的《基于Google Reader发展起来的个性化推荐系统之三大问题》,這纔是專業手筆。

Posted via web from imrchen's posterous

Comments

Popular posts from this blog

如何評估推薦系統(一)

備忘:在 Mac OS 環境安裝 Python 開發工具

[詩戀] 鄭愁予/定