半夜被地震閙醒,起床上網瞎晃,看到十一假期間xlvector兄仍然勤奮不輟思考 user-based 和 item-based 演算法對於輸出多様化的比較,大為佩服,特記錄于後:
(此刻鄙人凖備爬上床睡回龍覺)
前一段时间和wendong聊天,他提到userbased算法的结果多样性不如itembased算法。对此,我觉得有几个问题
1) 我们知道所谓多样性,是指推荐结果两两都不怎么相似,从而不同的相似度度量其实产生不同的多样性度量。
2)常用的相似度有两种,一种是基于content的,一种是基于collaborative filtering的,那么根据我的实验,在这两种相似度的度量下,userbased的结果多样性都好于itembased的算法
3)但我觉得还是存在一种相似度,而这个相似度对应的多样性在item-based的方法下比较好
不知道大家对这个问题怎么看,在实际系统中userbased和itembased谁能产生多样的结果?
No comments:
Post a Comment