Sunday, October 4, 2009

關於 user-based 和 item-based 算法的思考

半夜被地震閙醒,起床上網瞎晃,看到十一假期間xlvector兄仍然勤奮不輟思考 user-based 和 item-based 演算法對於輸出多様化的比較,大為佩服,特記錄于後:

(此刻鄙人凖備爬上床睡回龍覺)

前一段时间和wendong聊天,他提到userbased算法的结果多样性不如itembased算法。对此,我觉得有几个问题

1) 我们知道所谓多样性,是指推荐结果两两都不怎么相似,从而不同的相似度度量其实产生不同的多样性度量。

2)常用的相似度有两种,一种是基于content的,一种是基于collaborative filtering的,那么根据我的实验,在这两种相似度的度量下,userbased的结果多样性都好于itembased的算法

3)但我觉得还是存在一种相似度,而这个相似度对应的多样性在item-based的方法下比较好

不知道大家对这个问题怎么看,在实际系统中userbased和itembased谁能产生多样的结果?

via xlvector.cn

後記:
請參閱鄭昀今日的《基于Google Reader发展起来的个性化推荐系统之三大问题》,這纔是專業手筆。

Posted via web from imrchen's posterous

No comments:

Post a Comment

如果我的心是一朵蓮花

~ 林徽因 · 馬雁散文集 · 蓮燈 ~ 馬雁 在她的散文《高貴一種,有詩為證》裡,提到「十多年前,還不知道林女士的八卦及成就前,在期刊上讀到別人引用的《蓮燈》」 覺得非常喜歡,比之卞之琳、徐志摩,別說是毫不遜色,簡直是勝出一籌。前面的韻腳和平仄的處理顯然高於戴...