基于Mahout的新闻推荐系统 相关技术 推荐算法 基于用户的协同过滤 基于内容的推荐 基于景点的推荐 :整体框架,实现了协同过滤 ,建立VSM :分词,关键词提取 :分词,关键词 :提供API,ORM 关键实现 基于用户的协同过滤 直接调用Mahout相关接口即可 选择不同的用户相似度度量方法,这里选择了基于谷本系数,基于对数似然和基于曼哈顿距离 基于内容的推荐 对新闻文本进行分词 调用Deeplearning4j中内置paragraphvector的方法,通过doc2vec内置VSM 用Gensim会更方便点 基于景点的推荐 统计最高浏览量 过滤一定时间前的新闻保证景点的准确 评估指标 F1-Measure(精度+召回率) 算法 最近邻数量K 推荐数N F1-措施 UserCF--Tanimoto 20 11 0.481591183699049 UserCF--Log