1 研究目标
从应用场景来看,基于内容的推荐算法更多地适用于用户根据关键字或者电影名字来搜索相应的电影,然后推荐系统来进行相应的推荐。
基于需求个性角度来看,基于内容的推荐算法还不够个人化,用户需要的是更加符合个人偏好的推荐结果,可以根据用户之前的打分情况,更有针对性地推荐一些可能喜欢的电影,这种情况下,应用最多的就是协同过滤算法。
本设计着重讨论基于协同过滤算法的电影推荐系统设计。
2 技术要求
(1) 熟悉并掌握爬虫的基本原理。研究内容包括:Scrapy 爬虫框架。
(2) 熟悉并掌握JavaWeb的各种开发工具与框架。研究内容包括:IntelliJ IDEA + Maven + Git + Linux + MySQL + MyBatis + Spring + Spring MVC + EasyUI。
(3) 熟悉并掌握Spark及机器学习库。研究内容包括:Spark 基本原理,协同过滤算法,MLlib机器学习算法库。
(4) 设计Web 软件,模拟协同过滤算法下的电影推荐。
3 研究难点
(1) 对协同过滤算法的深入学习和掌握;
(2) 通过Spark程序的设计来实现电影的实时推荐。