本节书摘来自华章计算机《Mahout算法解析与案例实战》一书中的第1章,第1.3节,作者:樊 哲,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.3 Mahout应用
作为Apache基金会的顶级项目之一,Mahout的应用也极其广泛,一般分为商业应用和学术应用。
在商业应用中,Adobe AMP公司使用Mahout的聚类算法把用户区分为不同的圈子,通过精确定位营销来增加客户。Amazon的个人推荐平台也是使用Mahout的算法库来进行推荐的。AOL使用Mahout来进行购物推荐。DataMine Lab使用Mahout的推荐算法以及聚类算法来提高客户广告投放的精确度。iOffer使用Mahout频繁项集挖掘算法和协同过滤算法为用户推荐项目。Twitter使用Mahout的LDA模型为用户推荐其感兴趣的东西。Yahoo公司的邮件使用Mahout的关联规则算法。
在学术应用中,Mahout也被广泛应用。在TU Berlin大学的“Large Scale Data Analysis and Data Mining”课程中,使用Hadoop和MapReduce来进行数据并行分析的教学。在Nagoya Institute of Technology,Mahout被用来在一个研究项目中进行数据分析。
在本书中,笔者结合自身经验,设计并开发了4个简易系统,分别是Friend Find系统、Wine Identification系统、Dating Recommender系统、博客推荐系统。这些系统使用了Spring、Struts2、Hibernate三大框架,前台展示页面使用JSP、HTML、JavaScript、CSS等技术。在这些系统中详细给出了系统设计的整体框架、系统功能、系统的数据库设计,以及系统流程,最后在部分系统中还给出了笔者的部分系统实现的下载链接,供读者下载学习。