《Mahout算法解析与案例实战》一一2.2 两种安装方式

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介:

本节书摘来自华章计算机《Mahout算法解析与案例实战》一书中的第2章,第2.2节,作者:樊 哲,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2 两种安装方式

关于Mahout的安装配置,这里介绍两种方式:其一,下载源码(直接下载源码或者通过svn下载源码都可以),然后使用Maven进行编译;其二,下载完整包进行解压缩。下面分别对这两种方式进行介绍。
2.2.1 使用Maven安装
使用Maven安装之前需要先安装Maven。首先到Maven官网http://maven.apache.org/download.cgi下载Maven软件,这里下载的是bin版本,解压到/home/mahout/apache-maven-3.1.0,然后设置Maven的环境变量。打开终端,输入下面的命令(编辑系统环境变量配置文件):

sudo vim /etc/profile

在其中添加:

export M2=/home/mahout/apache-maven-3.1.0
export PATH=$PATH:$M2

然后使用命令source /etc/profile更新环境变量,在终端中输入mvn –version,若出现下面的提示信息,则说明Maven安装成功。

mahout@ubuntu:~$ mvn -version
Apache   Maven     3.1.0    ?(893ca28a1da9d5f51ac03827af98bb730128f9f2;2013-06-28
10:15:32+0800)
Maven home: /home/mahout/apache-maven-3.1.0
Java version: 1.7.0_25, vendor: Oracle Corporation
Java home: /home/mahout/jdk1.7.0_25/jre
Default locale: en_US, platform encoding: UTF-8
OS name: "linux", version: "3.5.0-23-generic", arch: "amd64", family: "unix"

首先介绍使用svn进行源码下载的方式。一般系统没有自带svn,可以使用下面的命令进行安装。
sudo apt-get install subversion
安装完成后,在终端中输入svn --version,若出现下面的提示信息,则说明svn安装成功。

mahout@ubuntu:~/trunk$ svn --version
svn, version 1.6.17 (r1128011)
   compiled Jun 26 2013, 20:44:36

打开终端,在终端输入下面的命令即可开始下载Mahout源代码。
svn co http://svn.apache.org/repos/asf/mahout/trunk
等全部下载完成后,可以在本地的/home/mahout/trunk目录下看到下面的Mahout源代码。

mahout@ubuntu:~/trunk$ ls
bin           core                examples     math        README.txt
buildtools  distribution     integration  NOTICE.txt  src
CHANGELOG          doap_Mahout.rdf    LICENSE.txt  pom.xml

也可以在Mahout官网直接下载src版本的源代码,下载后的文件与上面的一致(svn下载的是最新版本,而通过这种方式目前下载到的Mahout版本为0.9),这里不再另行说明。
在/home/mahout/trunk中使用以下命令(编译):

mvn –DskipTests=true clean install
进行Mahout源代码的编译,编译完成后可以看到下面的提示信息:
[INFO] ------------------------------------------------------------------------
[INFO] Reactor Summary:
[INFO] 
[INFO] Mahout Build Tools ................................ SUCCESS [3:51.688s]
[INFO] Apache Mahout .................................... SUCCESS [3:08.779s]
[INFO] Mahout Math ..................................... SUCCESS [15:23.652s]
[INFO] Mahout Core ..................................... SUCCESS [8:36.341s]
[INFO] Mahout Integration ............................... SUCCESS [2:05.949s]
[INFO] Mahout Examples ................................... SUCCESS [45.097s]
[INFO] Mahout Release Package ............................. SUCCESS [0.247s]
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time: 33:57.465s
[INFO] Finished at: Sat Aug 10 18:10:59 CST 2013
[INFO] Final Memory: 45M/163M
[INFO] ------------------------------------------------------------------------

并且在对应的目录中就会生成相应的jar包。由于使用svn得到的是最新的Mahout版本,因此这里我们使用另外的一种方式,直接下载发布版的Mahout进行解压缩和安装。
2.2.2 下载发布版安装
在Mahout官网(http://mirror.bit.edu.cn/apache/mahout/)下载Mahout-0.7版本,然后解压缩和安装。打开终端,输入命令:

tar –zxvf mahout-distribution-0.7.tar.gz

即可解压发布版到/home/mahout/mahout-distribution-0.7目录中,进入该目录可以看到其下有以下文件:

mahout@ubuntu:~/mahout-distribution-0.7$ ls
bin          ?docs            mahout-core-0.7.jar         ??mahout-math-0.7.jar
buildtools  ?examples        mahout-core-0.7-job.jar    ??math
conf          integration  mahout-examples-0.7.jar      NOTICE.txt
core          lib           mahout-examples-0.7-job.jar  README.txt
distribution LICENSE.txt   mahout-integration-0.7.jar

这里可以看到文件夹下面的jar包和Maven得到的jar包是一样的。

相关文章
|
6月前
|
编译器 Linux C语言
【CMake install目录解析】CMake 深度解析:实现精准、高效的项目构建与安装
【CMake install目录解析】CMake 深度解析:实现精准、高效的项目构建与安装
576 0
|
6月前
|
自然语言处理 数据可视化 数据挖掘
带你飞上云端,轻松解析数据——gopup库详细解析--包含安装库教程
本文介绍了Python库gopup,它是一个用于轻松爬取互联网数据的工具,简化了数据收集和处理的过程。文章提供了gopup的安装教程,特别强调了安装时需注意setuptools版本,并给出了PyCharm和命令行两种安装方法。gopup库能获取包括指数、百度和谷歌数据等多种类型的数据。文中还展示了如何使用gopup获取微博指数和豆瓣新片榜数据,并通过代码示例呈现数据和图表。此外,文章提醒了使用时的风险和部分接口的失效情况,并提供了库文档链接以供深入学习。gopup库适用于数据可视化和数据分析,是进行文本挖掘和自然语言处理项目的理想工具。
207 0
带你飞上云端,轻松解析数据——gopup库详细解析--包含安装库教程
|
1月前
|
SQL 安全 Windows
SQL安装程序规则错误解析与解决方案
在安装SQL Server时,用户可能会遇到安装程序规则错误的问题,这些错误通常与系统配置、权限设置、依赖项缺失或版本不兼容等因素有关
|
3月前
|
缓存 运维 Linux
深入解析:一步步掌握 CentOS 7 安装全流程及运维实战技巧
深入解析:一步步掌握 CentOS 7 安装全流程及运维实战技巧
|
3月前
|
机器学习/深度学习 算法
【Deepin 20系统】机器学习分类算法模型xgboost、lightgbm、catboost安装及使用
介绍了在Deepin 20系统上使用pip命令通过清华大学镜像源安装xgboost、lightgbm和catboost三个机器学习分类算法库的过程。
48 4
|
4月前
|
消息中间件 存储 负载均衡
zookeeper 特点、使用场景及安装,配置文件解析
zookeeper 特点、使用场景及安装,配置文件解析
71 2
|
6月前
|
IDE Linux KVM
云计算|OpenStack|社区版OpenStack安装部署文档(十二--- openstack的网络模型解析---Rocky版)
云计算|OpenStack|社区版OpenStack安装部署文档(十二--- openstack的网络模型解析---Rocky版)
135 0
|
6月前
|
安全 Linux 开发者
CentOS 7安装全解析:适合初学者的指导
CentOS 7安装全解析:适合初学者的指导
117 8
|
6月前
|
机器学习/深度学习 并行计算 编译器
MXNet安装教程:详细步骤与常见问题解析
【4月更文挑战第12天】本文详细介绍了MXNet深度学习框架的安装步骤,包括Python、conda和R用户的安装方法,以及GPU支持的选项。在安装过程中可能遇到网络问题、依赖冲突和GPU支持问题等,文中给出了相应解决策略。安装后,通过简单的代码示例验证MXNet是否正常工作,从而顺利完成本地环境搭建。
859 7
|
6月前
|
iOS开发 Python
mac:python安装路径,带你全面解析Python框架体系架构view篇
mac:python安装路径,带你全面解析Python框架体系架构view篇

推荐镜像

更多