本节书摘来自华章计算机《Mahout算法解析与案例实战》一书中的第2章,第2.2节,作者:樊 哲,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.2 两种安装方式
关于Mahout的安装配置,这里介绍两种方式:其一,下载源码(直接下载源码或者通过svn下载源码都可以),然后使用Maven进行编译;其二,下载完整包进行解压缩。下面分别对这两种方式进行介绍。
2.2.1 使用Maven安装
使用Maven安装之前需要先安装Maven。首先到Maven官网http://maven.apache.org/download.cgi下载Maven软件,这里下载的是bin版本,解压到/home/mahout/apache-maven-3.1.0,然后设置Maven的环境变量。打开终端,输入下面的命令(编辑系统环境变量配置文件):
sudo vim /etc/profile
在其中添加:
export M2=/home/mahout/apache-maven-3.1.0
export PATH=$PATH:$M2
然后使用命令source /etc/profile更新环境变量,在终端中输入mvn –version,若出现下面的提示信息,则说明Maven安装成功。
mahout@ubuntu:~$ mvn -version
Apache Maven 3.1.0 ?(893ca28a1da9d5f51ac03827af98bb730128f9f2;2013-06-28
10:15:32+0800)
Maven home: /home/mahout/apache-maven-3.1.0
Java version: 1.7.0_25, vendor: Oracle Corporation
Java home: /home/mahout/jdk1.7.0_25/jre
Default locale: en_US, platform encoding: UTF-8
OS name: "linux", version: "3.5.0-23-generic", arch: "amd64", family: "unix"
首先介绍使用svn进行源码下载的方式。一般系统没有自带svn,可以使用下面的命令进行安装。
sudo apt-get install subversion
安装完成后,在终端中输入svn --version,若出现下面的提示信息,则说明svn安装成功。
mahout@ubuntu:~/trunk$ svn --version
svn, version 1.6.17 (r1128011)
compiled Jun 26 2013, 20:44:36
打开终端,在终端输入下面的命令即可开始下载Mahout源代码。
svn co http://svn.apache.org/repos/asf/mahout/trunk
等全部下载完成后,可以在本地的/home/mahout/trunk目录下看到下面的Mahout源代码。
mahout@ubuntu:~/trunk$ ls
bin core examples math README.txt
buildtools distribution integration NOTICE.txt src
CHANGELOG doap_Mahout.rdf LICENSE.txt pom.xml
也可以在Mahout官网直接下载src版本的源代码,下载后的文件与上面的一致(svn下载的是最新版本,而通过这种方式目前下载到的Mahout版本为0.9),这里不再另行说明。
在/home/mahout/trunk中使用以下命令(编译):
mvn –DskipTests=true clean install
进行Mahout源代码的编译,编译完成后可以看到下面的提示信息:
[INFO] ------------------------------------------------------------------------
[INFO] Reactor Summary:
[INFO]
[INFO] Mahout Build Tools ................................ SUCCESS [3:51.688s]
[INFO] Apache Mahout .................................... SUCCESS [3:08.779s]
[INFO] Mahout Math ..................................... SUCCESS [15:23.652s]
[INFO] Mahout Core ..................................... SUCCESS [8:36.341s]
[INFO] Mahout Integration ............................... SUCCESS [2:05.949s]
[INFO] Mahout Examples ................................... SUCCESS [45.097s]
[INFO] Mahout Release Package ............................. SUCCESS [0.247s]
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time: 33:57.465s
[INFO] Finished at: Sat Aug 10 18:10:59 CST 2013
[INFO] Final Memory: 45M/163M
[INFO] ------------------------------------------------------------------------
并且在对应的目录中就会生成相应的jar包。由于使用svn得到的是最新的Mahout版本,因此这里我们使用另外的一种方式,直接下载发布版的Mahout进行解压缩和安装。
2.2.2 下载发布版安装
在Mahout官网(http://mirror.bit.edu.cn/apache/mahout/)下载Mahout-0.7版本,然后解压缩和安装。打开终端,输入命令:
tar –zxvf mahout-distribution-0.7.tar.gz
即可解压发布版到/home/mahout/mahout-distribution-0.7目录中,进入该目录可以看到其下有以下文件:
mahout@ubuntu:~/mahout-distribution-0.7$ ls
bin ?docs mahout-core-0.7.jar ??mahout-math-0.7.jar
buildtools ?examples mahout-core-0.7-job.jar ??math
conf integration mahout-examples-0.7.jar NOTICE.txt
core lib mahout-examples-0.7-job.jar README.txt
distribution LICENSE.txt mahout-integration-0.7.jar
这里可以看到文件夹下面的jar包和Maven得到的jar包是一样的。