《Mahout算法解析与案例实战》一一2.2 两种安装方式

简介:

本节书摘来自华章计算机《Mahout算法解析与案例实战》一书中的第2章,第2.2节,作者:樊 哲,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2 两种安装方式

关于Mahout的安装配置,这里介绍两种方式:其一,下载源码(直接下载源码或者通过svn下载源码都可以),然后使用Maven进行编译;其二,下载完整包进行解压缩。下面分别对这两种方式进行介绍。
2.2.1 使用Maven安装
使用Maven安装之前需要先安装Maven。首先到Maven官网http://maven.apache.org/download.cgi下载Maven软件,这里下载的是bin版本,解压到/home/mahout/apache-maven-3.1.0,然后设置Maven的环境变量。打开终端,输入下面的命令(编辑系统环境变量配置文件):

sudo vim /etc/profile

在其中添加:

export M2=/home/mahout/apache-maven-3.1.0
export PATH=$PATH:$M2

然后使用命令source /etc/profile更新环境变量,在终端中输入mvn –version,若出现下面的提示信息,则说明Maven安装成功。

mahout@ubuntu:~$ mvn -version
Apache   Maven     3.1.0    ?(893ca28a1da9d5f51ac03827af98bb730128f9f2;2013-06-28
10:15:32+0800)
Maven home: /home/mahout/apache-maven-3.1.0
Java version: 1.7.0_25, vendor: Oracle Corporation
Java home: /home/mahout/jdk1.7.0_25/jre
Default locale: en_US, platform encoding: UTF-8
OS name: "linux", version: "3.5.0-23-generic", arch: "amd64", family: "unix"

首先介绍使用svn进行源码下载的方式。一般系统没有自带svn,可以使用下面的命令进行安装。
sudo apt-get install subversion
安装完成后,在终端中输入svn --version,若出现下面的提示信息,则说明svn安装成功。

mahout@ubuntu:~/trunk$ svn --version
svn, version 1.6.17 (r1128011)
   compiled Jun 26 2013, 20:44:36

打开终端,在终端输入下面的命令即可开始下载Mahout源代码。
svn co http://svn.apache.org/repos/asf/mahout/trunk
等全部下载完成后,可以在本地的/home/mahout/trunk目录下看到下面的Mahout源代码。

mahout@ubuntu:~/trunk$ ls
bin           core                examples     math        README.txt
buildtools  distribution     integration  NOTICE.txt  src
CHANGELOG          doap_Mahout.rdf    LICENSE.txt  pom.xml

也可以在Mahout官网直接下载src版本的源代码,下载后的文件与上面的一致(svn下载的是最新版本,而通过这种方式目前下载到的Mahout版本为0.9),这里不再另行说明。
在/home/mahout/trunk中使用以下命令(编译):

mvn –DskipTests=true clean install
进行Mahout源代码的编译,编译完成后可以看到下面的提示信息:
[INFO] ------------------------------------------------------------------------
[INFO] Reactor Summary:
[INFO] 
[INFO] Mahout Build Tools ................................ SUCCESS [3:51.688s]
[INFO] Apache Mahout .................................... SUCCESS [3:08.779s]
[INFO] Mahout Math ..................................... SUCCESS [15:23.652s]
[INFO] Mahout Core ..................................... SUCCESS [8:36.341s]
[INFO] Mahout Integration ............................... SUCCESS [2:05.949s]
[INFO] Mahout Examples ................................... SUCCESS [45.097s]
[INFO] Mahout Release Package ............................. SUCCESS [0.247s]
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time: 33:57.465s
[INFO] Finished at: Sat Aug 10 18:10:59 CST 2013
[INFO] Final Memory: 45M/163M
[INFO] ------------------------------------------------------------------------

并且在对应的目录中就会生成相应的jar包。由于使用svn得到的是最新的Mahout版本,因此这里我们使用另外的一种方式,直接下载发布版的Mahout进行解压缩和安装。
2.2.2 下载发布版安装
在Mahout官网(http://mirror.bit.edu.cn/apache/mahout/)下载Mahout-0.7版本,然后解压缩和安装。打开终端,输入命令:

tar –zxvf mahout-distribution-0.7.tar.gz

即可解压发布版到/home/mahout/mahout-distribution-0.7目录中,进入该目录可以看到其下有以下文件:

mahout@ubuntu:~/mahout-distribution-0.7$ ls
bin          ?docs            mahout-core-0.7.jar         ??mahout-math-0.7.jar
buildtools  ?examples        mahout-core-0.7-job.jar    ??math
conf          integration  mahout-examples-0.7.jar      NOTICE.txt
core          lib           mahout-examples-0.7-job.jar  README.txt
distribution LICENSE.txt   mahout-integration-0.7.jar

这里可以看到文件夹下面的jar包和Maven得到的jar包是一样的。

相关文章
|
编译器 Linux C语言
【CMake install目录解析】CMake 深度解析:实现精准、高效的项目构建与安装
【CMake install目录解析】CMake 深度解析:实现精准、高效的项目构建与安装
1646 0
|
自然语言处理 数据可视化 数据挖掘
带你飞上云端,轻松解析数据——gopup库详细解析--包含安装库教程
本文介绍了Python库gopup,它是一个用于轻松爬取互联网数据的工具,简化了数据收集和处理的过程。文章提供了gopup的安装教程,特别强调了安装时需注意setuptools版本,并给出了PyCharm和命令行两种安装方法。gopup库能获取包括指数、百度和谷歌数据等多种类型的数据。文中还展示了如何使用gopup获取微博指数和豆瓣新片榜数据,并通过代码示例呈现数据和图表。此外,文章提醒了使用时的风险和部分接口的失效情况,并提供了库文档链接以供深入学习。gopup库适用于数据可视化和数据分析,是进行文本挖掘和自然语言处理项目的理想工具。
带你飞上云端,轻松解析数据——gopup库详细解析--包含安装库教程
|
10月前
|
监控 Shell Linux
Android调试终极指南:ADB安装+多设备连接+ANR日志抓取全流程解析,覆盖环境变量配置/多设备调试/ANR日志分析全流程,附Win/Mac/Linux三平台解决方案
ADB(Android Debug Bridge)是安卓开发中的重要工具,用于连接电脑与安卓设备,实现文件传输、应用管理、日志抓取等功能。本文介绍了 ADB 的基本概念、安装配置及常用命令。包括:1) 基本命令如 `adb version` 和 `adb devices`;2) 权限操作如 `adb root` 和 `adb shell`;3) APK 操作如安装、卸载应用;4) 文件传输如 `adb push` 和 `adb pull`;5) 日志记录如 `adb logcat`;6) 系统信息获取如屏幕截图和录屏。通过这些功能,用户可高效调试和管理安卓设备。
|
存储 SpringCloudAlibaba Java
【SpringCloud Alibaba系列】一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论
一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论。
【SpringCloud Alibaba系列】一文全面解析Zookeeper安装、常用命令、JavaAPI操作、Watch事件监听、分布式锁、集群搭建、核心理论
|
IDE Linux KVM
云计算|OpenStack|社区版OpenStack安装部署文档(十二--- openstack的网络模型解析---Rocky版)
云计算|OpenStack|社区版OpenStack安装部署文档(十二--- openstack的网络模型解析---Rocky版)
534 0
|
SQL 安全 Windows
SQL安装程序规则错误解析与解决方案
在安装SQL Server时,用户可能会遇到安装程序规则错误的问题,这些错误通常与系统配置、权限设置、依赖项缺失或版本不兼容等因素有关
1066 2
|
缓存 运维 Linux
深入解析:一步步掌握 CentOS 7 安装全流程及运维实战技巧
深入解析:一步步掌握 CentOS 7 安装全流程及运维实战技巧
|
机器学习/深度学习 算法
【Deepin 20系统】机器学习分类算法模型xgboost、lightgbm、catboost安装及使用
介绍了在Deepin 20系统上使用pip命令通过清华大学镜像源安装xgboost、lightgbm和catboost三个机器学习分类算法库的过程。
556 4
|
消息中间件 存储 负载均衡
zookeeper 特点、使用场景及安装,配置文件解析
zookeeper 特点、使用场景及安装,配置文件解析
301 2
|
安全 Linux 开发者
CentOS 7安装全解析:适合初学者的指导
CentOS 7安装全解析:适合初学者的指导
358 8

推荐镜像

更多
  • DNS